迪士尼旧版米老鼠版权过期,AI开发者推出基于Stable-Diffusion-xl的Mickey-1928SD模型,用于生成符合1928年设计风格的米老鼠、米妮和皮特的图像。
但这几年,开始有了希望的苗头。
传统的基于扩散的声音转换模型通常需要多个迭代步骤来逐渐生成目标音频,这个过程可能既复杂又耗时。然而,CoMoSVC通过创新的模型设计和算法优化,实现了快速且高效的一步采样,大大减少了转换所需的时间,同时保持了音频质量。
该方法利用专有的大型语言模型在约100种语言的文本嵌入任务中生成了各种合成数据。与复杂的预训练阶段不同,该方法使用基本的对比损失函数,将开源的仅解码的大型语言模型在生成的合成数据上进行微调。
在实验中,Paint3D通过一系列的量化和定性实验证明了其在生成多样化纹理贴图方面的显著能力。通过评估FID得分和用户调研,实验结果显示Paint3D在纹理生成质量和符合输入条件方面都优于当前最佳的纹理生成算法。不仅如此,Paint3D还展示了多种输入条件引导的纹理贴图生成,包括文字描述和示例图像引导下的纹理生成。