MIT和Google研究StableRep新技术:使用合成图像训练AI图像模型

2023-11-28 12:01:55 站长之家网络整理3

生活网 11月28日消息:MIT和Google的研究人员近期开发了一项名为StableRep的新技术，旨在利用由AI生成的图像来训练更加详细和高效的AI图像模型。这项技术被应用于开源文本到图像模型Stable Diffusion，取得了一系列显著的成就。

StableRep采用了一种被称为“多正对比学习方法”的独特方式。在这种方法中，从相同文本提示生成的多个图像被视为彼此的正对比，从而增强了学习过程。例如，对于一个风景的文本提示，模型会将生成的几个风景变化与所有与该风景相关的描述进行交叉引用，以识别基于这些图像的细微差别，并将其应用于最终输出，从而创造出高度详细的图像。

研究人员表示，他们的方法在将多个图像视为同一底层事物的表达方面更为出色，而不仅仅是将它们视为像素的集合。实验证明，StableRep在ImageNet分类上取得了76.7%的线性准确度，使用Vision Transformer模型。此外，通过添加语言监督，研究人员发现，StableRep在2000万合成图像上的训练结果超越了使用5000万真实图像训练的CLIP模型。

然而，StableRep并非没有缺陷。其生成图像的速度较慢，同时在文本提示和生成图像之间存在语义不匹配的问题。此外，StableRep的底层模型Stable Diffusion需要在真实数据上进行初始训练，因此使用StableRep生成图像将需要更长时间且成本可能更高。

StableRep已经在GitHub上开源，并可用于商业用途。它采用Apache2.0许可证，用户可以使用并生成衍生作品，但需要在重新分发的作品或衍生作品中提供Apache许可证的副本，并包含对更改的通知。许可证还包括对贡献者不对使用许可作品引起的任何损害负责的责任限制。

MIT和Google的这一研究成果代表着AI图像生成领域的一次创新，尽管存在一些缺陷，但其对于高质量图像的生成提供了新的方法和思路。

--结束END--

举报投诉请发送至: 邮箱/1585958358@qq.com QQ/

本文标题: MIT和Google研究StableRep新技术:使用合成图像训练AI图像模型

更多>最新的资讯

• 通信能力大提升！iQOO Z9 Turbo 支持四频北斗、	• 美国IT业今年已裁员13.7万人！投100份简历仅两
• 超帅！《黑神话：悟空》猪八戒人形脸模演员：我	• 淘宝首家销量破亿女装店关闭！创始人：顺应市场
• Unity 6引擎定档10月17日！影视级demo《Time Gh	• 男子花46万竟买到二手水淹车法院：退一赔三！
• 《黑神话：悟空》嫦娥私会男子身份成谜！美术总	• iPhone 16使用钢壳电池陷“爆炸”阴谋论！苹果
• 华为Mate XT三折叠最新黄牛价格曝光：能买6.5台	• 12306回应台风天退票收退票费：不符合24小时内

《黑神话：悟空》嫦娥	595元！Redmi Note 14
2024 vivo开发者大会	遭20人拦门要烟接亲