(相关资料图)
近日,社交媒体公司 Snap 旗下的 Snap Research 部门宣布,他们研发出了一种新的技术,可以让 AI 生成图像的速度大幅提升,从原来的几分钟甚至几小时缩短到不到两秒。
这种新的技术被称为 SnapFusion,它可以根据用户输入的文字提示,快速生成清晰的图像。Snap 公司表示,这是目前学术界公布的最快的速度。该公司在博客文章中介绍了这项技术的原理和优势:
Snap Research 通过优化网络结构和去噪过程,使得模型非常高效,同时保持了图像质量。因此,现在可以运行模型来根据文字提示生成图像,并在移动设备上几秒钟内得到结果,而不是像其他研究那样需要等待很长时间。
Snap Research 还发布了一篇论文(PDF 格式),详细介绍了 SnapFusion 技术,并展示了一些由该技术生成的艺术作品。论文中指出:
具体来说,我们提出了一个高效的 UNet,通过识别原始模型的冗余,并通过数据蒸馏减少图像解码器的计算。此外,我们通过探索训练策略和引入无分类器指导的正则化,增强了步骤蒸馏。
不过,这项新技术还需要一段时间才能面向广大用户开放。但是 Snap 公司表示,它“有潜力在未来为移动设备上的高质量 AI 生成图像体验提供强大的动力”。IT之家猜测,这项新技术很可能会添加到 Snapchat 移动应用程序的未来更新中。