DALL-E是OpenAI开发的一款图像生成模型,它通过使用文本-图像对的数据集来进行训练,该模型可以根据用户提供的文本描述自动生成对应的图像。它具有多种能力,比如创造动物和物体的……
DALL-E是OpenAI开发的一款图像生成模型,它通过使用文本-图像对的数据集来进行训练,该模型可以根据用户提供的文本描述自动生成对应的图像。它具有多种能力,比如创造动物和物体的拟人化版本,以合理的方式组合互不相关的概念,渲染文本,并对现有图像进行转换。
Github:https://github.com/openai/DALL-E
StableIdentity是一个创新的图像与视频定制化生成工具。并提供了一种独特的方法,可以将任何人无缝地插入到任意场景中,无论是现实世界还是艺术作品,旨在通过优化学习身份,结合包含动作、背景、风格的文本提示,实现图像定制生成。
InfEdit是一款革命性的AI图像编辑工具,它利用自然语言处理技术实现无反转图像编辑。用户只需通过输入简单的文字指令,就能轻松完成复杂的图像编辑任务,无需进行繁琐的手动操作。
FLUX.1是由Stable Diffusion创始团队推出的开源AI图像生成模型,由Black Forest Labs组织开发。该模型以其尖端的输出质量和竞争性的提示跟随能力而著称,并且在人手、文字、光影和细节上表现非常出色。
HunYuan-3D是腾讯推出的一款创新的3D生成模型,名为Hunyuan3D-1.0。该模型首次支持从文本和图像条件生成高质量的三维资产,属于开源大模型,旨在解决传统3D生成过程中的速度和质量问题。
Stable Diffusion 3 Medium(以下简称SD3 Medium) 是Stability AI开发的一个具有20亿参数的文本到图像模型,它在消费级PC、笔记本电脑和企业级GPU上都能运行得游刃有余。这个模型以其卓越的图像质量、逼真度和灵活的风格输出,以及对复杂提示的深入理解能力,成为了图像生成领域的新宠。
IDM-VTON是一种基于扩散模型的虚拟试穿技术,由韩国科学技术院(KAIST)和OMNIOUS.AI公司的研究人员共同开发。它能够通过分析人物和服装的图像,生成高度逼真的试穿效果。