OmniGen是一款由智源研究院推出的全新图像生成模型,采用扩散模型架构,专注于统一图像生成任务。它能够在一个单一框架内处理多种图像生成任务,包括文本到图像生成、图像编辑、主题驱动生成和视觉条件生成等。
Recraft 是一款强大的 AI 设计工具,专为专业设计师、营销人员和企业家设计,旨在生成和编辑矢量艺术、图标、3D 图像和插图。
Stable Diffusion 3.5是Stability AI最新发布的AI图像生成模型,相较于前代产品SD3,它在图像生成的逼真度、提示响应和文本渲染方面都有显著提升。
EZIGen是一种增强零样本主题驱动图像生成的技术。它可以从提供的主体图像中提取出重要特征,就像是给图像做一个“身份识别”,确保生成的新图像能够保留主体的独特特征。
CharacterFactory是一个由大连理工大学的研究团队开发的创新技术框架,主要用于创建具有一致身份特征的新角色。
ControlNeXt是一个高效、灵活且易于使用的可控生成框架,旨在实现图像和视频的多样化控制。该框架由中国香港中文大学和商汤科技联合开发,适用于广泛的图像和视频生成任务,特别适合需要精细控制生成内容的应用场景。
什么是CanvaAICanvaAI是Canva平台推出的一系列基于人工智能的设计工具,旨在帮助用户更轻松[…]
InfEdit是一款革命性的AI图像编辑工具,它利用自然语言处理技术实现无反转图像编辑。用户只需通过输入简单的文字指令,就能轻松完成复杂的图像编辑任务,无需进行繁琐的手动操作。
CSGO是由 InstantX 团队、南京理工大学、北京航空航天大学以及北京大学联合提出的一种基于端到端训练的图像风格转移模型。
PreciseControl是一种用于增强文本到图像(Text-to-Image, T2I)生成模型的方法,它通过细粒度控制面部属性来实现更精确的图像生成。
StyleGAN是一种先进的生成对抗网络(GAN)其核心思想是通过风格化的方式控制生成图像的属性,从而实现对图像细节的精细调整和控制。
HivisionIDPhotos是一款轻量级且高效的AI证件照制作工具,旨在为用户提供便捷的证件照生成方案。
FAI Fuzer是一款基于AI技术的图像编辑工具,它通过先进的控制网络技术实现对图像的精确编辑和控制,如背景生成、风格转换、细节增强、图像修复等。
AnyControl AI是一个由上海人工智能实验室和哈尔滨工业大学(深圳)联合推出的可控图像生成框架.
Artist AI是一种利用生成式人工智能算法来创作艺术作品的工具。它能够通过输入文本提示或图像,生成具有特定风格或主题的艺术作品。
FLUX.1是由Stable Diffusion创始团队推出的开源AI图像生成模型,由Black Forest Labs组织开发。该模型以其尖端的输出质量和竞争性的提示跟随能力而著称,并且在人手、文字、光影和细节上表现非常出色。
什么是Glyph-ByT5-v2Glyph-ByT5-v2是由微软、清华大学和北京大学共同推出的一款多语言[…]
什么是Stable-HairStable-Hair是一个基于扩散技术的发型移植框架,由上交联合Tiamat发[…]
Magic Insert是Google研究人员开发的一种新型图像编辑技术,旨在通过风格感知的拖放操作将图像中的主题(如人物或物体)无缝地融入到新的背景中。
StyleDrop是谷歌研究团队开发的一款创新的文本到图像生成工具,旨在通过深度学习技术实现对图像风格的精确控制和转换。该工具的核心是Muse,一个基于Transformer的视觉变换器模型。
UltraEdit AI 是一个大规模的自动生成指令图像编辑数据集,包含约400万的编辑样本。
PaintsUndo是一款专注于数字绘画行为的AI模型,旨在模拟和重现绘画过程中的笔触和步骤。它通过分析输入的静态图像,提取出绘画的草图,并能根据需求进行风格转换和插值处理,以生成多样化的绘画输出。
UltraPixel AI是一款革命性的图像生成模型,能够直接生成从1K到6K分辨率的高保真图片,细节精细到毛孔与纤毫。
Invoke AI 是一个创新的生成式人工智能平台,旨在帮助专业人士、艺术家和爱好者使用最新的人工智能技术生成和创建视觉媒体。它提供了一个行业领先的Web界面和交互式的命令行界面,支持多种商业产品。
什么是MS-Diffusion文本到图像生成模型的最新进展极大地增强了从文本提示生成照片级逼真图像的能力,从[…]
DiffSynth Studio是一款创新的扩散引擎,专为图像和视频合成爱好者设计。用户可以进行AI绘图、长视频合成、图像合成、卡通着色和视频风格化等多种操作。
Vitron由昆仑万维2050全球研究院、新加坡国立大学和新加坡南洋理工大学团队联合发布并开源的通用像素级视觉多模态大语言模型。
Glyph-ByT5-v2 模型是一种基于扩散模型的多语言视觉文本渲染模型,它可以将文本描述转换为具有视觉吸引力的图形设计图像。
MimicBrush是一款由阿里巴巴、中国香港大学和蚂蚁集团共同开发的创新AI图像编辑工具。它通过模仿编辑(imitative editing)技术,允许用户在没有原始目标图像的情况下进行图像编辑,只需提供一张参考图像即可实现风格转换和局部区域编辑。
可图(Kolors)快手自研的AI图像生成模型,提供了20多种创新AI图像玩法。该产品支持两类主要功能:文生图和图生图。