HART模型(Hybrid Autoregressive Transformer)是由麻省理工学院、英伟达和清华大学的联合研究团队开发的一种先进的自回归视觉生成模型。
OmniGen是一款由智源研究院推出的全新图像生成模型,采用扩散模型架构,专注于统一图像生成任务。它能够在一个单一框架内处理多种图像生成任务,包括文本到图像生成、图像编辑、主题驱动生成和视觉条件生成等。
Recraft 是一款强大的 AI 设计工具,专为专业设计师、营销人员和企业家设计,旨在生成和编辑矢量艺术、图标、3D 图像和插图。
Stable Diffusion 3.5是Stability AI最新发布的AI图像生成模型,相较于前代产品SD3,它在图像生成的逼真度、提示响应和文本渲染方面都有显著提升。
CharacterFactory是一个由大连理工大学的研究团队开发的创新技术框架,主要用于创建具有一致身份特征的新角色。
PoseDiffusion是一种新颖的相机姿态估计方法,该方法旨在通过自然语言生成多样且结构稳定的2D人类姿势骨架。PoseDiffusion结合了深度学习和几何约束,通过引入扩散模型来提高姿态估计的准确性和泛化能力。
什么是CanvaAICanvaAI是Canva平台推出的一系列基于人工智能的设计工具,旨在帮助用户更轻松[…]
InfEdit是一款革命性的AI图像编辑工具,它利用自然语言处理技术实现无反转图像编辑。用户只需通过输入简单的文字指令,就能轻松完成复杂的图像编辑任务,无需进行繁琐的手动操作。
Napkin AI是一款先进的文本到视觉内容的AI工具,它能够将复杂的文本信息转化为直观的图表、图解和图像,从而帮助用户更有效地传达信息和想法。
Step-1X是阶跃星辰推出的一款AI图像生成大模型,可以灵活应对广告创意、游戏美术、影视制作、产品设计和教育辅助等多种场景下的创作需求
PreciseControl是一种用于增强文本到图像(Text-to-Image, T2I)生成模型的方法,它通过细粒度控制面部属性来实现更精确的图像生成。
StyleGAN是一种先进的生成对抗网络(GAN)其核心思想是通过风格化的方式控制生成图像的属性,从而实现对图像细节的精细调整和控制。
AnyControl AI是一个由上海人工智能实验室和哈尔滨工业大学(深圳)联合推出的可控图像生成框架.
Artist AI是一种利用生成式人工智能算法来创作艺术作品的工具。它能够通过输入文本提示或图像,生成具有特定风格或主题的艺术作品。
DistriFusion是一种新颖的并行计算方法,旨在通过分布式并行推理加速高分辨率扩散模型的图像生成。
FLUX.1是由Stable Diffusion创始团队推出的开源AI图像生成模型,由Black Forest Labs组织开发。该模型以其尖端的输出质量和竞争性的提示跟随能力而著称,并且在人手、文字、光影和细节上表现非常出色。
什么是Glyph-ByT5-v2Glyph-ByT5-v2是由微软、清华大学和北京大学共同推出的一款多语言[…]
Stable Diffusion XL(SDXL)是Stability AI公司推出的一款最新图像生成模型,旨在提供更高质量和更逼真的图像输出。
StyleDrop是谷歌研究团队开发的一款创新的文本到图像生成工具,旨在通过深度学习技术实现对图像风格的精确控制和转换。该工具的核心是Muse,一个基于Transformer的视觉变换器模型。
AuraFlow AI 是一个开源的大型基于流的文本到图像生成模型。
Poetry2Image是一个针对中文古典诗歌生成图像的迭代校正框架。该框架旨在解决文本到图像生成模型在处理中文古典诗歌时常见的关键元素丢失或语义混淆问题。
UltraEdit AI 是一个大规模的自动生成指令图像编辑数据集,包含约400万的编辑样本。
UltraPixel AI是一款革命性的图像生成模型,能够直接生成从1K到6K分辨率的高保真图片,细节精细到毛孔与纤毫。
Invoke AI 是一个创新的生成式人工智能平台,旨在帮助专业人士、艺术家和爱好者使用最新的人工智能技术生成和创建视觉媒体。它提供了一个行业领先的Web界面和交互式的命令行界面,支持多种商业产品。
什么是MS-Diffusion文本到图像生成模型的最新进展极大地增强了从文本提示生成照片级逼真图像的能力,从[…]
Stable Hamster 是一种基于人工智能的图像生成工具,主要用于生成高质量的图像。
AutoStudio是一个基于文本到图像(Text-to-Image, T2I)生成模型的多轮交互式图像生成框架,主要用于生成漫画内容。
DiffSynth Studio是一款创新的扩散引擎,专为图像和视频合成爱好者设计。用户可以进行AI绘图、长视频合成、图像合成、卡通着色和视频风格化等多种操作。
Vitron由昆仑万维2050全球研究院、新加坡国立大学和新加坡南洋理工大学团队联合发布并开源的通用像素级视觉多模态大语言模型。
PMG(Personalized Multimodal Generation)AI是由华为与清华大学联合开发的一项个性化多模态生成技术。该技术利用用户的历史行为和偏好,生成符合用户个性化需求的多模态内容,如表情包、T恤设计图、电影海报等。