Omost -简化了提示词的编写的AI问生图工具，

AI图片工具 AI图片工具 AI文生图

Omost

Omost属于一种Prompt Agent，可以对用户输入的prompt进行增强，同时可以控制图像生成的layout。不仅简化了提示词的编写，还提高了图像生成的精确度和灵活性，再也不用为写提示词头……

链接直达手机查看

什么是Omost

Omost属于一种Prompt Agent，可以对用户输入的prompt进行增强，同时可以控制图像生成的layout。不仅简化了提示词的编写，还提高了图像生成的精确度和灵活性，再也不用为写提示词头疼了.

试玩地址:https://huggingface.co/spaces/lllyasviel/Omost

自动扩展提示词:Omost能够将简单的提示词拆解成详细的描述，从图像整体到局部元素的位置和大小均能详细说明。例如输入“a funny cartoon batman fights joker”，系统会生成蝙蝠侠与小丑战斗的完整图像。

高灵活性:生成的图像布局可以保留，用户可以通过简单的提示词对图像中的某个元素进行修改。比如，将龙变成恐龙，系统会根据新提示生成修改后的图像。

图像位置编码:Omost通过将图像划分为729个不同的位置来简化图像元素的描述。每个位置包括预定义的参数，如位置、偏移量和区域，确保图像生成的准确性和细致度。

子提示系统:所有Omost LLM都经过训练，可以提供严格定义的“子提示”，这些子提示可以独立描述事物，并任意组合形成完整的提示。这种设计提高了提示词的灵活性和准确性。

注意力操纵:Omost使用注意力分数调整技术来控制图像生成过程中的区域关注度，实现更精细的图像生成。通过调整注意力分数，Omost能够生成符合提示词描述的图像元素。

提示前缀树:Omost引入提示前缀树技术，通过合并子提示来改进提示理解和描述。例如，可以将路径“a cat and a dog. the cat on the sofa”作为提示，从而生成相应图像。

Omost项目基于Llama3和Phi3变体模型，用户可以通过提供简单的提示词来生成复杂的图像。以下是该项目的几个关键组件:

位置和偏移量:将图像划分为9个位置，每个位置进一步划分为81个偏移量，共有729个边界框，用于描述图像元素的位置。

distance_to_viewer和HTML_web_color_name:用于调整图像元素的视觉表现，通过组合这些参数可以生成粗略的图像构图。

注意力操纵:基于注意力分数操作的baseline渲染器，通过调整注意力分数来控制不同区域的模型关注度。

Omost技术的推出，不仅简化了提示词的编写，还提高了图像生成的精确度和灵活性。其应用场景包括但不限于AI绘画、图像设计、广告创意、教育等领域。用户可以通过简单的提示词生成复杂的图像，为创意设计提供了强大的工具支持。

Meshy AI是一个基于人工智能技术的3D内容生成工具，旨在加速3D设计和创作过程。它通过将文本或图像转换为高质量的3D模型和纹理，为用户提供了一个高效、便捷的解决方案。

WonderWorld系统以其颠覆性技术，从单张图片快速生成沉浸式的3D虚拟世界。这一系统不仅突破了传统3D建模的时间和空间限制，更在速度与质量上实现了双重飞跃。

Claude 3是Anthropic公司发布的新一代AI大模型系列，Claude 3系列模型能够处理包括照片、图表、图形和技术图纸在内的各种视觉文件，支持图片输入及对图片的各种处理任务

文心一格是百度出品的AI绘画网站，生成的AI作品效果还是非常惊艳的，而且输入一段文字它能够生成出4张不同风格的AI图片，包括动漫、人物、机械、风景、3D等风格的图片都能生成。

AddressCLIP是一种基于CLIP技术构建的街景定位大模型，由中科院自动化所和阿里云联合开发。该模型能够通过一张照片实现街道级精度的定位，无需依赖复杂的GPS系统。

ComfyUI-LayerDiffusion 是 Layer Diffusion 的一个自定义实现，专门用于生成和处理前景、背景图像及其混合效果，目前只支持SDXL模型。