SEED-Story - 是一种多模态长故事生成模型

AI文本工具 AI写作工具 AI文本工具

SEED-Story

SEED-Story是一种多模态长故事生成模型，能够根据用户提供的图像和文本生成丰富且连贯的叙事内容，并配以一致性的图像。

标签：AI小说生成 AI故事生成 SEED-Story

链接直达手机查看

什么是SEED-Story

SEED-Story是一种多模态长故事生成模型，能够根据用户提供的图像和文本生成丰富且连贯的叙事内容，并配以一致性的图像。该模型利用大型语言模型（MLLM）的强大理解能力，预测文本令牌和视觉令牌，随后通过适配的视觉去令牌化器处理这些令牌，以产生具有连贯角色和风格的一致性图像。

SEED-Story相关链接

论文地址：https://arxiv.org/pdf/2407.08683

项目地址：https://github.com/TencentARC/SEED-Story

SEED-Story的功能特点包括：

多模态生成：结合了图像和文本输入，能够生成包含丰富叙述文本和一致图像的故事。
一致性与连贯性：生成的图像与文本在角色和风格上保持一致，确保故事的连贯性和视觉吸引力。
强大的理解能力：基于MLLM的强大理解能力，能够从少量初始信息中创造出复杂且详细的故事内容。
多样化的应用：适用于多种场景，如儿童故事书、广告创意等，提供了一个强大的AI工具来辅助长篇故事创作。

SEED-Story通过其多模态长篇故事生成能力，为用户提供了一个创新且高效的解决方案，用于创建视觉和文本都具有一致性的长篇故事。