Vimeo25M是一个全面且多样化的视频数据集,包含2500万个文本-视频对
Vimeo25M是一个全面且多样化的视频数据集,包含2500万个文本-视频对。Vimeo25M数据集由上海人工智能实验室开源,这个数据集的目的是为了提高LaVie模型的性能,并且已经被广泛应用于LaVie模型的训练中,以实现高质量的文本到视频(T2V)生成。确保模型能够处理各种事件和内容类型。Vimeo25M特别重视质量、多样性和美学吸引力,这些特点使其在视频生成任务中表现出色。
该数据集不仅支持长篇视频生成,还适用于个性化视频合成等多种应用场景
LobeChat 是一个开源的、可扩展的高性能聊天机器人框架。它支持一键免费部署私人 ChatGPT/LLM 网页应用程序。经过精心设计的界面,具有优雅的外观和流畅的交互效果,支持亮暗色主题,适配移动端。支持 PWA,提供更加接近原生应用的体验,会话支持插件扩展,用户可以安装和使用各种插件,例如搜索引擎、网页提取等,同时也支持自定义插件的开发,满足自定义需求。
LibGen数据集(LibraryGenesis数据集)是一个由俄罗斯科学家于2008年创建的数字图书馆,[…]
LAION-5B是一个大规模的多模态数据集,用于研究目的,包含约58.5亿个图像-文本对。这些数据对是通过CLIP模型过滤的,其中23亿对包含英语文本,22亿对来自超过100种其他语言,其余12.7亿对则包含无法明确归类于某一语言的文本。
xGen-MM是Salesforce推出的一款开源多模态AI模型,该模型具有处理交错数据的能力,能够同时理解和生成文本、图像等多种数据类型,
千言数据集不仅提供了一站式的数据集浏览、整理、下载和评测的科研体验,还通过收集和整理不同类型的中文开源数据集,为自然语言处理技术的研究和发展提供了重要的数据支持。
Tiledesk Design Studio 是 Tiledesk 提供的一个开源、无代码开发平台,用于创建聊天机器人和对话应用。该平台提供了一个用户友好的拖放界面,预设了动作和集成,结合了 LLM/GPT AI 的强大功能和灵活的“图形”方法,以轻松创建对话和自动化。