Stable Diffusion 3.5是Stability AI最新发布的AI图像生成模型,相较于前代产品SD3,它在图像生成的逼真度、提示响应和文本渲染方面都有显著提升。
LightRAG是由中国香港大学研究团队推出的一种检索增强生成(Retrieval-Augmented Generation, RAG)系统,旨在提升大型语言模型(LLM)的准确性和上下文相关性。该系统通过图结构集成和双层知识检索,优化了信息检索的全面性和效率。
Spoken2Sign是一种将口语语言翻译成手语语言的功能系统。
MemFree是一款开源的混合AI搜索引擎,通过整合多种AI模型和搜索引擎,提供高效、多样化的搜索体验。
Flash-VStream是一种基于记忆机制的视频-语言模型,旨在实时处理和理解长视频流,并能够同时响应用户查询。
Mistral Large 2是法国人工智能初创公司Mistral AI最新发布的大型语言模型,具有1230亿参数和128K的上下文窗口。该模型在代码生成、数学和推理方面表现出色,并且支持多种编程语言和多语言处理能力。
Mem0是一个为大型语言模型(LLM)设计的智能记忆层,它通过保留用户、会话和AI代理的信息,确保了交互的连续性和上下文。这种多层次的记忆机制不仅提高了用户体验,还使得AI能够更加智能地响应用户需求。
Samba是一个开源的语言模型项目,其全称为“Simple Hybrid State Space Models for Efficient Unlimited Context Language Modeling”。它通过一种创新的混合架构,实现了对无限长度上下文的有效建模。
X-LLM是中国科学院自动化研究所和中国科学院大学联合推出一种先进的大型语言模型,通过引入多模态数据和自监督学习来提升其理解和生成自然语言的能力。
FinGPT是一个开源的金融领域大型语言模型,旨在提供一个适用于金融数据的训练和微调平台。它通过最新的调整方法如LoRA增强模型的适应性和准确性,支持多任务处理,如情感分析和市场数据分析。
RAGFlow是一个基于深度文档理解的开源RAG引擎。它通过集成大型语言模型(LLMs),实现了对复杂格式数据的深度理解和智能问答。
AnythingLLM 是一个全栈应用程序,您可以使用现成的商业大语言模型或流行的开源大语言模型,再结合向量数据库解决方案构建一个私有 ChatGPT
PaliGemma是谷歌推出的一款开源视觉语言模型,该模型结合了图像处理和语言理解的能力,旨在支持多种视觉语言任务,如图像和短视频字幕生成、视觉问答、图像文本理解、物体检测、文件图表解读以及图像分割等。
MedicalGPT 是一个基于ChatGPT训练流程的医疗行业语言模型项目,主要包括增量预训练、有监督微调和强化学习。项目旨在通过不同的训练阶段,优化模型以更好地适应医疗数据,提高问答和文本生成的准确性和质量。
Perplexica是一个开源的AI驱动搜索引擎,它不仅能够深入互联网寻找答案,而且能够理解用户的查询。
Llama 3 是 Meta 发布的最新大型语言模型,旨在让个人、创作者、研究人员和各种规模的企业能够负责任地试验、创新和扩展他们的想法。
FreeAskInternet 是一款集免费、本地、隐私、强大搜索和智能问答于一身的AI实用工具。
PrivateGPT简介PrivateGPT是一个已完成的AI项目,允许用户在没有互联网连接的情况下,使用大[…]
Grok-1 是由马斯克旗下的人工智能初创公司 xAI 开发的一款大型语言模型,是一个混合专家(MoE)模型,拥有 3140 亿参数,使其成为目前参数量最大的开源大语言模型。
Gemma是由Google DeepMind和Google其他团队合作开发的一系列轻量级且先进的开放模型。这些模型采用了与创建Gemini模型相同的研究和技术,旨在支持开发者和研究人员负责任地构建AI。
LLaMA-Factory是一个易于使用的大型语言模型(LLM)微调框架。它支持多种开源的大型语言模型,如 LLaMA、ChatGLM、Falcon 等。
XAgent是一个开源的基于大型语言模型(LLM)的自主智能体,可以自动解决各种任务。它被设计为一个通用的智能体,可以应用于各种任务。作为一个开源实验性大型语言模型(LLM)驱动的自主代理,其核心是利用先进的自然语言处理和机器学习技术,使其能够理解和生成人类语言,从而自动解决各种任务。
OLMo是一个开源的语言模型和训练框架,由AI2研究院发布。它提供了完整的训练数据、代码、模型参数、评估代码等资源,使研究人员能够训练并实验大规模语言模型。
一个拥有27亿参数的仅解码器语言模型
一款面向中文和英文的大型多语言预训练语言模型