MemFree是一款开源的混合AI搜索引擎,通过整合多种AI模型和搜索引擎,提供高效、多样化的搜索体验。
多模态大模型Ovis是由阿里国际AI团队开发的一款先进的多模态人工智能模型。该模型在多个领域展现出色的表现,包括数学推理问答、物体识别、文本提取和复杂任务决策等
什么是NVIDIANeMoNVIDIANeMo是一个由NVIDIA提供的端到端云原生框架,用于构建[…]
Mini-Omni 是由清华大学启元实验室开发并开源的多模态大型语言模型,具有实时端到端语音输入和流式音频输出对话功能。
xGen-MM是Salesforce推出的一款开源多模态AI模型,该模型具有处理交错数据的能力,能够同时理解和生成文本、图像等多种数据类型,
浦语灵笔IXC-2.5是由上海人工智能实验室联合多所知名大学和企业共同研发的新一代视觉语言模型。它不仅拥有7B规模的大型语言模型(LLM)后端,更以其对长上下文的理解和生成能力,达到了与GPT-4V相媲美的水平。
Idefics2是一个开放的多模态模型,它能够接受任意序列的图像和文本输入,并产生文本输出。无论是回答有关图像的问题、描述视觉内容、基于多张图像创造故事,还是作为纯语言模型在没有视觉输入的情况下运行,Idefics2都能游刃有余。
InternVL简介InternVL是一个具有6亿参数的视觉变换器(ViT),它与大型语言模型(LLM)相结[…]
DiT(Diffusion Transformer)是一种基于Transformer的扩散模型技术,这种技术被用于构建Sora这样的技术产品。