作者:硕雀

我还没有学会写个人说明!

什么是ChartQA
ChartQA是一个专注于图表问答(ChartQuestionAnswering)的基准数据集和任务,旨在[…]
什么是MVBench
MVBench是一个全面的多模态视频理解基准测试,旨在评估多模态大型语言模型(MLLMs)在动态视频任务中的时[…]
什么是DocVQA
DocVQA(DocumentVisualQuestionAnswering)是一种基于视觉问答(VQA[…]
什么是MathVista
MathVista是一个综合性的数学推理基准测试,旨在评估大型语言模型(LLM)和多模态模型在视觉情境下的数学[…]
钉钉推出AI客服助理 可自动接入企业官网、公众号等平台
钉钉于2025年3月17日推出了一款名为“AI客服助理”的功能,旨在为企业提供智能化的客户服务解决方案。该功能[…]
什么是OpenCQA
OpenCQA(Open-EndedQuestionAnsweringwithCharts)是一个专注[…]
什么是OCRBench
OCRBench是一个专门用于评估大型多模态模型(LLMs)光学字符识别(OCR)能力的综合基准测试工具。其[…]
什么是MMBench
MMBench是一款由OpenCompass社区开发的多模态模型评估基准测试工具,旨在全面评估和比较不同多模态[…]
什么是CCBench
CCBench是一个专注于评估多模态大型语言模型(LLMs)在中文文化相关内容上的能力的基准测试工具。它属于[…]
小米大模型团队登顶音频推理 MMAU 榜
小米大模型团队在音频推理领域取得了显著突破,成功登顶国际权威的MMAU(MassiveMulti-Task[…]
1 2 3 4 5 6 193