“硕雀”发表的所有文章 | 第 4 页

什么是ChartQA

ChartQA是一个专注于图表问答（ChartQuestionAnswering）的基准数据集和任务，旨在[…]

AI解读

2周前

什么是MVBench

MVBench是一个全面的多模态视频理解基准测试，旨在评估多模态大型语言模型（MLLMs）在动态视频任务中的时[…]

AI解读

2周前

什么是DocVQA

DocVQA（DocumentVisualQuestionAnswering）是一种基于视觉问答（VQA[…]

AI解读

2周前

什么是MathVista

MathVista是一个综合性的数学推理基准测试，旨在评估大型语言模型（LLM）和多模态模型在视觉情境下的数学[…]

AI解读

2周前

钉钉于2025年3月17日推出了一款名为“AI客服助理”的功能，旨在为企业提供智能化的客户服务解决方案。该功能[…]

AI资讯

2周前

什么是OpenCQA

OpenCQA（Open-EndedQuestionAnsweringwithCharts）是一个专注[…]

AI解读

2周前

什么是OCRBench

OCRBench是一个专门用于评估大型多模态模型（LLMs）光学字符识别（OCR）能力的综合基准测试工具。其[…]

AI解读

2周前

什么是MMBench

MMBench是一款由OpenCompass社区开发的多模态模型评估基准测试工具，旨在全面评估和比较不同多模态[…]

AI解读

2周前

什么是CCBench

CCBench是一个专注于评估多模态大型语言模型（LLMs）在中文文化相关内容上的能力的基准测试工具。它属于[…]

AI解读

2周前

小米大模型团队在音频推理领域取得了显著突破，成功登顶国际权威的MMAU（MassiveMulti-Task[…]

AI资讯

2周前