MinerU是由上海人工智能实验室OpenDataLab团队推出的一款开源智能数据提取工具,专注于复杂PDF文档的高效解析与提取。它能够将包含图片、公式、表格等元素的多模态PDF文档转化为易于分析的Markdown格式,并支持从网页和电子书中提取内容,提高AI语料准备效率。