OCR Surya是一个开源的文档OCR工具包,它提供了全面而强大的解决方案,特别适合于多语言文档的智能处理。Surya的名字源自印度教中的太阳神,象征着普遍的视野,这恰如其分地体现了Surya在文档处理方面的全面性。
OmniParse是一个开源的数据解析平台,旨在将各种非结构化数据转换为结构化、可操作的数据,特别适用于通用人工智能(GenAI)应用。它能够处理包括文档、表格、图片、视频、音频文件和网页在内的多种文件类型。
MinerU是由上海人工智能实验室OpenDataLab团队推出的一款开源智能数据提取工具,专注于复杂PDF文档的高效解析与提取。它能够将包含图片、公式、表格等元素的多模态PDF文档转化为易于分析的Markdown格式,并支持从网页和电子书中提取内容,提高AI语料准备效率。
EasyOCR 是由 JaidedAI 开发的开源项目,它基于 PyTorch,采用了最新的深度学习模型,可以识别 80 多种语言的文字,不仅能识别英文、中文、日文,还能搞定一些稀有语言,比如泰米尔语、藏语等