微软推出 OmniParser:将 UI 截图转换为结构化数据

AI解读 1个月前 硕雀
42 0

OmniParser是一款由微软推出的通用屏幕解析工具,它能够将 UI 屏幕截图转换为结构化数据,从而显著提升基于 LLM 的 UI Agent 的性能。这个模型基于 YOLOv8 微调而来,支持提取任意手机、PC、APP 的截图,功能非常强大。

来源:www.aiug.cn
声明:文章来源于网络,如有侵权请联系删除!