Surya是一款功能强大的开源OCR(光学字符识别)工具包,专门设计用在文档识别,支持超过90种语言的识别。Surya能准确识别出文档中的文本,分析文本的阅读顺序,检测文档中的布局元素,如表格、图片和标题,及识别和解析表格内容。Surya因高效的表格识别能力而闻名,性能优于许多现有的开源模型,如Table Transformer。Surya完全免费且用于商业用途,支持跨平台运行,包括Windows、Mac和Linux系统,适合处理敏感信息的离线环境。

(图片来源网络,侵删)

(图片来源网络,侵删)
全部评论
留言在赶来的路上...
发表评论