[开源] Pix2Text - 开源图片 / 公式 / 表格 OCR 识别
一款开源支持版面、表格、图片、文字、数学公式等内容 OCR 识别的工具「Pix2Text」支持将识别到的内容整合以 Markdown 格式输出。也可以把一整个 PDF 文件转换为 Markdown 格式。
据作者介绍「Pix2Text」(P2T) 期望成为 Mathpix 的免费开源 Python 替代工具,目前已经可以完成 Mathpix 的核心功能。
整合模型
- 版面分析模型
- 表格识别模型
- 文字识别引擎:支持 80+ 种语言
- 数学公式检测模型(MFD)
- 数学公式识别模型(MFR)
所有人都可以免费使用 P2T网页版,每人每天可以免费识别 10000 个字符,正常使用应该够用了。请不要批量调用接口,机器资源有限,批量调用会导致其他人无法使用服务。受限于机器资源,网页版当前只支持简体中文和英文。
项目地址:
https://github.com/breezedeus/Pix2Text
在线体验:
https://p2t.breezedeus.com/