[开源] Pix2Text - 开源图片 / 公式 / 表格 OCR 识别

一款开源支持版面、表格、图片、文字、数学公式等内容 OCR 识别的工具「Pix2Text」支持将识别到的内容整合以 Markdown 格式输出。也可以把一整个 PDF 文件转换为 Markdown 格式。

据作者介绍「Pix2Text」(P2T) 期望成为 Mathpix 的免费开源 Python 替代工具,目前已经可以完成 Mathpix 的核心功能。

20240528-9

整合模型

  • 版面分析模型
  • 表格识别模型
  • 文字识别引擎:支持 80+ 种语言
  • 数学公式检测模型(MFD)
  • 数学公式识别模型(MFR)

所有人都可以免费使用 P2T网页版,每人每天可以免费识别 10000 个字符,正常使用应该够用了。请不要批量调用接口,机器资源有限,批量调用会导致其他人无法使用服务。受限于机器资源,网页版当前只支持简体中文和英文。

项目地址:
https://github.com/breezedeus/Pix2Text

在线体验:
https://p2t.breezedeus.com/