[开源] Pix2Text - 开源图片 / 公式 / 表格 OCR 识别

一款开源支持版面、表格、图片、文字、数学公式等内容 OCR 识别的工具「Pix2Text」支持将识别到的内容整合以 Markdown 格式输出。也可以把一整个 PDF 文件转换为 Markdown 格式。

据作者介绍「Pix2Text」(P2T) 期望成为 Mathpix 的免费开源 Python 替代工具，目前已经可以完成 Mathpix 的核心功能。

20240528-9

整合模型

所有人都可以免费使用 P2T网页版，每人每天可以免费识别 10000 个字符，正常使用应该够用了。请不要批量调用接口，机器资源有限，批量调用会导致其他人无法使用服务。受限于机器资源，网页版当前只支持简体中文和英文。

项目地址：
https://github.com/breezedeus/Pix2Text

在线体验：
https://p2t.breezedeus.com/