数学公式识别(Mathpix + pix2tex)
当我们看论文时,总少不了一些数学公式,而且想要复现时,在 Word、Markdown 或 Latex 中一个字符一个字符的敲,效率太低了。
Mathpix 可以将图片、PDF 文档和网页等,甚至是手写的数学公式直接转换成代码格式,可直接贴入 Markdown,Latex 或 Word 自带的公式编辑器中转换即可。
1. 下载安装
进入 Mathpix 官网 或 直接进入下载页面 desktop-downloads,点击并下载:
注意:
- 点击后会跳转到另一个网页,记得回到当前网页,即可下载并保存该安装程序。
- 如果因网速等原因无法下载或下载较慢,可点击 https://luguoliang.lanzouk.com/iLFcl0zm3igf 密码:liang。
下载完成后,一直默认安装即可。
2. 如何使用
安装完成第一次打开时,会让我们创建账号,点击后自动跳转到浏览器进行创建:
创建提交后,回到邮箱点击链接进行验证,即可正常登录:
可以发现 Mathpix 如何使用,以及剩余使用次数:
演示:CTRL + ALT + M
可以发现识别准确率特别高,并且提供了以下4种代码方式:
(1)需添加 一对 $
或 $$
,见(2)(3):
\alpha_c[t]=\frac{1}{Z} \sum_{m, n} \frac{\partial f(\boldsymbol{x})[t]}{\partial A_c[m, n]}
(2)行内公式:一对 $
:
$\alpha_c[t]=\frac{1}{Z} \sum_{m, n} \frac{\partial f(\boldsymbol{x})[t]}{\partial A_c[m, n]}$
(3)块公式:一对 $$
:
$$ \alpha_c[t]=\frac{1}{Z} \sum_{m, n} \frac{\partial f(\boldsymbol{x})[t]}{\partial A_c[m, n]} $$
(4)可以在支持Latex的软件中直接编写;或将其嵌套在一对 $$
中:
\begin{equation} \alpha_c[t]=\frac{1}{Z} \sum_{m, n} \frac{\partial f(\boldsymbol{x})[t]}{\partial A_c[m, n]} \end{equation}
$$ \begin{equation} \alpha_c[t]=\frac{1}{Z} \sum_{m, n} \frac{\partial f(\boldsymbol{x})[t]}{\partial A_c[m, n]} \end{equation} $$
3. 限制
我们会发现每个月仅有10次的免费使用机会。。。。。刚刚已经浪费了一次了。。。。。
4. 替代品
4.1 pix2tex - LaTeX OCR
使用 ViT 将方程式的图像转换成 LaTeX 代码,GitHub链接:https://github.com/lukas-blecher/LaTeX-OCR/
使用要求:
- Python 3.7+
- PyTorch
进入 pytorch 所在的虚拟环境,安装包(会安装相关的依赖包):
pip install pix2tex[gui]
使用图形化界面(先进入 pytorch 虚拟环境):
latexocr
识别率略低于 Mathpix,复杂公式会有较高的失败概率:
4.2 pix2tex(网页版)
有开发者基于 pix2tex 开发了网页服务可直接使用的在线网站,网址:https://p2t.behye.com。
4.3 Simple Tex OCR
一个免费的数学公式在线识别网站,官网:https://www.simpletex.cn/ai/latex_ocr。
- 优点:无需登录、无需配置环境、不限制次数、截图
Ctrl + V
直接粘贴到网页 - 缺点:复杂公式的识别率较低