数学公式识别(Mathpix + pix2tex)

简介: 数学公式识别(Mathpix + pix2tex)

数学公式识别(Mathpix + pix2tex)

当我们看论文时,总少不了一些数学公式,而且想要复现时,在 Word、Markdown 或 Latex 中一个字符一个字符的敲,效率太低了。

Mathpix 可以将图片、PDF 文档和网页等,甚至是手写的数学公式直接转换成代码格式,可直接贴入 Markdown,Latex 或 Word 自带的公式编辑器中转换即可。

1. 下载安装

进入 Mathpix 官网 或 直接进入下载页面 desktop-downloads,点击并下载:

注意:

  • 点击后会跳转到另一个网页,记得回到当前网页,即可下载并保存该安装程序。
  • 如果因网速等原因无法下载或下载较慢,可点击 https://luguoliang.lanzouk.com/iLFcl0zm3igf 密码:liang。

下载完成后,一直默认安装即可。

2. 如何使用

安装完成第一次打开时,会让我们创建账号,点击后自动跳转到浏览器进行创建:

创建提交后,回到邮箱点击链接进行验证,即可正常登录:

可以发现 Mathpix 如何使用,以及剩余使用次数:

演示:CTRL + ALT + M

可以发现识别准确率特别高,并且提供了以下4种代码方式:

(1)需添加 一对 $$$,见(2)(3):

\alpha_c[t]=\frac{1}{Z} \sum_{m, n} \frac{\partial f(\boldsymbol{x})[t]}{\partial A_c[m, n]}

(2)行内公式:一对 $

$\alpha_c[t]=\frac{1}{Z} \sum_{m, n} \frac{\partial f(\boldsymbol{x})[t]}{\partial A_c[m, n]}$

image.png

(3)块公式:一对 $$

$$
\alpha_c[t]=\frac{1}{Z} \sum_{m, n} \frac{\partial f(\boldsymbol{x})[t]}{\partial A_c[m, n]}
$$

image.png

(4)可以在支持Latex的软件中直接编写;或将其嵌套在一对 $$ 中:

\begin{equation}
\alpha_c[t]=\frac{1}{Z} \sum_{m, n} \frac{\partial f(\boldsymbol{x})[t]}{\partial A_c[m, n]}
\end{equation}
$$
\begin{equation}
\alpha_c[t]=\frac{1}{Z} \sum_{m, n} \frac{\partial f(\boldsymbol{x})[t]}{\partial A_c[m, n]}
\end{equation}
$$


image.png

3. 限制

我们会发现每个月仅有10次的免费使用机会。。。。。刚刚已经浪费了一次了。。。。。

4. 替代品

4.1 pix2tex - LaTeX OCR

使用 ViT 将方程式的图像转换成 LaTeX 代码,GitHub链接:https://github.com/lukas-blecher/LaTeX-OCR/

使用要求:

  • Python 3.7+
  • PyTorch

进入 pytorch 所在的虚拟环境,安装包(会安装相关的依赖包):

pip install pix2tex[gui]

使用图形化界面(先进入 pytorch 虚拟环境):

latexocr

识别率略低于 Mathpix,复杂公式会有较高的失败概率:

4.2 pix2tex(网页版)

有开发者基于 pix2tex 开发了网页服务可直接使用的在线网站,网址:https://p2t.behye.com

4.3 Simple Tex OCR

一个免费的数学公式在线识别网站,官网:https://www.simpletex.cn/ai/latex_ocr

  • 优点:无需登录、无需配置环境、不限制次数、截图 Ctrl + V 直接粘贴到网页
  • 缺点:复杂公式的识别率较低

目录
相关文章
|
10月前
|
机器学习/深度学习 编解码 人工智能
面壁开源多模态新旗舰MiniCPM-V 4.5,8B 性能超越 72B,高刷视频理解又准又快
今天,面壁智能正式开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型,成为行业首个具备“高刷”视频理解能力的多模态模型,看得准、看得快,看得长!高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA,且性能超过 Qwen2.5-VL 72B,堪称最强端侧多模态模型。
798 9
|
消息中间件 存储
|
Kubernetes 负载均衡 Cloud Native
网关的前世今生
云原生时代,网关的使命将发生什么样的变化
578 0
网关的前世今生
|
11月前
|
人工智能 自然语言处理 Serverless
阿里云 Milvus 轻松实现文搜图&图搜图
阿里云Milvus是一款高性能、易扩展的云原生向量检索引擎,适用于推荐系统、图像检索、自然语言处理等AI场景。它支持海量向量数据实时召回,并提供直观API和多语言SDK。结合阿里云百炼模型服务与函数计算,可轻松实现文搜图、图搜图等多模态检索应用,助力企业高效开发智能搜索系统。
|
网络协议 JavaScript 前端开发
将websocket封装成一个class,断线可重连
将websocket封装成一个class,断线可重连
791 3
|
数据采集 编解码 人工智能
Google Earth Engine(GEE)——全球每日近地表空气温度(2003-2020年)
Google Earth Engine(GEE)——全球每日近地表空气温度(2003-2020年)
783 0
|
SQL Oracle 关系型数据库
Oracle各种版本下“示例数据库的创建”的创建
Oracle各种版本下“示例数据库的创建”的创建
1135 0
|
JavaScript 前端开发 iOS开发
开源/免费/强大的移动端触摸滑动插件 — Swiper
Swiper是一款免费及轻量级的移动设备触控滑块的框架,使用硬件加速过渡(如果该设备支持的话),主要使用与移动端的网站/网页应用程序(web apps)/原生应用程序(native apps),主要是为IOS而设计的,同时在Android/WP8系统及现代桌面浏览器也有着良好的用户体验 swipe.
10731 5