不少科研党就是写论文时经常要输入一堆定理公式,有的公式是书上或者文献里面的原样公式,一个一个往Word或者LaTex里面敲非常累。此时如果能有识别公式的软件,那肯定会提升不少效率。今天就来推荐一款公式识别软件。【文末附软件安装包】
InftyReader是一款日本人研发的OCR应用软件,能识别公式和外语文字,我们主要是用它来识别pdf文章或者图片中的公式。与ABBYY不同的是,它可以将复杂的数学公式识别和翻译成LaTeX,MathML,XHTML,HRTeX,IML和Microsoft Word文档!
此软件为全英文操作环境。打开软件后首先找到file按钮后的文档类型选择区域,我们选择pdf,然后再回到file按钮,打开需要识别的文档。在output file format 选择latex,之后找到start ocr回车即可。
下面是一些说明:
2.软件识别还是会有一定错误,需要一些经验进行判断。
3.本软件对于文字版pdf识别效果最好,或者需要清晰的扫描版。
4.jpg图像等亦可识别,但同样要求尽量高的清晰度和分辨率。
5.此为付费软件,否则每日只能扫描五个页面。
6.软件原理是PDF文件转换成图片,然后针对图片进行识别,所以速度会很慢,最后生成XML用word打开。
第一步:将pdf的论文转换成png格式。
打开PDFtoPNG,如下图所示,注意dpi修改为400。
第二步:打开InftyReader,选择试用,注意试用版一天只能解析5张图片的公式。
第三步:打开软件后,如下界面,按照红框操作即可。要点是选择PNG、英语、400dpi、输出word格式,最后点击Start OCR即可,注意试用版一次只能解析一张图片。也可以用PDF格式直接导入,就是比较慢。
第四步:word一般自动打开xml的文档,如果不能,请自己去输出目录选择word打开,对比一下识别效果。
原图部分如下:
官方下载地址:http://inftyreader.org/InftyReaderE3132_Enterprise_IDEAL.zip
注:
转PNG也可以用其他软件。
如果只想识别一页PDF上的公式,可以先用PDF阅读器先提取出那一页PDF,然后用InftyReader将那一页PDF转换成PNG。
单个公式的截图转换会很快,正确率基本上在90%左右。
不要为了简单直接截图,因为dpi不合适,会导致识别效果很差!如果有耐心的话,还是建议直接PDF识别。
还可以尝试用国产的MathOCR,一款开源的.jar软件。
▍来源:虫部落/万能搜吧
后台回复“公式识别”
即可获取该软件