阿里云发票识别功能评测

简介:

1.功能描述:

在日常工作中经常要用到增值税发票。在使用的时候需要对增值税发表进行检查,验真,录入等很多工作。使用增值税发票识别技术,实现对增值税普票或专票各字段信息的识别和录入,可应用于企业税务核算及内部报销等场景,能够有效减少人工核算工作量,降低人力成本,实现财税报销的自动化

阿里云开放了多款热门AI产品,0元免费试用!,活动地址:

https://tianchi.aliyun.com/markets/tianchi/ai/join?wh_ttid=pc

2.调用攻略(Python3)及评测

详细说明请参考对应的说明文档

import urllib.request
import urllib.parse
import json
import time
import base64

调用函数

def posturl(url,data={}):

#请求头
headers = {
     'Authorization': 'APPCODE 你的APPCODE',
     'Content-Type': 'application/json; charset=UTF-8'
}
try:
    params=json.dumps(data).encode(encoding='UTF8')
    req = urllib.request.Request(url, params, headers)
    r = urllib.request.urlopen(req)
    html =r.read()
    r.close();
    return html.decode("utf8")
except urllib.error.HTTPError as e:
    print(e.code)
    print(e.read().decode("utf8"))
time.sleep(1)

识别增值税发票

def vat_invoice(filename):

with open(filename, 'rb') as f:  # 以二进制读取本地图片
    data = f.read()
    encodestr = str(base64.b64encode(data),'utf-8')
url_request="https://ocrapi-invoice.taobao.com/ocrservice/invoice"
dict = {'img': encodestr}

content = posturl(url_request, data=dict)
#print(content)
if content:
    #print(content)
    data = json.loads(content)
    #print(data)
    words_result=data['data']
    print ('发票代码:',words_result['发票代码'])
    print ('发票号码:',words_result['发票号码'])
    print ('校验码:',words_result['校验码'])
    print ('开票日期:',words_result['开票日期'])
    print ('发票金额:',words_result['发票金额'])
    print ('发票税额:',words_result['发票税额'])
    print ('销售方名称:',words_result['销售方名称'])
    print ('销售方税号:',words_result['销售方税号'])
    print ('受票方名称:',words_result['受票方名称'])
    print ('受票方税号:',words_result['受票方税号'])
    
  

vat_invoice('invoice.jpg')

3.功能评测:
选用不同的数据对效果进行测试,具体效果如下(以下发票例子均来自网上):

15580750887564574invoice

发票代码: 4300171130
发票号码: 02550485
校验码:
开票日期: 2018年01月15日
发票金额: 12338.15
发票税额: 1792.72
销售方名称: 中国石化销售有限公司湖南长沙石油分公司
销售方税号: 91430100717079385W
受票方名称: 中启行物联科技(北京)有限公司
受票方税号: 911101023513172379

15580751246879950invoice1

发票代码: 034001700112
发票号码: 04395009
校验码: 14298735920708772366
开票日期: 2018年1月1日
发票金额: 9.5
发票税额: 0.28
销售方名称: 安徽省交通控股集团有限公司
销售方税号: 91340000MA2T9Q407
受票方名称: 安徽省公司
受票方税号:

测试下来,整体感觉处理的很不错,此功能会大大的发票处理的工作量。

相关文章
|
5月前
|
文字识别 算法
印刷文字识别产品使用合集之开通了阿里云发票识别验真功能,其他人可以调用我的这个接口吗
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
机器学习/深度学习 存储 文字识别
【增值税发票识别 OCR】如何实现自动化发票管理
通过利用增值税发票识别OCR API 实现智能化的增值税发票识别、分类和归档,企业可以实现自动化的发票管理流程。这将大大提高工作效率、减少错误率,并为企业提供准确的财务数据和统计分析基础,有需要的小伙伴赶紧用起来吧~
282 0
【增值税发票识别 OCR】如何实现自动化发票管理
|
机器学习/深度学习 文字识别 算法
一文看懂增值税发票识别OCR:从技术原理到 API Java 示例代码接入
一文看懂增值税发票识别OCR:从技术原理到 API Java 示例代码接入
886 0
一文看懂增值税发票识别OCR:从技术原理到 API Java 示例代码接入
|
文字识别
OCR:实现信息结构化提取 助力信息数字化管理 ——基于OCR的机动车销售统一发票识别提取自动化应用案例
为降低信息提取成本、优化业务处理效率,深源恒际依托自身在OCR技术上的积累,打造了机动车销售统一发票信息识别提取自动化解决方案,自动检测、识别、提取发票信息,并根据实际应用需求输出结构化文本,由计算机替代人工作业,高效、准确地完成信息提取。
|
6月前
|
文字识别 API 数据安全/隐私保护
可以使用阿里云文字识别服务中的个人证照识别功能。
可以使用阿里云文字识别服务中的个人证照识别功能。【1月更文挑战第21天】【1月更文挑战第102篇】
46 1
|
4月前
|
文字识别 负载均衡 安全
印刷文字识别使用问题之是否可以识别带销售清单的发票
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
4月前
|
文字识别 Java API
印刷文字识别使用问题之发票凭证识别功能是否可以对接ERP系统
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
4月前
|
文字识别 算法 数据可视化
印刷文字识别使用问题之是否支持识别发票验真伪
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
4月前
|
文字识别 Java API
印刷文字识别使用问题之发票类型识别方面出现不稳定的情况,该如何解决
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
5月前
|
文字识别
印刷文字识别产品使用合集之可以支持对哪些类型的票据进行识别支持数电发票的ocr识别吗
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。