阿里云发票识别功能评测

简介:

1.功能描述:

在日常工作中经常要用到增值税发票。在使用的时候需要对增值税发表进行检查,验真,录入等很多工作。使用增值税发票识别技术,实现对增值税普票或专票各字段信息的识别和录入,可应用于企业税务核算及内部报销等场景,能够有效减少人工核算工作量,降低人力成本,实现财税报销的自动化

阿里云开放了多款热门AI产品,0元免费试用!,活动地址:

https://tianchi.aliyun.com/markets/tianchi/ai/join?wh_ttid=pc

2.调用攻略(Python3)及评测

详细说明请参考对应的说明文档

import urllib.request
import urllib.parse
import json
import time
import base64

调用函数

def posturl(url,data={}):

#请求头
headers = {
     'Authorization': 'APPCODE 你的APPCODE',
     'Content-Type': 'application/json; charset=UTF-8'
}
try:
    params=json.dumps(data).encode(encoding='UTF8')
    req = urllib.request.Request(url, params, headers)
    r = urllib.request.urlopen(req)
    html =r.read()
    r.close();
    return html.decode("utf8")
except urllib.error.HTTPError as e:
    print(e.code)
    print(e.read().decode("utf8"))
time.sleep(1)

识别增值税发票

def vat_invoice(filename):

with open(filename, 'rb') as f:  # 以二进制读取本地图片
    data = f.read()
    encodestr = str(base64.b64encode(data),'utf-8')
url_request="https://ocrapi-invoice.taobao.com/ocrservice/invoice"
dict = {'img': encodestr}

content = posturl(url_request, data=dict)
#print(content)
if content:
    #print(content)
    data = json.loads(content)
    #print(data)
    words_result=data['data']
    print ('发票代码:',words_result['发票代码'])
    print ('发票号码:',words_result['发票号码'])
    print ('校验码:',words_result['校验码'])
    print ('开票日期:',words_result['开票日期'])
    print ('发票金额:',words_result['发票金额'])
    print ('发票税额:',words_result['发票税额'])
    print ('销售方名称:',words_result['销售方名称'])
    print ('销售方税号:',words_result['销售方税号'])
    print ('受票方名称:',words_result['受票方名称'])
    print ('受票方税号:',words_result['受票方税号'])
    
  

vat_invoice('invoice.jpg')

3.功能评测:
选用不同的数据对效果进行测试,具体效果如下(以下发票例子均来自网上):

15580750887564574invoice

发票代码: 4300171130
发票号码: 02550485
校验码:
开票日期: 2018年01月15日
发票金额: 12338.15
发票税额: 1792.72
销售方名称: 中国石化销售有限公司湖南长沙石油分公司
销售方税号: 91430100717079385W
受票方名称: 中启行物联科技(北京)有限公司
受票方税号: 911101023513172379

15580751246879950invoice1

发票代码: 034001700112
发票号码: 04395009
校验码: 14298735920708772366
开票日期: 2018年1月1日
发票金额: 9.5
发票税额: 0.28
销售方名称: 安徽省交通控股集团有限公司
销售方税号: 91340000MA2T9Q407
受票方名称: 安徽省公司
受票方税号:

测试下来,整体感觉处理的很不错,此功能会大大的发票处理的工作量。

相关文章
|
文字识别 算法
印刷文字识别产品使用合集之开通了阿里云发票识别验真功能,其他人可以调用我的这个接口吗
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
编解码 文字识别
印刷文字识别产品使用合集之增值税发票识别如何提升备注识别率
印刷文字识别(Optical Character Recognition, OCR)技术能够将图片、扫描文档或 PDF 中的印刷文字转化为可编辑和可搜索的数据。这项技术广泛应用于多个领域,以提高工作效率、促进信息数字化。以下是一些印刷文字识别产品使用的典型场景合集。
111 3
|
机器学习/深度学习 存储 文字识别
【增值税发票识别 OCR】如何实现自动化发票管理
通过利用增值税发票识别OCR API 实现智能化的增值税发票识别、分类和归档,企业可以实现自动化的发票管理流程。这将大大提高工作效率、减少错误率,并为企业提供准确的财务数据和统计分析基础,有需要的小伙伴赶紧用起来吧~
404 0
【增值税发票识别 OCR】如何实现自动化发票管理
|
机器学习/深度学习 文字识别 算法
一文看懂增值税发票识别OCR:从技术原理到 API Java 示例代码接入
一文看懂增值税发票识别OCR:从技术原理到 API Java 示例代码接入
1270 0
一文看懂增值税发票识别OCR:从技术原理到 API Java 示例代码接入
|
前端开发 应用服务中间件 nginx
react react-pdf实现在线pdf加载(翻页加载、下拉滚动加载)
react react-pdf实现在线pdf加载(翻页加载、下拉滚动加载)
|
4月前
|
JSON 算法 API
1688商品详情API实战:Python调用全流程与数据解析技巧
本文介绍了1688电商平台的商品详情API接口,助力电商从业者高效获取商品信息。接口可返回商品基础属性、价格体系、库存状态、图片描述及商家详情等多维度数据,支持全球化语言设置。通过Python示例代码展示了如何调用该接口,帮助用户快速上手,适用于选品分析、市场研究等场景。
|
Java 计算机视觉
Java调用opencv证件照替换背景色
Java调用opencv证件照替换背景色
1059 0
|
机器学习/深度学习 数据可视化 数据挖掘
构建可复用的 Jupyter 模板和插件:提高工作效率的最佳实践
【8月更文第29天】Jupyter Notebook 是一个广泛使用的交互式计算环境,支持多种编程语言。它不仅用于数据分析、可视化和机器学习项目,也是教学和科研的理想工具。然而,随着使用频率的增加,重复编写相似的代码和设置变得既耗时又低效。通过创建可复用的 Jupyter 模板和插件,我们可以显著提高工作效率。
322 1
|
负载均衡 Dubbo 应用服务中间件
Dubbo服务调用过程原理
该文章主要介绍了Dubbo服务调用过程的原理,包括服务调用的主要阶段和服务调用的具体步骤。
Dubbo服务调用过程原理
|
人工智能 前端开发 搜索推荐
详解基于百炼平台及函数计算快速上线网页AI助手
通过阿里云百炼平台,企业可在10分钟内为其网站添加智能客服系统,提升用户体验并降低成本。流程包括:创建大模型应用、配置参数(如温度系数以控制回复的随机性)、发布应用获取API密钥;使用函数计算快速搭建示例网站,并通过简单的代码更改启用AI助手功能;还可导入私有知识库增强助手的能力。前端基于NLUX开发,支持定制化需求如样式调整和历史会话管理。服务端代码提供了调用大模型获取答案的接口。借助百炼平台,企业能迅速部署即时且个性化的在线服务,适应数字化转型的需求。

热门文章

最新文章