用Google API 提取名片信息-阿里云开发者社区

用Google API 提取名片信息

2017-04-12 5922

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 我们每个人或多或少都会使用到名片。但是如果名片数量一大，管理它们就显得非常麻烦。因此我产生用这篇文章的案例来管理他们。

介绍

我们每个人或多或少都会使用到名片。但是如果名片数量一大，管理它们就显得非常麻烦。因此我产生用这篇文章的案例来管理他们。

这里，我先用手机对每张名片拍照，并按以下流程进行处理:

38e6c9eb36604a8b974cb8cce546a2e4e2979f78

把获得的名片图像交给我们的应用程序，抽取人名，公司名称，地址等信息。这里我使用了Google Vision API 和自然语言（Natural Language )API，因为这两个API简单易用，并且性能也很不错。

我使用Python来编写我的这个应用程序，来调用 Google Vision API 和 Natural Language API。

创建步骤

第 0 步: 准备

第 1 步: 用Google Vision API识别文本

第 2 步: 用Natural Language API抽取人名，公司名称及地址信息

第 3 步: 整合第1和第2步

第0步准备

在开始应用程序编写之前，我们要安装必要的类库，下载配置以及设置API的键值。从这个链接你能设置 Google API key 。

安装类库

执行一下命令行来安装类库。

$ pip install requests
$ pip install pyyaml

下载资源库

这里我已经事先准备好了资源库。也可以从下面的链接下载。

下载

设置API Key

把Google API key 写进配置文件 (plugins/config/google.yaml).
首先，打开 google.yaml 把你的API key替换掉 xxx。

token: xxx

第1步用Google Vision API识别文本

Vision API 简介

依靠强大的机器学习模型，谷歌 Vision API 能让你编写自己的图像识别应用程序。Vision API 有以下的功能:

图像分类 (例如 “快艇” “狮子” “埃菲尔铁塔” 等等)
脸部识别
文本识别
标志识别
地标识别
安全搜索识别

Vision API 每月有1000个免费请求。

编写脚本

这里我们编写Python脚本来使用 Vision API。把以下代码保存为plugins/apis/vision.py。 这里我们要使用UTF-8编码。

# -*- coding: utf-8 -*-
import base64
import requests


def detect_text(image_file, access_token=None):

    with open(image_file, 'rb') as image:
        base64_image = base64.b64encode(image.read()).decode()

    url = 'https://vision.googleapis.com/v1/images:annotate?key={}'.format(access_token)
    header = {'Content-Type': 'application/json'}
    body = {
        'requests': [{
            'image': {
                'content': base64_image,
            },
            'features': [{
                'type': 'TEXT_DETECTION',
                'maxResults': 1,
            }]

        }]
    }
    response = requests.post(url, headers=header, json=body).json()
    text = response['responses'][0]['textAnnotations'][0]['description'] if len(response['responses'][0]) > 0 else ''
    return text

输入图像文件路径和API key到detect_text 函数，我们就能得到图像文件中的文本信息

运行脚本

首先，把脚本文件移入 plugins/tests 文件夹。其中已经有一个test_vision.py 文件。在test_vision.py中, 编写调用detect_text 函数的测试用例。如果运行正常，我们就能获取图像中的文本信息了。

用下面 example_en.png这张名片作为输入，运行脚本。

a05bb95b1700b76f30c8e7b775657dc7af0fcf43

$ python test_vision.py data/example_en.png

输出结果

John Smith.
Capsule Corporation
217-767-8187
1332 Spring Street Elwin Illinois

第 2 步用Natural Language API抽取人名，公司名称及地址信息

Natural Language API简介

Natural Language API 提供了强大的机器学习模型，以REST API 的形式识别文本结构和其中的含义。Natural Language API 有一下功能:

实体识别 (如，个人姓名，机构名称，事件信息等)
语意分析 (产品评论中的情感，客户意见等)
语法分析

Vision API 每月有5000个免费请求。

运行脚本

同样我们编写Python脚本来调用Natural Language API. 保存脚本为plugins/apis/language.py。注意使用UTF-8编码。

# -*- coding: utf-8 -*-
import requests


def extract_entities(text, access_token=None):

    url = 'https://language.googleapis.com/v1beta1/documents:analyzeEntities?key={}'.format(access_token)
    header = {'Content-Type': 'application/json'}
    body = {
        "document": {
            "type": "PLAIN_TEXT",
            "language": "EN",
            "content": text
        },
        "encodingType": "UTF8"
    }
    response = requests.post(url, headers=header, json=body).json()
    return response


def extract_required_entities(text, access_token=None):
    entities = extract_entities(text, access_token)
    required_entities = {'ORGANIZATION': '', 'PERSON': '', 'LOCATION': ''}
    for entity in entities['entities']:
        t = entity['type']
        if t in required_entities:
            required_entities[t] += entity['name']

    return required_entities

把文本数据和API key 以参数形式传入 extract_entities 函数, 不同的实体信息就能被提取出来。而我们只需要 公司名称, 个人姓名, 地点信息 。extract_required_entities 函数就是用来筛选出这些需要的内容。

运行脚本

同样，把脚本文件移入plugins/tests 文件夹。我们会看到一个test_language.py 文件。在test_language.py中，编写调用 extract_required_entities 函数的测试用例。

这里我用准备好的 example_en.txt文本文件作为输入运行脚本。在example_en.txt 文本文件中包含了上一步的输出结果。

$ python test_language.py data/example.txt

输出结果

{'LOCATION': 'Spring Street Elwin Illinois', 'PERSON': 'John Smith', 'ORGANIZATION': 'Capsule Corporation'}

Step 3 整合第1和第2步I

最后，我们再编写另一个脚本整合 Vision API 和 Natural Language API。

编写脚本

编写脚本整合 Vision API 和 Natural Language API. 保存为 plugins/apis/integration.py。这里我们要使用UTF-8编码。

# -*- coding: utf-8 -*-
from .language import extract_required_entities
from .vision import detect_text


def extract_entities_from_img(img_path, access_token):

    text = detect_text(img_path, access_token)
    entities = extract_required_entities(text, access_token)

    return entities

通过把图像文件路径和API key 作为参数输入 extract_entities_from_img ，就能从名片图像中提取出以上提到的信息数据了。

运行脚本

首先，把脚本文件移入plugins/tests 文件夹。其中已经存在一个test_integration.py文件。在test_integration.py中编写调用extract_entities_from_img 的测试用力。

用图像文件 example_en.png作为输入数据运行脚本。

$ python test_integration.py data/example_en.png

输出结果

{'LOCATION': 'Spring Street Elwin Illinois', 'PERSON': 'John Smith', 'ORGANIZATION': 'Capsule Corporation'}

结论

以上我们用 Google Vision API 和 Natural Language API编写了一个简单的提取名片信息的应用程序。然而，这只是个简单的原型，之后我还会对它进行改进，让它更加完善。

以上为译文

文章原标题《Extracting Information from Business Card with Google API》，作者：HIRONSAN

文章为简译，更为详细的内容，请查看原文

用Google API 提取名片信息

介绍

创建步骤

第0步准备

安装类库

下载资源库

设置API Key

第1步用Google Vision API识别文本

编写脚本

运行脚本

第 2 步用Natural Language API抽取人名，公司名称及地址信息

运行脚本

运行脚本

Step 3 整合第1和第2步I

编写脚本

运行脚本

结论

热门文章

最新文章

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

用Google API 提取名片信息

介绍

创建步骤

第0步 准备

安装类库

下载资源库

设置API Key

第1步 用Google Vision API识别文本

编写脚本

运行脚本

第 2 步用Natural Language API抽取人名，公司名称及地址信息

运行脚本

运行脚本

Step 3 整合第1和第2步I

编写脚本

运行脚本

结论

热门文章

最新文章

相关电子书

相关实验场景

第0步准备

第1步用Google Vision API识别文本