估值40亿美元的Dropbox又为用户带来新功能：AI识别扫描文档-阿里云开发者社区

估值40亿美元的Dropbox又为用户带来新功能：AI识别扫描文档

2017-07-05 1250

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

票证核验，票证核验 50次/账号

个人证照识别，个人证照识别 200次/月

小语种识别，小语种识别 200次/月

简介：

云文件同步和共享服务商Dropbox今天披露了更多支持光学字符识别（OCR）功能的技术细节，已经为Dropbox Business付费的企业员工可以在Android和iOS应用程序中使用该功能。

具体操作是这样的，使用移动设备上的相机扫描文档后，光学字符识别功能将会启动。然后，应用程序会根据需要裁剪或旋转文档，然后将其保存为Dropbox中的PDF。8月，该公司表示正在使用计算机视觉来检测应用程序扫描文档。

与人工智能深度学习结合的OCR技术已经不是新鲜事了。GitHub 上的开源软件可以用于两者结合，Google在Google街景图像中也运用了机器学习和OCR技术。OCR系统的初始版本采用市售软件开发工具包（SDK）。Dropbox选择运行自己的数据包以节省资金并提高准确性，因为市售系统主要是为实际的硬件扫描仪构建的，而不是为移动设备上使用相机的扫描仪。Dropbox利用用户数据训练系统。

Dropbox的软件工程师Brad NeubergNeuberg表示，Dropbox需要收集用户上传一部分图像或文件，例如收据、发票、信件等。为了收集这个集合，公司事先征得了用户的同意。如果用户同意，那么这些文件信息一定会被保密。Dropbox对用户捐赠的数据采取各种安全措施，比如绝不会将数据保留在本地部署的服务器上，保持持续并广泛的审计、部署强大的身份验证访问数据措施等。

为了预测文档中特定单词的剪切文本，Dropbox通过卷积神经网络，然后是双向长时间短期记忆（LSTM）网络发送图像，最后连接时间分类（CTC）系统。该系统部分依赖于Google的TensorFlow开源深入学习框架。为了加强这个系统，Dropbox借鉴了虚构的数据，然后以简单的方式进行了转换。

Dropbox已经脱离了亚马逊网络服务（AWS）的公共云端，并运行自己的数据中心基础架构。此外，Dropbox已经开始使用图形处理单元（GPU）加速的G2 虚拟机（VM）实例对其模型进行了培训，并存储了一些数据在AWS S3服务中。为了进一步改进模型，Dropbox训练了小数量的图像单词。然后，从预测单个词跳转到处理整个文档。

与人工智能深度学习结合的OCR技术已经不是新鲜事了。GitHub上的开源软件可以用于两者结合，Google在Google街景图像中也运用了机器学习和OCR技术。OCR系统的初始版本采用市售软件开发工具包（SDK）。Dropbox选择运行自己的数据包以节省资金并提高准确性，因为市售系统主要是为实际的硬件扫描仪构建的，而不是为移动设备上使用相机的扫描仪。Dropbox利用用户数据训练系统。

Dropbox已经脱离了亚马逊网络服务（AWS）的公共云端，并运行自己的数据中心基础架构。此外，Dropbox已经开始使用图形处理单元（GPU）加速的G2虚拟机（VM）实例对其模型进行了培训，并存储了一些数据在AWS S3服务中。为了进一步改进模型，Dropbox训练了小数量的图像单词。然后，从预测单个词跳转到处理整个文档。

本文转自d1net（转载）

估值40亿美元的Dropbox又为用户带来新功能：AI识别扫描文档

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

估值40亿美元的Dropbox又为用户带来新功能：AI识别扫描文档

热门文章

最新文章

相关课程

相关电子书

相关实验场景