大数据与人工智能的应用链条,掘金1.6万亿美元市场

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

人工智能将发展成什么样,未来大家逛街是否都会带一台机器人随行,变形金刚会满地跑吗?人工智能设备能够帮助人类,但人类是否被其所控?

按照阿里巴巴马云的话来说,未来机器人会比人类更强大,但不会比人类更明智,人的智慧是人类的核心,机器对友情和爱没有感觉,所以要用机器来作为创新的解决方式。

  但《澳门风云3》电影让人思考,未来机器人也可能会拥有人类的情感。

中国的智能硬件,手机、电视等产品每个月都在推出拥有新科技、新功能的产品,快速发展的智能硬件已经在准备迎接智能时代的到来。

阿尔法狗战胜李世石让人工智能的讨论热潮席卷了IT界,近期涌现了多家交互对话机器人等类别的创业公司,股权投资机构也在对人工智能领域热切下单投资。

未来尚不可知,人工智能现在和近期能够影响人类生活的还主要在这样几个领域——语音语言识别、图片识别和自动驾驶。

实际上,人工智能还是一件大难事,比如让机器像人一样听得懂语言就是一件难事,而听得懂,还能流畅回答交流,甚至能够根据你的语气、面部表情体会到你的情感,让其组织语言来跟你交流,就是更难的事情了。

语音识别、图片识别、自动驾驶的现状与挑战

去年的百度世界大会介绍了多款业务和产品,李彦宏亲自介绍的是百度的语音搜索产品度秘,李彦宏用了几段方言来测试度秘的语音分析能力,现场的许多观众都没有听懂那句话,但度秘却轻松听懂了。度秘这款产品,可以为百度糯米等产品提供语音文字输入,能够用来购买产品、寻找地址,还与华为荣耀手机“智灵键”深度集成,为华为手机用户提供秘书化搜索服务。

按照李彦宏的逻辑,在移动互联网触屏时代,80后之前的人可能还愿意打字交流,但90后甚至00后,可能更愿意和习惯用语音来与智能设备交互。所以度秘是百度方便用户使用并引领用户习惯变迁的重要产品。

如果不懂人工智能开发的繁杂和困难,会觉得让机器听懂一个人说话有那么难吗?其实这个过程非常复杂。实际上,百度、谷歌、阿里巴巴等公司至今也没有在语音识别这个领域做的尽善尽美。比如对方言和嘈杂环境中的语音识别,差错率也还是有一些的。

目前,度秘等产品承担的主要还是听懂的功能,而微软小冰等交互机器人产品,则进一步在承担人机交流对话的功能。小冰现在用户众多,微软对小冰机器人寄予厚望,认为是其移动互联网的重要入口。

人工智能的应用,还体现在电商图片搜索领域。此前传统的搜索方式主要是通过品牌货号进行文字搜索。现在,用户上传一张服装的图片即可以在淘宝搜索出多个类似款式的衣服。

之所以能够搜出来,是因为淘宝对大量的服装进行了标注,比如该衣服是长款还是短款,什么颜色,带领还是无领等,但由于目前标注点还比较少,所以给出的搜索结果是多款类似的衣服,用户可以在其中找寻合适的款式,或在给出的结果中再自行搜索那个同品牌同款式的衣服。

想要通过图片搜索直接找到同品牌同款式服装,需要成倍增加标注点,成本大幅上升,对淘宝来说未必划算。但据说目前已经有了拥有图片精确搜索技术的公司,相信随着人工智能的迭代发展,通过图片搜索服装、鞋子、包包、家具等产品都将更加直接和容易。

此外,自动驾驶也是人工智能领域最前端的技术。目前,包括百度、谷歌在内的公司,都在积极研发之中,但完全商业化,需要假以时日。自动驾驶面临更多更繁杂的数据,包括与其他车辆的距离、车速、变道时机、刹车幅度、避让行人、天气、行驶路线等各种因素,其对大数据的需求量更大。

大数据应数量与质量并重,上下游公司协同配合

上述的语音识别、图片识别和自动驾驶等人工智能的应用,都需要基础数据作为支撑。度秘和微软小冰,需要提前为其输入大量语料,其再根据语料来构建算法和模型,并对其进行持续训练和持续提供最新热点语料,才能制造出一个跟得上时代的交互机器人。

而由于地域广阔,方言繁多,方言采集清洗就是一个巨大的挑战。对于微软小冰来说,要为其设定合适的年龄、性别和性格,这也需要为其提供适合其身份的语料。

博彦科技的基础数据处理团队及数据工程师团队一直持续在为微软小冰、百度度秘提供语料与机器训练服务。博彦科技与BAT、微软、谷歌等企业保持着多年的基础数据业务合作。

大数据是人工智能发展的基础,在大数据与人工智能的发展征途中,需要上下游各家公司的协同配合。大数据的设计算法和数据处理都需要大量的人工服务,有多少人工就能产生多少智能。大数据的质量和数量,影响着人工智能呈现效果。

在语音和图片识别领域,博彦科技拥有超过400人的全职自有团队,十余年的大数据服务经验,投入了大量科技研发力量以增强算法和数据服务,建立了完备的数据质量保障体系。

博彦科技副总裁孙铁林表示,中国人工智能的发展,也需要有扎实的大数据基础,需要进行大量的人力和资金投入。数据数量与质量都非常重要,如果只看重数量,而不看重质量,人工智能产品最终呈现的效果会受到很大影响。目前,google、微软等世界巨头科技企业,每年都会在人工智能领域投入大量预算用于提高数据数量与质量。

大数据的进一步应用,掘金1.6万亿美元市场

几十年前各国IT部门就已经在花力气研究人工智能,但因为当时的信息传输能力、计算能力有限,所以人工智能的发展和应用一直不温不火。但现在人工智能在各个领域迅速发展。未来用户看到的篮球比赛的精彩回放,可能就是来自于机器的自动抓取回放。一些创业公司也在力争让机器看得懂人类喜怒哀乐的表情,在婴儿的啼哭声音中发现其啼哭的原因。

根据戴尔公司总裁迈克尔·戴尔提供的数据,今天我们的处理能力、带宽、存储正以每年10倍的速度成倍增长,而未来15年我们的技术将会比现在更强大1000倍。今天破解一个人类基因组需要16个小时,2031年将只需要一秒。每一个新生儿在医院都将有个性化的医疗,电脑的处理能力将超过人脑,且成本将不到1美元。

现在一些智能手机、电视、无人机和其他基础设施都在连上互联网成为物联网的一部分,这会进一步催生数据中心和数据运营商的发展。云计算、大数据、人工智能是紧密关联的数字化变动动力。

在日前刚闭幕的中国第二届大数据产业峰会上,微软全球执行副总裁陆奇认为,如果能够善用大数据,全球企业将额外获得1.6万亿美元的数字红利,而中国将占据其中可观的份额。但数据只有经过精雕细琢才能体现真正的价值,未来在高级分析、机器学习、神经网络等领域,需要积累和发展先进的技术和经验,将其中的内涵和关联转化为智能硬件更适合使用的产品。

未来,大数据将广泛应用于电商等各个领域。比如目前中国的企业库存就有十几万亿,如果通过大数据减少库存甚至成为零库存,则将节省巨大的资源、产生巨大的价值。未来汽车零件磨损或发生交通事故,新的零件会及时自动生成订单,以便及时为车辆进行更换。

现在,已经发展出来能够模拟人脑的大型神经网络系统,在摩根定律的进化下,人类已经有了前所未有的计算能力。人工智能还发展出各种深度学习算法,机器可以利用大数据不断学习人类的智能行为,替代人类完成简单的体力甚至脑力劳动。

下一次的产业技术革命将建立在大数据基础上的人工智能技术上,中国有望成为全球领先的人工智能技术国家。现在,掘金其中正当时。
本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
3天前
|
机器学习/深度学习 数据采集 人工智能
AI赋能教育:深度学习在个性化学习系统中的应用
【10月更文挑战第26天】随着人工智能的发展,深度学习技术正逐步应用于教育领域,特别是个性化学习系统中。通过分析学生的学习数据,深度学习模型能够精准预测学生的学习表现,并为其推荐合适的学习资源和规划学习路径,从而提供更加高效、有趣和个性化的学习体验。
35 8
|
2天前
|
人工智能 搜索推荐 安全
AI技术在医疗领域的应用与挑战
【10月更文挑战第27天】 本文探讨了人工智能(AI)在医疗领域的应用,包括疾病诊断、药物研发和患者管理等方面。同时,也分析了AI在医疗领域面临的挑战,如数据隐私、伦理问题和技术局限性等。通过对这些方面的深入分析,我们可以更好地理解AI在医疗领域的潜力和发展方向。
90 59
|
2天前
|
人工智能 前端开发 Java
基于开源框架Spring AI Alibaba快速构建Java应用
本文旨在帮助开发者快速掌握并应用 Spring AI Alibaba,提升基于 Java 的大模型应用开发效率和安全性。
基于开源框架Spring AI Alibaba快速构建Java应用
|
2天前
|
人工智能 运维 NoSQL
云栖大会|多模+一体化,构建更高效的AI应用
在2024年云栖大会「NoSQL数据库」专场,多位知名企业和阿里云瑶池数据库团队的技术专家,共同分享了阿里云Lindorm、Tair、MongoDB和MyBase的最新进展与实践。Tair推出Serverless KV服务,解决性能瓶颈和运维难题;Lindorm助力AI和具身智能时代的多模数据处理;MongoDB云原生化提升开发效率;MyBase One打破云边界,提供云边端一体化服务。这些技术进展和最佳实践,展示了阿里云在NoSQL数据库领域的创新能力和广泛应用前景。
|
2天前
|
人工智能 JSON API
阿里云文档智能 & RAG解决方案:提升AI大模型业务理解与应用
阿里云推出的文档智能 & RAG解决方案,旨在通过先进的文档解析技术和检索增强生成(RAG)方法,显著提升人工智能大模型在业务场景中的应用效果。该方案通过文档智能(Document Mind)技术将非结构化文档内容转换为结构化数据,提取文档的层级树、样式和版面信息,并输出为Markdown和Json格式,为RAG提供语义分块策略。这一过程不仅解决了文档内容解析错误和切块丢失语义信息的问题,还优化了输出LLM友好的Markdown信息。方案的优势在于其多格式支持能力,能够处理包括Office文档、PDF、Html、图片在内的主流文件类型,返回文档的样式、版面信息和层级树结构。
21 2
|
2天前
|
存储 人工智能 大数据
物联网、大数据、云计算、人工智能之间的关系
物联网、大数据、云计算、人工智能之间的关系是紧密相连、相互促进的。这四者既有各自独立的技术特征,又能在不同层面上相互融合,共同推动信息技术的发展和应用。
17 0
|
3天前
|
机器学习/深度学习 人工智能 测试技术
探索AI在软件开发中的应用:提升效率与创新
【10月更文挑战第25天】本文探讨了AI在软件开发中的应用,包括自动化测试、代码生成与优化、智能项目管理等方面,介绍了TensorFlow、PyTorch和GitHub Copilot等实用工具,展望了AI在未来的潜力,并强调了AI对提升开发效率和创新能力的重要性。
|
5天前
|
机器学习/深度学习 人工智能 物联网
深度学习:物联网大数据洞察中的人工智能
深度学习:物联网大数据洞察中的人工智能
|
7天前
|
机器学习/深度学习 人工智能 搜索推荐
AI在医疗健康领域的应用与前景
随着科技的不断进步,人工智能(AI)技术已经深入到我们生活的方方面面,特别是在医疗健康领域。本文将探讨AI在医疗健康领域的应用现状、面临的挑战以及未来的发展前景。
|
7天前
|
人工智能 分布式计算 数据可视化
大模型私有化部署全攻略:硬件需求、数据隐私、可解释性与维护成本挑战及解决方案详解,附示例代码助你轻松实现企业内部AI应用
【10月更文挑战第23天】随着人工智能技术的发展,企业越来越关注大模型的私有化部署。本文详细探讨了硬件资源需求、数据隐私保护、模型可解释性、模型更新和维护等方面的挑战及解决方案,并提供了示例代码,帮助企业高效、安全地实现大模型的内部部署。
22 1