5G+AIoT技术大趋势和产业机遇系列之 AI有多么不智能

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
简介: 过去几年时间,人工智能总伴随着莫名其妙的传说以及耸人听闻的新闻报道,AI需要祛魅。

作者介绍
   唐云峰,1999年创建“站长工厂”网站,提供网站建设技术与资讯、开源软件下载、托管应用、桌面虚拟化等服务。2009年起投身物联网与NLP(自然语言处理)领域,2017年担任中韩未来革新加速器(SKFI)社长,专注于IoT企业投资与技术赋能。
    2018年底成为2018~2019年度阿里云MVP,此次应阿里云开发者社区之邀,参与“MVP时间”策划的5G+AIoT系列专题创作。

内容概述
   “夏虫不可以语于冰者,笃于时也。”
    5G的想象空间与应用并不能在4G时代去规划,但从业者可以沿着4G技术对于现有应用与场景的支撑不足展开一些近期可能的产业机遇分析。
    AI与IoT目前的技术边界决定了AIoT的融合会产生什么样的效应或者说是技术工具,严格来讲作者是立足于互联网从业者角度去看待5G的产业发展的,所关注的也更多是应用场景。最后将以个人视角展开几个应用场景,管窥蠡测其中的工程难题与产业机遇。

文章目录

  1. 移动通讯与互联网应用演进与革新
  2. IoT发展现状(物联网这个事情有多么的不高级)
  3. AI有多么的不智能
  4. 如果把人类的历史看成IoT(万物互联)的演化历史
  5. 那么现有的技术会带给物联网什么样的未来呢?
  6. 实现AIoT(万物智能)会带给我们怎样的挑战并带来怎样的产业机遇

更新计划
   自2019年11月27日起,每周更新一篇,感谢关注,期待交流。虽然内容准备很正经,但是我尽量说人话,讲故事,谈场景。该系列自我要求:多一点感性认识,少一些理性分析。不是提倡反智,而是甘为搬运工。

为了减少劳动而更加努力劳动

看看标题都觉得这是《动物庄园》里的口号,我这里分享的是个人接触AI的故事。

数据库重构是一个重体力劳动

    1999年一位忘年交好友,做了一个人物数据库的网站,可以查询上千位名人的生平资料。后来,我们团队接手了这个项目的运营。人物的资料库从最初的1300多,扩展到2.6万条,相关的文章多达数万篇。
    最初的人物资料就是一篇篇文章,人物的各个属性都不是独立的字段。为了实现按照生卒年排序或查询,不得不对数据库进行重新设计。
    重新设计之后的数据库,需要把原先的资料按照新的字段进行填写。海量的工作对于我们之后5个兼职志愿者来说,兼职就是不可能。

有些工作是重复劳动

   愚公移山对于我们来说算是一种信念了,夜以继日,日复一日。两个多月过去了,资料转换仅仅完成了不到十分之一。
   渐渐的总结了一些规律出来,比如某些字段的开始总是有特定词语的。或者在出现某些词语的句子里面出现的数字,总是有特定的格式或者特定的意义的。
   于是我尝试编写了一个程序,把人物资料当中的生卒年,出生地,姓名等基础信息提取出来。当然使用的是全文检索的模式,虽然对于计算机来说是效率不高的一堆指令集合。
   但是这个程序却解放了我们,有点类似于很多AI的初学者用Python写的爬虫。处理了数据才有后面的分析数据。

关键词是什么?

   更大的调整自然发生在简单问题解决之后。
   每一位人物的简介、关键词都是人工添加的。在释放了大量的人力之后,我们不断折腾的路又一次开始走偏。
   每一篇文章需要完整阅读之后才能总结出关键词。我们尝试过词频统计的方式来总结关键词。然而那个时候我们弄出来的东西都是一些很奇怪的结果。因为中文分词,中文词语和英文词语最大的区别是,中文的语素之间是没有空格的。导致大量的“词语”并不是真正的词语,有一些是截断的内容。
   我们做了一个词典库,出现在词典里面的才能被认为是词语。然而,更棘手的问题出现了。统计出来的确实是一个词,但是有可能是从别的词上切下来的一部分。
   针对这种情况,又尝试着做了词语的权重。机械且传统的方式,调整了一个程序算是勉强能用了。因为再这样做下去,我们发现我们都可以做搜索引擎了(确实,但那是另外一个故事)。

根据描述判断好人还是坏人

   这只是一个比喻,我们团队发生过争论,要不要去判断一个人是什么职业、历史褒贬之类的信息。
   因为这些褒贬信息总是能够伴随着一些词语的词频展现出来。
   同样的,每一位历史人物的描述上也能够找到职业的归属。
   终于,我们基于朴素的统计方法和传统的语言学的知识无法解决我们的需求了。
   NLP(自然语言处理)进入了我的视野,然而当时能够找到的中文NLP一片荒凉,能够参考的只有哈佛的一些论文、哈尔滨工业大学、复旦大学搞得试验性的开源项目。

AI还只是个孩子,需要有人教

   当我费力地学会了一些Java的皮毛之后,更加费力地部署了FudanNLP,获得了前所未有的便利。
   依存句法分析、指代消解、分类、聚类想都不敢想的玩法出现在了面前。
   基于半监督学习,NLP提供给我一个新的思路。传统靠编程,AI靠教育。
    虽然NLP玩法很丰富,但是针对我们具体场景的需求则需要单独训练,我们的训练语料没有演示的语料那么齐全,还需要大量的标定工作。
   为了偷懒,付出了比踏踏实实做更高的成本。因为你需要教育个非人类物种理解人类的语言。为此,我学习了大量的数学相关的知识。作为一个文科生,被AI实实在在教育了一番——“不想当数学家的程序员不是一个好的语文老师。”

AI的工作方式有何不同?

   编程是通过告诉计算机要做什么,每一步操作都可以被预期,甚至出现的每一个bug都能找到原因。
   有传言AI的可预期只是在可以接受的概率下的可靠,甚至不知道AI是如何想的。
   其实,AI没有那么可怕。很多时候让我有了一些错觉,只是其中的数学方法藏的很深,深到了不容易甚至无法对应到现实意义当中。
   打比方是不准确的,但却容易让人理解。“教会了AI之后,AI按照你预想的结果不断修正自己的输出,如同耍猴人不停鞭打做错动作的猴子,耍猴人并不清楚猴子怎么想的,也不屑知道猴子怎么想。”
   或许正因为如此,让很多人对AI应用在涉及人类安全的领域,有一种莫名的恐惧。

当前AI的工作特点是简单重复

   大量简单重复的工作才是AI的应用领域,不论是写诗还是作曲,人脸识别或者语音控制。
   能否有更多的拓展呢?训练素材和算力才是制约,哪个领域的素材丰富需求的算力可承受,哪个领域的人工智能应用就发展得快。
   当前的好AI,是一个专家,只能完成特定任务的专家。

阿里云PAI平台&AI服务

   只要有标定好的数据,你可以不懂数学,不懂编程依然能够训练自己的人工智能算法。大家可以使用PAI,尝试一下,当一个人工智能教师。
   没有数据,也可以开始使用人工智能,语音识别、图像识别、翻译、自然语言处理等通用能力已经被阿里云做成了通用服务,不需要重复造轮子了。

下期预告

   本期通过介绍个人的AI接触故事,下一期我们将一起继续技术视角的人类历史课。

目录
相关文章
|
3天前
|
人工智能 自动驾驶 算法
智能时代的伦理困境:AI决策的道德边界
在人工智能技术飞速发展的今天,我们面临着前所未有的伦理挑战。本文探讨了AI决策中的道德边界问题,分析了技术发展与人类价值观之间的冲突,并提出了建立AI伦理框架的必要性和可能路径。通过深入剖析具体案例,揭示了AI技术在医疗、司法等领域的应用中所引发的道德争议,强调了在追求技术进步的同时,必须审慎考虑其对社会伦理的影响,确保科技发展服务于人类的福祉而非成为新的困扰源。
|
2天前
|
人工智能 自然语言处理 机器人
对话阿里云 CIO 蒋林泉:AI 时代,企业如何做好智能化系统建设?
10 月 18 日, InfoQ《C 位面对面》栏目邀请到阿里云 CIO 及 aliyun.com 负责人蒋林泉(花名:雁杨),就 AI 时代企业 CIO 的角色转变、企业智能化转型路径、AI 落地实践与人才培养等主题展开了讨论。
146 19
对话阿里云 CIO 蒋林泉:AI 时代,企业如何做好智能化系统建设?
|
23小时前
|
存储 人工智能 自然语言处理
高级 RAG 技术:提升生成式 AI 系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】
高级 RAG 技术:提升生成式 AI 系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】
高级 RAG 技术:提升生成式 AI 系统输出质量与性能鲁棒性【预检索、检索、检索后、生成优化等】
|
1天前
|
人工智能
1024 云上见 AI大模型助力客户对话分析 2000个智能台灯等你来领
1024 云上见 AI大模型助力客户对话分析 2000个智能台灯等你来领
13 3
|
1天前
|
人工智能 自然语言处理 数据挖掘
Claude 3.5:一场AI技术的惊艳飞跃 | AIGC
在这个科技日新月异的时代,人工智能(AI)的进步令人惊叹。博主体验了Claude 3.5 Sonnet的最新功能,对其卓越的性能、强大的内容创作与理解能力、创新的Artifacts功能、视觉理解与文本转录能力、革命性的“computeruse”功能、广泛的应用场景与兼容性以及成本效益和易用性深感震撼。这篇介绍将带你一窥其技术前沿的魅力。【10月更文挑战第12天】
8 1
|
3天前
|
人工智能 运维 监控
智能化运维:AI在IT运维中的挑战与机遇###
本文探讨了人工智能(AI)技术在IT运维领域的应用,重点分析了AI如何提升运维效率、减少故障恢复时间,并预测未来发展趋势。通过具体案例展示了AI在实际运维中的应用效果,同时指出当前面临的挑战和解决方案,为读者提供一个全面了解智能化运维的视角。 ###
|
2天前
|
人工智能 关系型数据库 数据中心
2024 OCP全球峰会:阿里云为代表的中国企业,引领全球AI网络合作和技术创新
今年的OCP(Open Compute Project)峰会于2024年10月14日至17日在美国加州圣何塞举行,在这场全球瞩目的盛会上,以阿里云为代表的中国企业,展示了他们在AI网络架构、液冷技术、SRv6和广域网等前沿领域的强大创新能力,持续引领全球合作与技术创新。
|
2天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维:AI在IT运维中的应用探索###
随着信息技术的飞速发展,传统的IT运维模式正面临着前所未有的挑战。本文旨在探讨人工智能(AI)技术如何赋能IT运维,通过智能化手段提升运维效率、降低故障率,并为企业带来更加稳定高效的服务体验。我们将从AI运维的概念入手,深入分析其在故障预测、异常检测、自动化处理等方面的应用实践,以及面临的挑战与未来发展趋势。 ###
|
4天前
|
机器学习/深度学习 人工智能 监控
探索AI技术在医疗健康领域的应用与挑战
【10月更文挑战第13天】 本文探讨了人工智能(AI)在医疗健康领域的多种创新应用,包括疾病诊断、个性化治疗、患者监护和药物研发等方面。同时,文章也分析了当前AI技术在实际应用中面临的挑战,如数据隐私、算法透明度、监管问题等,并提出了一些可能的解决思路。通过综合分析,本文旨在为读者提供一个关于AI在医疗领域应用现状及未来的全面视角。
22 3
|
2天前
|
机器学习/深度学习 人工智能 安全
智能时代的隐私守护者:AI加密技术的崛起与挑战###
本文深入探讨了人工智能(AI)在数据加密领域的创新应用,分析了AI如何增强数据安全性,同时也指出了面临的挑战和未来发展趋势。通过具体案例分析,展现了AI加密技术在保护个人隐私与促进数据安全方面的潜力,为读者提供对未来智能时代隐私保护的深刻洞见。 ###