中科院院士张钹:用人工智能读懂大数据

简介:

大数据,“大”容量是多数人关注的焦点,但是却忽略了“内容”。

今天,第七届中国云计算大会第二天日程持续进行中,中国大数据专家委员会顾问、中国科学院院士张钹认为,现在大家比较关注形式和模式,却很少看到内容这个维度。

“大数据的处理问题仍然是个老问题,网络数据与以前的数据不同之处在于,虽然数据很多,但是有用的数据只有34%,好用的数据仅有7%,被分析的数据更是少到只有1%。”

下面张院士的这张幻灯片显示,在单机时代,计算机不需要了解具体内容是什么,然而发展到计算机网络时代,这发生了很大变化,计算机必须通过文本和图像了解用户的意图,输出用户需要的信息。

中科院院士张钹:用人工智能读懂大数据

但是,计算机能了解人类吗?答案是否定的,因为计算机不了解人类的语意。这也是在网络大数据处理过程中,遇到的第一道坎儿。

因此,网络时代信息处理提出了新需求:了解用户意图、用户兴趣、用户体验,将粗数据变成知识,理解信息的内容。这里所说的“理解”,有三个层次:自然语义,也就是了解人类说的是什么,说话人的用意和受众的感受。

这就是传统信息处理面临的根本性挑战,能不能解决呢?院士给出的答案是,很难!“过去我们在处理传统信息的时候,我们做的一切事情都是和形式有关,和语意没有关系。”

中科院院士张钹:用人工智能读懂大数据

中科院院士张钹:用人工智能读懂大数据

所以传统的信息处理,基本上很难去做网络数据的处理,那么问题来了,机器能不能处理语意?如何处理?这时候就不得不说说机器学习和深度学习了,它在特定的条件下具有抗干扰能力。

我们固然可以用知识推动的方法解决人类深思熟虑的行为,但是很难运用到感知的信息处理中,这个事情基本上是有人工多层神经网络做的。

院士提醒说,概率统计方法存在局限性,多层神经网络也不是完美的,不要以为深度学习已经完全可以超过人类的水平,这只是在一定的条件环境下。

展望未来,院士认为,未来的大方向是把传统信息处理和人工智能结合起来,也就是“数据驱动+知识驱动”。

原文发布时间为:2015年6月4日
本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。
相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
4月前
|
SQL 人工智能 分布式计算
ODPS十五周年实录|构建 AI 时代的大数据基础设施
本文根据 ODPS 十五周年·年度升级发布实录整理而成,演讲信息如下: 张治国:阿里云智能集团技术研究员、阿里云智能计算平台事业部 ODPS-MaxCompute 负责人 活动:【数据进化·AI 启航】ODPS 年度升级发布
216 9
|
5月前
|
人工智能 分布式计算 DataWorks
大数据AI产品月刊-2025年7月
大数据& AI 产品技术月刊【2025年7月】,涵盖7月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
6月前
|
数据采集 人工智能 大数据
10倍处理效率提升!阿里云大数据AI平台发布智能驾驶数据预处理解决方案
阿里云大数据AI平台推出智能驾驶数据预处理解决方案,助力车企构建高效稳定的数据处理流程。相比自建方案,数据包处理效率提升10倍以上,推理任务提速超1倍,产能翻番,显著提高自动驾驶模型产出效率。该方案已服务80%以上中国车企,支持多模态数据处理与百万级任务调度,全面赋能智驾技术落地。
775 0
|
3月前
|
存储 人工智能 安全
拔俗AI临床大数据科研分析平台:让医学研究更智能、更高效
阿里云原生AI临床大数据科研平台,打通异构医疗数据壁垒,实现智能治理、可视化分析与多中心安全协作,助力医院科研提速增效,推动精准医疗发展。
|
3月前
|
人工智能 Cloud Native 算法
拔俗云原生 AI 临床大数据平台:赋能医学科研的开发者实践
AI临床大数据科研平台依托阿里云、腾讯云,打通医疗数据孤岛,提供从数据治理到模型落地的全链路支持。通过联邦学习、弹性算力与安全合规技术,实现跨机构协作与高效训练,助力开发者提升科研效率,推动医学AI创新落地。(238字)
|
3月前
|
传感器 人工智能 监控
拔俗多模态跨尺度大数据AI分析平台:让复杂数据“开口说话”的智能引擎
在数字化时代,多模态跨尺度大数据AI分析平台应运而生,打破数据孤岛,融合图像、文本、视频等多源信息,贯通微观与宏观尺度,实现智能诊断、预测与决策,广泛应用于医疗、制造、金融等领域,推动AI从“看懂”到“会思考”的跃迁。
|
人工智能 大数据 安全
拔俗AI临床大数据科研分析平台:用智能技术加速医学研究新突破
AI临床大数据科研平台基于云原生架构,融合医疗NLP、联邦学习与智能分析技术,破解非结构化数据处理难、多源数据融合难、统计周期长等痛点,实现数据治理、智能分析与安全协作全链路升级,赋能医学科研高效、安全、智能化发展。
|
4月前
|
数据采集 传感器 人工智能
没有大数据,哪来人工智能?——聊聊“大数据喂养下的AI进化史”
没有大数据,哪来人工智能?——聊聊“大数据喂养下的AI进化史”
219 6