开发者社区> 行者武松> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

中国工程院院士方滨兴:网络空间大搜索

简介:
+关注继续查看

2015年12月10-11日,由中国工程院、中国南京市政府共同主办,江苏省未来网络创新研究院(FNII)与下一代互联网工程中心(BII)承办,备受瞩目的2015中国未来网络发展与创新论坛在南京召开。

中国工程院院士方滨兴:网络空间大搜索

中国工程院院士方滨兴

来自中国工程院院士方滨兴在大会中做了主题为“网络空间大搜索”的演讲,在演讲中,方滨兴讲到,我今天报告的题目是网络空间大搜索。我们说现在的大数据到来是获得了很多新的数据来源机会,现在不仅仅是从互联网获得信息,还可以从物联网获得信息,从社交网络、移动网络、地理信息,收取数据的源头发生了巨大的变化,我们现在讨论网络空间,是可以处理交换数字信息与人互动的虚拟空间。

方滨兴提出三个要点,一个是它是数据加工处理的要点,第二个是与人互动,第三个是虚拟空间。展开说是它包括互联网、电信网、广电网、控制系统等等,网络通讯信息系统。并且还要以这些信息系统为平台进行信息技术活动的空间,这些空间展开我们说到未来网纳入到空间之中,刚刚李院士也提到谷歌高层提到了将来是要由互联网先往,物联网取代互联网,这里面可能有一点偏差。实际上我们现在把网络空间称为泛在网。

而我们搜索内容一个是存在性搜索。这个信息是不是在网站中,我们现在关注的不仅仅是信息本身,这个信息还包括时间,包括了地理空间,比如说地图的搜索。而且信息本身还包括了人、物体和我们的内容。这样我们的信息也在扩张,所以它往两个三维扩张,一个信息是人、物体、内容本身,还有一个人、信息、空间/时间。传统的是简单找一个词存在不存在,然后发展找一个语意理解,再往上是服务搜索,比如说北京时间或者天气预报,比如说北京限号,这实际上是一种服务。

大搜索面对的宏观问题

对于这个大搜索面对的宏观问题。方滨兴认为可以看成这几个部分,首先在泛在网里面获取信息,获取当然需要有各种方面的能力,包括互联网、传感网获取信息。第二个我们要准确理解你要干什么,就有情景感知,第三那些信息要有有效组织,现在专家系统还是可以不受时间限制,我们说现在网上说了很多事,推一下今天有什么热点,它可以慢慢算,但是搜索引擎不能慢慢算,一定是秒级响应,我们传统的搜索引擎也不是现算,都是把东西拿下来然后快速索引,这个也是一样,我需要把所有知识构造起来,怎么构造?就是一个关键问题,我们说知识库构建的问题。最后我们还是要给解决方案。

哪个解决方案符合你的需求,这里面有上亿的方案,这里面精确匹配而且对它有一个核心判断。当然有这些还不够,大数据对隐私发现的能力会非常强,我们要对这个能力做一个安全保护,核心是隐私保护。这样的话我们把它总结,它是有5个S,大数据5个V数据巨大产生数据快,类型复杂不确定,再加上潜在价值,实际上大搜索也是有一定对应的5个S,首先是大在一个大空间搜索,然后要把信息综合,第四要给出的是智慧解决方案,第五是要有安全保障。

泛网获取支持定向信息获取,当然了这些信息和传统不一样,因为信息量太大,传统信息量相对简单,我们就把它倒排过来,我们先想到我们大数据可能是提供上千亿个答案,我们想想搜索引擎也是一样,我们可能关注上千亿的关键词,现在将来也同样,可能我准备上千个答案,就去搜索信息,这样的话对一个答案来说就很小了,这个大搜索空间搜索的信息就一定是重点放在有目的获取,然后以便你事后的组织。

感知也一样,传统的感知你给我什么词,当然现在发生变化,我们可以感知你的位置信息和历史查询信息,将来是在语义上感知,比如说现在大家都在干什么,比如说我查南京未来网,可能关心的就是开大会了,这个时候我们就把感知推到一个新的高度,还有人的历史查询,还有问题表达方式,包括他的情感。情感能起到很重要的作用。

搜索引擎的搜索范围的变化

搜索引擎的搜索范围有三个方面的变化,一个是搜索空间有变化,其次是搜索信息有了扩张,原来可以搜索信息现在可以搜索物品,还能搜索到人,这个人的情况。第三就是我们给的答案就是一大堆标量,现在可以给了向量。

最后,方滨兴给出这样的一个定义,网络空间大搜索是实施快速搜索物体、人物信息及时间用户属性,能够对网络空间各种对象高效的组织和索引,提供智慧解答,也是我刚刚说的把搜索结果变成解决方案,向网络要智慧,搜索结果从标量到向量。我们说有五大技术,宽带、移动网络、大数据云计算,我们把宽带扩展到未来网,这些都是我们关心的,要不然就是依赖这个手段做事情。新的技术促进了大数据的推进,从两个角度来看。没有搜索引擎就没有互联网应用的今天,不要把搜索引擎看成谷歌、百度,携程、当当也是搜索引擎,我们现在推物联网推更多的网络,哪怕我们推未来网,没有搜索引擎都推到此为主就推不动了,听了物联网有人查到物联网的东西吗?查不到因为没有搜索引擎。第二个大数据这么海量的今天看的东西都变成噪音了,我们要知道什么是真正我需要的,这个要智慧,通过智慧解决大家的需求。


原文发布时间为:2015年12月10日

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
面试官:MySQL 中的 3 大日志是指哪些?面试必问
日志是 mysql 数据库的重要组成部分,记录着数据库运行期间各种状态信息。mysql日志主要包括错误日志、查询日志、慢查询日志、事务日志、二进制日志几大类。 作为开发,我们重点需要关注的是二进制日志( binlog )和事务日志(包括redo log 和 undo log ),本文接下来会详细介绍这三种日志。
86 0
《大数据、小数据、无数据:网络世界的数据学术》一 导读
相对于一般商品而言,研究类数据(research data)的利用价值或多或少。数据管理计划、数据发布需求以及由资助机构、学术期刊和科研机构提出的积极政策都很难适应数据多样性和跨领域的新实践。除了按例定义之外,很少有政策尝试给出数据的定义。
1374 0
(转) 干货 | 图解LSTM神经网络架构及其11种变体(附论文)
干货 | 图解LSTM神经网络架构及其11种变体(附论文) 2016-10-02 机器之心   选自FastML 作者:Zygmunt Z. 机器之心编译  参与:老红、李亚洲   就像雨季后非洲大草原许多野生溪流分化成的湖泊和水洼,深度学习已经分化成了各种不同的专门架构。
2108 0
【工业串口和网络软件通讯平台(SuperIO)教程】七.二次开发服务驱动
SuperIO相关资料下载:http://pan.baidu.com/s/1pJ7lZWf 1.1    服务接口的作用  围绕着设备驱动模块采集的数据,根据需求提供多种应用服务,例如:数据上传服务、数据请求服务、4-20mA服务、短信服务、LED服务以及OPC服务等。
865 0
【工业串口和网络软件通讯平台(SuperIO)教程】三.二次开发流程
1.1    二次开发流程图   1.2    引用相关组件 找到“开发包”,引用里边的相关组件。如下图:   1.3    开发设备驱动模块 1.3.1    开发发送协议驱动   继承SuperIO.Device.DeviceSendProtocol接口,覆盖相关的FunctionXX接口函数,进行数据打包,“XX”代表16进制的数据,例如:Function31函数通过this.SendProtocol.GetSendCmdBytes(addr, new byte[] { 0x32 }, null, false)函数进行调用。
712 0
+关注
行者武松
杀人者,打虎武松也。
文章
问答
文章排行榜
最热
最新
相关电子书
更多
演讲二:IPv6时代的中国机遇-邬贺铨,CNGI专家委员会主任、中国工程院院士
立即下载
\"一所云上的新型大学——国家开放大学“六网融通” 教学模式的实践与探索 \"
立即下载
2017-2018年 “云栖奖”产业战略研究报告
立即下载