目前网络上开始留行聊天机器人。小布,小I,以及朗玛的UC,还有各种形形色色的机器人;不一而足。聊天机器人产生的背景是互联网进入中国将近十年,大量的网站和丰富的信息,拥挤的网络已经成为了人民生活的一部分;但与之而来的是时间上的浪费,就像《手机》中说的,人说的话90%是废话;套用一下,可以说花在互联网上的时间90%是浪费。 如何建立属于自己的搜索引擎,以便方便快捷地收集对自己有用的信息?这时候,聊天机器人出现了。其实聊天机器人出现的时间很早,可以追述到5年以前。但是目前中文网上的聊天机器人与以往有很大的不同,它可以自己学习,可以查询各种东西:股票,手机,身份证。。。而且,还可以象个“至尊宝”一样和你聊天。可惜的是,它没有摆脱“搜索引擎+网聊”的角色,只能靠版主来修改,增加内容。 后来出现了可以架设自己的聊天机器人的软件,捷博MSN精灵。好像是一个公司开发的免费的聊天软件,你可以自己教你的机器人聊天,也可以上网下载插件,如某个大学的某个系的课程表,如果这个系有人把相关的内容教了他的机器人,他和他的同学都可以方便地通过和机器人沟通了解到相关的信息。
笔者认为,这种机器人的使用范围将比小布,小I之类的只能版主来修改、增加内容的做法的机器人的做法要广范的多。 因为这是一个“我为人人,人人为我”的做法,大家可以自己做搜索插件,也可共享插件;同一个生活习惯的人可以共享数据表以便查询单位的通信录,同学的生日,客户的名单。 互联网的出现对传统媒体的产生冲击的原因是因为传统的媒体是单向的,而互联网是双向的;而且更为方便快捷;捷博MSN精灵和小布小I的比较类似于此;小布小I等的机器人是单向的(版主->用户),而捷博MSN精灵是双向的(大家共享信息,共享搜索插件),而且更贴近最终用户的需求。
什么是语义网?语义网就是一种能让计算机理解的新型Web内容形式,将引发对新的未知可能性的探索. 至今为止,WWW大部分都被用作为人们服务的文档媒体,而不是能够自动控制的信息。为网页扩展面向计算机的数据,并且增加专为计算机使用的文档,我们就可以把Web变成一个语义网络。 计算机会根据关键名称定义的超链接和逻辑推理规则发现语义数据的含义。这种基础设施的最终结果就是能够刺激开发自动化的网络服务,例如强大的代理。 普通用户能够用现成的有语义标记功能的软件编写语义网页,增加新的定义和规则。 通俗一点的说,就是今后的互联网即可以给人看的,也能被计算机理解;你的计算机看了网页后,会帮助你做事。也就是说:计算机可以阅读互联网。(你是会感到兴奋,还是害怕?)
大部分今天Web上的内容是设计给人阅读的,而不是让计算机程序按其意义进行操作的。计算机能熟练地解析网页的版面,知道哪里是标题,哪里有与其他页面的链接。但是,一般来说,计算机没有可靠的方法来处理语义,比方说能告诉我们:这是Hartman and Strauss 诊所的网页,它能连接到Hartman医生的简历。 它仅仅知道,这是你要看的网页。 语义网将结构赋予网页上有意义的内容。在这样的环境下,漫游于各个页面之间的软件代理就能容易地为用户完成一些复杂的任务了。到达医院网页的代理将不仅知道存在类似“治疗、药物、体格检查”的关键字,还知道Hartman医生周一、周三、周五在这家医院上班,脚本程序对日期范围采用年月日格式,并按此格式返回预约时间。另外,无需高性能的机器和人工智能,它就能“知道”所有这些情况。这些语义是由医院办公室主任编码在网页中的。他并未学习过基本的计算机科学课程,他只是使用市场上的软件,利用理疗协会网页的资源,自己完成的。 语义网并非独立的另一个Web,而是现在的Web的一个延伸。在其中,信息有定义完好的含意,更利于人机之间的合作。将语义网融入现在Web结构的初步努力已经在进行中了。
不久的将来,当机器有更强的能力去处理和“理解”现在它仅仅进行显示的数据时,我们将看到很多重要的新功能。 笔者认为,在互联网向语义网迈进的过程种,起主要作用的,将是形形色色的软件(搜索引擎,聊天机器人,或是今后更强大的软件等)。当语义网的标准制定之后,人类会发明大量的代理软件,运行在各自的PC上,以帮助自己完成日常的工作,生活的各项需求。人类将通过计算机来阅读互联网,而不是开机就打开IE,MSN,QQ等类似的软件花上几个小时才能得到今天工作的各方面的信息。 人类的互联网浏览习惯将被语义网的出现改变,就象电视的遥控器的出现导致了人们看电视的习惯改变一样。
(有关语义网的内容摘自 http://www.isaacmao.com/works/essays/archives/SementicWeb/sementic_web.htm)
笔者认为,这种机器人的使用范围将比小布,小I之类的只能版主来修改、增加内容的做法的机器人的做法要广范的多。 因为这是一个“我为人人,人人为我”的做法,大家可以自己做搜索插件,也可共享插件;同一个生活习惯的人可以共享数据表以便查询单位的通信录,同学的生日,客户的名单。 互联网的出现对传统媒体的产生冲击的原因是因为传统的媒体是单向的,而互联网是双向的;而且更为方便快捷;捷博MSN精灵和小布小I的比较类似于此;小布小I等的机器人是单向的(版主->用户),而捷博MSN精灵是双向的(大家共享信息,共享搜索插件),而且更贴近最终用户的需求。
什么是语义网?语义网就是一种能让计算机理解的新型Web内容形式,将引发对新的未知可能性的探索. 至今为止,WWW大部分都被用作为人们服务的文档媒体,而不是能够自动控制的信息。为网页扩展面向计算机的数据,并且增加专为计算机使用的文档,我们就可以把Web变成一个语义网络。 计算机会根据关键名称定义的超链接和逻辑推理规则发现语义数据的含义。这种基础设施的最终结果就是能够刺激开发自动化的网络服务,例如强大的代理。 普通用户能够用现成的有语义标记功能的软件编写语义网页,增加新的定义和规则。 通俗一点的说,就是今后的互联网即可以给人看的,也能被计算机理解;你的计算机看了网页后,会帮助你做事。也就是说:计算机可以阅读互联网。(你是会感到兴奋,还是害怕?)
大部分今天Web上的内容是设计给人阅读的,而不是让计算机程序按其意义进行操作的。计算机能熟练地解析网页的版面,知道哪里是标题,哪里有与其他页面的链接。但是,一般来说,计算机没有可靠的方法来处理语义,比方说能告诉我们:这是Hartman and Strauss 诊所的网页,它能连接到Hartman医生的简历。 它仅仅知道,这是你要看的网页。 语义网将结构赋予网页上有意义的内容。在这样的环境下,漫游于各个页面之间的软件代理就能容易地为用户完成一些复杂的任务了。到达医院网页的代理将不仅知道存在类似“治疗、药物、体格检查”的关键字,还知道Hartman医生周一、周三、周五在这家医院上班,脚本程序对日期范围采用年月日格式,并按此格式返回预约时间。另外,无需高性能的机器和人工智能,它就能“知道”所有这些情况。这些语义是由医院办公室主任编码在网页中的。他并未学习过基本的计算机科学课程,他只是使用市场上的软件,利用理疗协会网页的资源,自己完成的。 语义网并非独立的另一个Web,而是现在的Web的一个延伸。在其中,信息有定义完好的含意,更利于人机之间的合作。将语义网融入现在Web结构的初步努力已经在进行中了。
不久的将来,当机器有更强的能力去处理和“理解”现在它仅仅进行显示的数据时,我们将看到很多重要的新功能。 笔者认为,在互联网向语义网迈进的过程种,起主要作用的,将是形形色色的软件(搜索引擎,聊天机器人,或是今后更强大的软件等)。当语义网的标准制定之后,人类会发明大量的代理软件,运行在各自的PC上,以帮助自己完成日常的工作,生活的各项需求。人类将通过计算机来阅读互联网,而不是开机就打开IE,MSN,QQ等类似的软件花上几个小时才能得到今天工作的各方面的信息。 人类的互联网浏览习惯将被语义网的出现改变,就象电视的遥控器的出现导致了人们看电视的习惯改变一样。
(有关语义网的内容摘自 http://www.isaacmao.com/works/essays/archives/SementicWeb/sementic_web.htm)