大数据时代下的意图搜索 个性化服务是关键

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

意图搜索起源于互联网搜索引擎,是基于互联网上海量的无组织、异构、动态的数据与信息环境下搜索引擎不能准确理解用户的搜索意图而提出的,利用如神经网络算法等机器学习方法实现智能化的自动搜索,从而更加精准、主体的提供个性化的服务。

大数据时代下的意图搜索个性化服务是关键

一、目的意义

大数据时代,任何网络行为所留下的“蛛丝马迹”都以数据的形式隐藏在大数据中,正所谓“存在就有痕迹,联系就有信息”,通过应用物联网、大数据、人工智能等技术,构建网络空间中行为事件、思想事件等模型。在实体空间和虚拟空间中全面收集、甄别、过滤、分类、整合人的存在痕迹和联系信息,关注人物或事件间联系链,从而实现网络空间中存在的各种意图,完成对意图产生源头、传播途径和发展趋势的全方位描述,达到对个人和组织的所思所想行为所在的全面搜索和分析。做到提前预警、智能决策。

2013年的“棱镜门”事件为国家安全敲响警钟的同时我们也看到正是有了“大数据”的存在,才让“棱镜”项目得以实施。目前,我国面临的安全形势严峻,反恐问题更是当前国际面临的重要安全问题,大数据环境下的意图搜索将能积极应对新时期各种安全威胁,运用大数据技术和人工智能技术进行深入分析,实现对安全事件的准确识别和提前预警,有力提升我国基于大数据的国家安全防护能力。

二、关键技术

1、人工智能技术:意图搜索引擎构建了人与信息的意识主动化的连接,通过不断的交换学习,形成模拟人脑的智能系统,从而实现人与机器的相互了解,因此人工智能技术将是意图所搜的核心技术。主要相关的人工智能技术有:机器深度学习、计算机神经网络、脑机接口、自然语言处理等技术。

2、大数据技术:而对数据进行收集、存储、处理、挖掘分析是搜索技术的基本环节,因此以数据存储、数据挖掘等技术为主的大数据技术也是意图搜索的关键技术之一。主要相关的大数据技术有:数据采集、数据存储、数据处理、数据挖掘与分析技术等。

3、物联网技术:随着传感器的发展和移动化的能力,意图搜索也呈现多样化的形态。因此,以传感器技术为主的物联网技术也是意图搜索的关键技术之一。

4、其他信息技术:此外,搜索实现从传统搜索到人工智能的过渡,还需要分词技术、硬件存储、云计算、超级计算、知识图谱等相关技术的成熟。

三、目标成果

大数据环境下的意图搜索技术将是构建一个构建虚拟空间信息社会雷达系统。该系统的主体是搭建一个完整的知识库,开发意图搜索引擎系统、并构建云计算与大数据的基础设施平台。

搜索引擎系统:搜集器、控制器、索引器、检索器、用户接口、处理分析系统

技术成果:人工智能、智能推理及知识研发、信息提取与分析技术、虚拟化工具、系统运行保障研发、系统算法、信息检索能力研发等技术上的突破成果。

四、国内外状况

1、美国

(1)美国技术优势明显

以微软和Google为代表的互联网巨头技术和应用皆处于领先地位。微软亚洲研究院的人立方关系搜索提供的搜索结果中,将所有信息都按照“人”进行重新整合,以人与人之间的关系为纽带,将埋藏在网络信息海洋中的“人”的信息连接汇总,图文并茂地展现出来,开启的意图搜索的新篇章。棱镜门事件以来,NSA的全球监控行为遭到各国政府和人民的谴责,但美国情报部门所展现的大数据和信息安全技术实力不容忽视。Accumulo数据库系统是NSA企业架构的核心。大多数NSA的关键分析应用都运行在Accumulo上,从技术角度看,NSA已经能够识别网络上的各种可疑行为和个人,可以说美国政府在相关技术已走到了Google、微软等互联网巨头之前。

(2)政府支持力度大

美国在相关技术的研发上给予高度重视。奥巴马政府大数据研究和发展倡议中推出的XDATA项目将在四年里耗费2500万美元来开发计算技术和防护数据软件。2014年美国国防高级研究计划局(DARPA)启动其“大机理”项目,目的是发展可以发现隐藏在大数据中的因果关系模型。美国国防部每年投入2.5亿美元资助利用海量数据的新方法研究,并将传感、感知和决策支持结合在一起,制造能自己运行和做出决策的自治系统,为军事行动提供更好的支持。NSA在大数据项目的规模、可扩展性、安全性在很多方面甚至超过了Google、亚马逊和苹果这样的大型互联网企业。NSA旗下的风险投资公司In-Q-Tel迄今已经投资了200多个云计算、大数据、搜索与分析创业项目。美国国土安全部正在开展“可视化和数据分析卓越中心”项目,通过对大规模异构数据的研究,使应急救援人员能够解决人为或自然灾害、恐怖主义事件、网络威胁等方面的问题。

(3)美军利用大数据搜索提升侦查和反恐能力

美军正在开发的新一代大数据系统,能够通过计算机的速度和精度以及人的敏捷性,来理解和解释现实世界,协助指挥官和分析人员将以100倍于当前的速度来理解传感器收集的海量数据。例如,当阿富汗境内的大毒枭准备为基地组织等恐怖分子提供资金时,美军的情报分析人员能够借助大数据技术,把作战方案库里的数据与有关基地组织情况库里的资金数据进行实时、自主关联,指导美军先敌一步采取行动。

在美国国防部的资助下,美国“记录未来”公司,专门研究如何通过分析互联网信息,特别是“脸谱”、“推特”等社交网站,预先察知恐怖袭击等重大事件。2013年6月,美国国家安全局局长兼美国赛博司令部司令亚历山大在参加众议院特设情报委员会听证会时承认,通过秘密进行的“棱镜”等监视项目,美国政府至少挫败了50起恐怖袭击事件。这是大数据技术运用的成功案例。

2、我国的发展现状

在我国百度、搜狗、360等互联网公司以及海康威视等安防企业处于技术和应用的前沿。从整体上来看,在商业开放和应用方面尚具备一定的国际竞争力,但从大数据智能搜索应用于国家安全防护上来看,我国在此方面与美国尚存在着较大的差距。


本文作者:佚名

来源:51CTO

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
自然语言处理 大数据 应用服务中间件
大数据-172 Elasticsearch 索引操作 与 IK 分词器 自定义停用词 Nginx 服务
大数据-172 Elasticsearch 索引操作 与 IK 分词器 自定义停用词 Nginx 服务
63 5
|
1月前
|
存储 数据采集 监控
大数据技术:开启智能决策与创新服务的新纪元
【10月更文挑战第5天】大数据技术:开启智能决策与创新服务的新纪元
|
3月前
|
DataWorks Kubernetes 大数据
飞天大数据平台产品问题之DataWorks提供的商业化服务如何解决
飞天大数据平台产品问题之DataWorks提供的商业化服务如何解决
|
21天前
|
机器学习/深度学习 搜索推荐 大数据
大数据与医疗健康:个性化治疗的未来
【10月更文挑战第31天】大数据正以前所未有的方式重塑医疗健康领域,推动个性化治疗从理论走向现实。本文探讨了大数据在医疗健康中的应用,特别是在推动个性化治疗发展方面的潜力与挑战,包括数据挖掘、电子健康记录、远程医疗等方面的技术创新,以及面临的数据安全和隐私保护等问题。未来,大数据将助力医疗健康领域更加智能和人性化。
|
1月前
|
消息中间件 监控 Ubuntu
大数据-54 Kafka 安装配置 环境变量配置 启动服务 Ubuntu配置 ZooKeeper
大数据-54 Kafka 安装配置 环境变量配置 启动服务 Ubuntu配置 ZooKeeper
77 3
大数据-54 Kafka 安装配置 环境变量配置 启动服务 Ubuntu配置 ZooKeeper
|
4月前
|
存储 前端开发 数据管理
大数据处理问题之帮助LLM理解用户的意图如何解决
大数据处理问题之帮助LLM理解用户的意图如何解决
|
1月前
|
存储 分布式计算 druid
大数据-155 Apache Druid 架构与原理详解 数据存储 索引服务 压缩机制
大数据-155 Apache Druid 架构与原理详解 数据存储 索引服务 压缩机制
53 3
|
2月前
|
数据采集 分布式计算 MaxCompute
MaxCompute 分布式计算框架 MaxFrame 服务正式商业化公告
MaxCompute 分布式计算框架 MaxFrame 服务于北京时间2024年09月27日正式商业化!
90 3
|
3月前
|
机器学习/深度学习 分布式计算 BI
MaxCompute 与阿里云其他服务的协同工作
【8月更文第31天】在当今的数据驱动时代,企业需要处理和分析海量数据以获得有价值的洞察。阿里云提供了一系列的服务来满足不同层次的需求,从数据存储到高级分析。MaxCompute(原名 ODPS)作为阿里云的大规模数据处理平台,提供了强大的计算能力和丰富的功能,可以与阿里云的其他服务无缝集成,形成完整的大数据解决方案。本文将探讨 MaxCompute 如何与其他阿里云服务协同工作,包括存储服务 OSS、数据分析服务 Quick BI 以及机器学习平台 PAI。
56 1
|
3月前
|
监控 数据可视化 前端开发
【前端】政务服务大数据可视化监控平台(源码+html+css+js)
【前端】政务服务大数据可视化监控平台(源码+html+css+js)
下一篇
无影云桌面