《中国人工智能学会通讯》——第11章 11.1 面向地理社会媒体的挖掘与应用

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第11章,第11.1节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

第11章 11.1 面向地理社会媒体的挖掘与应用

信息技术及互联网的发展,尤其是移动互联网的兴盛,正在深刻地影响改变着人们的生活。社会媒体,一种新型的允许人们创造并分享媒体信息的工具和平台,在近年来得到了飞速的发展,吸引着全球数以亿计的用户参与其中。伴随社会媒体的兴盛,随着地理位置定位技术的发展,基于用户地理位置的服务(Location Based Service, LBS)成为主流应用。用户通过移动设备的 GPS、WiFi、通信基站等方式获取地理位置信息使用各种各样的服务。社会媒体和地理位置的结合形成了地理社会媒体(Georeferenced Social Media)。地理社会媒体涵盖各种形式的带地理位置特征的社会媒体网站和服务。地理社会媒体使得用户可以随时随地的获取和分享信息,产生了海量的带地理位置信息的社会媒体内容数据,并且此类数据的规模呈爆炸性增长。地理社会媒体具有多模态、数据异质、大规模、空时性等特点,根据这些特点,如何对其涵盖的数据进行有效地挖掘和利用,从数据中提取知识进行服务,成为未来互联网应用和发展的关键。地理社会媒体包含了地理位置、用户、数据三个重要的元素,三个元素相互联系作用。一方面,用户产生大量的带地理位置标签的媒体数据,用户在这一数据产生过程中充当传感器感知该地理位置区域,因此通过汇聚挖掘这些带地理位置标签的媒体数据可以理解相应的地理位置区域;另一方面,用户产生大量的在线交互活动行为数据,与媒体内容数据结合研究可以分析理解用户。地理社会媒体研究目的是从用户感知的地理位置数据和社交内容挖掘知识用于理解用户和地理位置,从而进行有价值的服务。

图 1 给出了面向地理社会媒体的挖掘与应用的研究框架,包括数据感知获取、地理位置与用户知识挖掘、面向用户的基于地理位置的应用服务提供三个环节。数据感知获取指的是获取关于物理世界的动态韵律和人们在线上线下行为活动状况,以各种形式的数据格式记录存储到网络空间。数据感知主要依靠大量传感器和设备(手机、定向传感器、车辆、人等)不断地自动运行感知物理世界来完成,人作为传感器智能灵活地感知线下世界而产生多媒体内容数据是一种重要数据感知方式。此外,用户在网络空间产生丰富的网络行为活动,比如发表评论、收藏和交友互动等。这些丰富的线下物理感知数据与用户在线行为数据组成了地理社会媒体数据。image
在获取地理社会媒体数据后,对地理位置和用户进行建模分析、挖掘知识,以及理解地理位置和用户。这一阶段是面向地理社会媒体研究的核心环节。包括三个方面:① 以地理位置为对象,对带地理位置标签的数据进行挖掘分析,把多媒体语义理解与地理位置信息结合,提取地理位置知识,研究问题包括地理位置的建模识别、主题挖掘、观点挖掘及情感分析。地理位置的建模识别包括位置兴趣点(POI)的挖掘以及利用多媒体数据进行地理位置推断和定位,据此提出一种基于区域隐式支持向量机模型框架来挖掘一个地理区域中,具有代表性和判别性的地理属性帮助进行地理位置识别。此外,对挖掘的地理属性做了语义解释,可用于地理位置探索服务。地理位置主题挖掘指从带地理标签的数据中挖掘出地理位置上的兴趣主题(如旅游景点、购物、吃饭等)。由此提出一种自增量学习的地理兴趣点主题发现算法,其利用视觉文本信息能够自动地发现地理兴趣点的多个潜在主题,并进行可视化。地理位置观点挖掘及情感分析指的是从网络媒体数据中,挖掘地理位置实体的多模态主题特征及相对应的观点及情感极性,据此提出一种概率图模型来利用实体的多源媒体数据自动挖掘出实体的多模态主题特征与对应的观点,这样有效地丰富了地理实体的知识图谱维度。此外,对挖掘的观点做了情感分析,并联合主题特征观点进行了实体关联可视化。由挖掘的多模态主题特征与观点,设计实现了检索任务的应用。② 以用户为对象,挖掘用户产生的媒体内容数据和网络行为进行用户理解,具体解决的问题包括用户的属性推断和用户影响力分析。我们系统性地研究了性别、年龄、情感状况、职业、兴趣、情绪倾向六种用户属性,提出了一种关联性隐式支持向量机模型框架,并利用用户产生的媒体内容特征和属性关系进行用户属性推断。所提模型框架可以用于用户画像和基于属性的用户检索。同时提出一种基于超图学习的方法框架,并利用社会媒体网络中用户产生的媒体内容与链接关系挖掘主题敏感影响者。挖掘的主题敏感影响者可用于好友推荐和媒体信息推送服务。③ 用户与地理位置结合的建模分析,从地理社会媒体数据挖掘得到地理位置和用户的知识,需要把这种知识通过有价值的服务送达给终端用户,满足用户的需求。在这一方向,我们研究场景化个性化的地理位置探索推荐系统,对用户、场景地理信息、地理位置物品进行统一的建模,挖掘知识,为用户提供推送服务并帮助其进行地理位置探索。地理位置计算和用户建模挖掘得到的知识,可以很好嵌入到推荐服务系统中。针对用户在移动场景下的地理位置评分行为的特性,提出一种场景感知回归混合模型,对时空场景信息、用户兴趣、地理区域偏好、地理物品与内容进行统一建模并实现推荐。联合提出的模型,提出了一种用户意图和地理位置感知的概率矩阵分解模型,可以融入地理位置与用户的知识,有效地缓解了数据稀疏性问题从而提高了推荐性能,促使用户能够进行当地和新地点的探索发现。

在获取关于地理位置和用户的知识基础上,设计了提供面向用户的应用服务,包括知识可视化展示、识别预测、媒体内容信息探索发现和面向用户的个性化服务等。这一阶段是面向地理社会媒体研究的重要环节。

相关文章
|
11天前
|
人工智能 开发框架 安全
Serverless MCP 运行时业界首发,函数计算让 AI 应用最后一公里提速
作为云上托管 MCP 服务的最佳运行时,函数计算 FC 为阿里云百炼 MCP 提供弹性调用能力,用户只需提交 npx 命令即可“零改造”将开源 MCP Server 部署到云上,函数计算 FC 会准备好计算资源,并以弹性、可靠的方式运行 MCP 服务,按实际调用时长和次数计费,欢迎你在阿里云百炼和函数计算 FC 上体验 MCP 服务。
145 29
|
27天前
|
人工智能 数据可视化 API
36.7K star!拖拽构建AI流程,这个开源LLM应用框架绝了!
`Flowise` 是一款革命性的低代码LLM应用构建工具,开发者通过可视化拖拽界面,就能快速搭建基于大语言模型的智能工作流。该项目在GitHub上线不到1年就斩获**36.7K星标**,被开发者誉为"AI时代的乐高积木"。
136 8
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能应用领域有哪些
本文全面探讨了人工智能(AI)的应用领域和技术核心,涵盖医疗、交通、金融、教育、制造、零售等多个行业,并分析了AI技术的局限性及规避策略。同时,介绍了生成式人工智能认证项目的意义与展望。尽管AI发展面临数据依赖和算法可解释性等问题,但通过优化策略和经验验证,可推动其健康发展。未来,AI将在更多领域发挥重要作用,助力社会进步。
|
16天前
|
机器学习/深度学习 人工智能 自然语言处理
生成式人工智能的价值回归:重塑技术、社会与个体的发展轨迹
生成式人工智能(Generative AI)正以前所未有的速度重塑社会面貌。它从单一决策工具转变为创造性生产力引擎,推动知识生产、艺术创作与科学研究的发展。同时,其广泛应用引发社会生产力和生产关系的深刻变革,带来就业结构变化与社会公平挑战。此外,生成式AI还面临伦理法律问题,如透明性、责任归属及知识产权等。培生公司推出的生成式AI认证项目,旨在培养专业人才,促进技术与人文融合,助力技术可持续发展。总体而言,生成式AI正从工具属性向赋能属性升华,成为推动社会进步的新引擎。
|
17天前
|
存储 人工智能 监控
一键部署 Dify + MCP Server,高效开发 AI 智能体应用
本文将着重介绍如何通过 SAE 快速搭建 Dify AI 研发平台,依托 Serverless 架构提供全托管、免运维的解决方案,高效开发 AI 智能体应用。
2219 63
|
25天前
|
人工智能 API 计算机视觉
AI-ClothingTryOn:服装店老板连夜下架试衣间!基于Gemini开发的AI试衣应用,一键生成10种穿搭效果
AI-ClothingTryOn是基于Google Gemini技术的虚拟试衣应用,支持人物与服装照片智能合成,可生成多达10种试穿效果版本,并提供自定义提示词优化功能。
167 17
AI-ClothingTryOn:服装店老板连夜下架试衣间!基于Gemini开发的AI试衣应用,一键生成10种穿搭效果
|
28天前
|
机器学习/深度学习 人工智能 自然语言处理
多模态AI核心技术:CLIP与SigLIP技术原理与应用进展
近年来,多模态表示学习在人工智能领域取得显著进展,CLIP和SigLIP成为里程碑式模型。CLIP由OpenAI提出,通过对比学习对齐图像与文本嵌入空间,具备强大零样本学习能力;SigLIP由Google开发,采用sigmoid损失函数优化训练效率与可扩展性。两者推动了多模态大型语言模型(MLLMs)的发展,如LLaVA、BLIP-2和Flamingo等,实现了视觉问答、图像描述生成等复杂任务。这些模型不仅拓展了理论边界,还为医疗、教育等领域释放技术潜力,标志着多模态智能系统的重要进步。
150 13
多模态AI核心技术:CLIP与SigLIP技术原理与应用进展
|
8天前
|
人工智能 搜索推荐 Java
【重磅】JeecgBoot 里程碑 v3.8.0 发布,支持 AI 大模型、应用、AI 流程编排和知识库
JeecgBoot 最新推出了一整套 AI 大模型功能,包括 AI 模型管理、AI 应用、知识库、AI 流程编排和 AI 对话助手。这标志着其转型为 “AI 低代码平台”,旨在帮助开发者快速构建和部署个性化 AI 应用,降低开发门槛,提升效率。
50 12
|
2天前
|
开发框架 人工智能 Java
破茧成蝶:传统J2EE应用无缝升级AI原生
本文探讨了技术挑战和解决方案,还提供了具体的实施步骤,旨在帮助企业顺利实现从传统应用到智能应用的过渡。
破茧成蝶:传统J2EE应用无缝升级AI原生
|
17天前
|
人工智能 自然语言处理 安全
大企业的AI应用如何更懂业务?
数字经济推动中国经济高质量发展,大型企业数字化转型至关重要。AI技术浪潮下,国资委提出“应用领航、数据赋能、智算筑基”三大方向,深化AI与实体经济融合。CRM系统作为数智化基础设施,连接客户端与业务端,成为企业核心基座。以纷享销客为例,其通过“连接型CRM”打通数据壁垒,提供灵活组织架构配置,满足个性化需求。ShareAI平台赋能营销、销售和服务全链路智能化,确保数据安全并支持私有化部署。选择具备行业积淀和实战经验的CRM服务商,才能让数智化真正驱动业务增长与企业转型。
下一篇
oss创建bucket