第11章 11.1 面向地理社会媒体的挖掘与应用
信息技术及互联网的发展,尤其是移动互联网的兴盛,正在深刻地影响改变着人们的生活。社会媒体,一种新型的允许人们创造并分享媒体信息的工具和平台,在近年来得到了飞速的发展,吸引着全球数以亿计的用户参与其中。伴随社会媒体的兴盛,随着地理位置定位技术的发展,基于用户地理位置的服务(Location Based Service, LBS)成为主流应用。用户通过移动设备的 GPS、WiFi、通信基站等方式获取地理位置信息使用各种各样的服务。社会媒体和地理位置的结合形成了地理社会媒体(Georeferenced Social Media)。地理社会媒体涵盖各种形式的带地理位置特征的社会媒体网站和服务。地理社会媒体使得用户可以随时随地的获取和分享信息,产生了海量的带地理位置信息的社会媒体内容数据,并且此类数据的规模呈爆炸性增长。地理社会媒体具有多模态、数据异质、大规模、空时性等特点,根据这些特点,如何对其涵盖的数据进行有效地挖掘和利用,从数据中提取知识进行服务,成为未来互联网应用和发展的关键。地理社会媒体包含了地理位置、用户、数据三个重要的元素,三个元素相互联系作用。一方面,用户产生大量的带地理位置标签的媒体数据,用户在这一数据产生过程中充当传感器感知该地理位置区域,因此通过汇聚挖掘这些带地理位置标签的媒体数据可以理解相应的地理位置区域;另一方面,用户产生大量的在线交互活动行为数据,与媒体内容数据结合研究可以分析理解用户。地理社会媒体研究目的是从用户感知的地理位置数据和社交内容挖掘知识用于理解用户和地理位置,从而进行有价值的服务。
图 1 给出了面向地理社会媒体的挖掘与应用的研究框架,包括数据感知获取、地理位置与用户知识挖掘、面向用户的基于地理位置的应用服务提供三个环节。数据感知获取指的是获取关于物理世界的动态韵律和人们在线上线下行为活动状况,以各种形式的数据格式记录存储到网络空间。数据感知主要依靠大量传感器和设备(手机、定向传感器、车辆、人等)不断地自动运行感知物理世界来完成,人作为传感器智能灵活地感知线下世界而产生多媒体内容数据是一种重要数据感知方式。此外,用户在网络空间产生丰富的网络行为活动,比如发表评论、收藏和交友互动等。这些丰富的线下物理感知数据与用户在线行为数据组成了地理社会媒体数据。
在获取地理社会媒体数据后,对地理位置和用户进行建模分析、挖掘知识,以及理解地理位置和用户。这一阶段是面向地理社会媒体研究的核心环节。包括三个方面:① 以地理位置为对象,对带地理位置标签的数据进行挖掘分析,把多媒体语义理解与地理位置信息结合,提取地理位置知识,研究问题包括地理位置的建模识别、主题挖掘、观点挖掘及情感分析。地理位置的建模识别包括位置兴趣点(POI)的挖掘以及利用多媒体数据进行地理位置推断和定位,据此提出一种基于区域隐式支持向量机模型框架来挖掘一个地理区域中,具有代表性和判别性的地理属性帮助进行地理位置识别。此外,对挖掘的地理属性做了语义解释,可用于地理位置探索服务。地理位置主题挖掘指从带地理标签的数据中挖掘出地理位置上的兴趣主题(如旅游景点、购物、吃饭等)。由此提出一种自增量学习的地理兴趣点主题发现算法,其利用视觉文本信息能够自动地发现地理兴趣点的多个潜在主题,并进行可视化。地理位置观点挖掘及情感分析指的是从网络媒体数据中,挖掘地理位置实体的多模态主题特征及相对应的观点及情感极性,据此提出一种概率图模型来利用实体的多源媒体数据自动挖掘出实体的多模态主题特征与对应的观点,这样有效地丰富了地理实体的知识图谱维度。此外,对挖掘的观点做了情感分析,并联合主题特征观点进行了实体关联可视化。由挖掘的多模态主题特征与观点,设计实现了检索任务的应用。② 以用户为对象,挖掘用户产生的媒体内容数据和网络行为进行用户理解,具体解决的问题包括用户的属性推断和用户影响力分析。我们系统性地研究了性别、年龄、情感状况、职业、兴趣、情绪倾向六种用户属性,提出了一种关联性隐式支持向量机模型框架,并利用用户产生的媒体内容特征和属性关系进行用户属性推断。所提模型框架可以用于用户画像和基于属性的用户检索。同时提出一种基于超图学习的方法框架,并利用社会媒体网络中用户产生的媒体内容与链接关系挖掘主题敏感影响者。挖掘的主题敏感影响者可用于好友推荐和媒体信息推送服务。③ 用户与地理位置结合的建模分析,从地理社会媒体数据挖掘得到地理位置和用户的知识,需要把这种知识通过有价值的服务送达给终端用户,满足用户的需求。在这一方向,我们研究场景化个性化的地理位置探索推荐系统,对用户、场景地理信息、地理位置物品进行统一的建模,挖掘知识,为用户提供推送服务并帮助其进行地理位置探索。地理位置计算和用户建模挖掘得到的知识,可以很好嵌入到推荐服务系统中。针对用户在移动场景下的地理位置评分行为的特性,提出一种场景感知回归混合模型,对时空场景信息、用户兴趣、地理区域偏好、地理物品与内容进行统一建模并实现推荐。联合提出的模型,提出了一种用户意图和地理位置感知的概率矩阵分解模型,可以融入地理位置与用户的知识,有效地缓解了数据稀疏性问题从而提高了推荐性能,促使用户能够进行当地和新地点的探索发现。
在获取关于地理位置和用户的知识基础上,设计了提供面向用户的应用服务,包括知识可视化展示、识别预测、媒体内容信息探索发现和面向用户的个性化服务等。这一阶段是面向地理社会媒体研究的重要环节。