大数据时代社会科学在发生巨变,六年来SMP如何基于兴趣驱动促进学科发展?

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 大会定位还是一个国内会议,暂时还没有走向国际化的计划,但大会积极开展和国际学者的交流与合作—计划每年的大会特邀讲者中都有来自国外的顶级学者参加

传统意义上来说,我们会认为社会科学大多只能是定性/半定量分析的科学,例如社会学、心理学、文学、历史学。但当进入21世纪,伴随着大数据、云计算和人工智能的出现,这些领域在定量分析方面出现了蓬勃的发展。例如文学方面,举个例子,有人爬取《冰与火之歌》原著中人物数据,构建人物之间的社交关系网络,定量分析为什么这部著作堪称经典。再例如通过爬取微博数据来定量地分析宗教群体之间的关系网络。同样的大数据也可以用来定量地分析诸如经济发展规律、历史演化等等。可以说大数据、云计算和人工智能的发展让传统的这些社会科学焕发出了新的生机,社会科学已然在发生着巨变。

大数据时代社会科学在发生巨变,六年来SMP如何基于兴趣驱动促进学科发展? | SMP 2017

《冰与火之歌》社交网络图:点的大小代表角色的点度,即出现频次;颜色代表walktrap聚类的结果;线的粗细代表联系的紧密程度,颜色与聚类方式一致。聚类问题将在本文第三部分具体讲述。图片来源:dt财经

伴随着这种巨变的发生,哈工大的刘挺教授在2012年发起了首次全国社会媒体处理大会(SMP),希望通过这种形式给各个领域的专家提供一个思维碰撞的平台,以计算为背景,交叉应用到各个领域, 以加速传统学科深刻的变化。

经过数年的发展,今年9月14日-17日SMP专委会在北京成功举办了第六届全国社会媒体处理大会(SMP 2017)。在四天的议程(两天讲习班、两天主会)中,分别有来自各个领域的专家(例如金融、情感、传播学、教育、企业等)就大数据、人工智能等在该领域的革命性研究做出了精彩报告。大会现场几乎场场爆满,几乎每个报告都能给听众带来很多富有启发的观念。

大数据时代社会科学在发生巨变,六年来SMP如何基于兴趣驱动促进学科发展? | SMP 2017

在大会结束后,雷锋网就SMP大会的情况分别采访了大会的发起人刘挺教授专委会秘书长唐杰副教授本届大会程序委员会主席沈华伟副研究员,了解到了SMP大会的一些详细情况。

刘挺教授,SMP大会发起人,SMP专委会主任,哈尔滨工业大学教授,社会计算与信息检索研究中心主任

唐杰副教授,SMP专委会副主任、秘书长,清华大学副教授

沈华伟副研究员,SMP专委会副主任、SMP2017大会程序委员会主席、中科院计算所副研究员


雷锋网:刘教授,SMP大会是由您在2012年发起的,当时您是基于什么样的想法去做这件事情的?经历这么多年,您觉得您对SMP大会的定义有发生变化吗?

刘挺:SMP大会全称“社会媒体处理大会“,2012年策划这个大会的初衷是希望能够加强多学科融合(尤其是计算机科学、社会学、传播学、管理学、语言学等多学科交叉),针对产业发展和用户需求,加强学术交流、拓展创新思路,推动我国社会媒体处理理论研究与技术应用的持续发展。SMP大会经过这几年的发展,规模和影响力在逐渐扩大,但核心理念没有变化。

大数据时代社会科学在发生巨变,六年来SMP如何基于兴趣驱动促进学科发展? | SMP 2017

SMP能够发展到今天,受到大家的热情关注,主要是顺应和满足了社会媒体处理相关领域各方人士交流与合作的强烈需求。回想起来,2012年末,微博得到了很大的发展,海量的微博内容成为各相关领域学者共同感兴趣的大数据,经过一两年的工作积累,很多学者、学生和企业界人士都迫切需要一个交流的平台,我顺应了这个需求,在微博上发了一个帖子,倡议组织一个完全兴趣驱动的学术、技术交流会,很快有400多人响应,会议就开起来了。这样的初心一直保持到今天。

雷锋网:SMP会议目前已经经历了六届,在这六年当中SMP经历了怎么样的变化?

唐杰:2012年SMP大会在自愿报名参加的原则下举行,结果一下子通过微博聚集了400多人;2013延续了2012年的组织架构,相对前一年则更加侧重工业界的演示,大会非常成功,吸引了近500人参加。经过两年的准备,我们筹备成立了中国中文信息学会社会媒体处理专委会(SMP)。

2014年,SMP大会开始按照标准大会的方式进行组织,大会增加了论文投稿环节,但会议仍然采取免费注册的方式,大会非常成功,吸引了700-800人参加。

2015年,我们开始策划在外地举办大会,第一次离开北京,大家还是忐忑不安的。SMP来到了广州,由华南理工大学承办,大会继续秉承免费注册的原则,这次在京外的尝试延续了之前在北京的成功。

2016年专委会决定将大会举办地定在江西南昌,由江西师范大学承办,第一次尝试收费注册,还增加了用户画像技术评测(吸引200多支队伍参赛),最终有400多人注册参会,值得一提的是,大会最后一天各个论坛以及最后的闭幕式都有很多人坚持参加,大会内容的吸引力可见一斑。

今年大会再次回到北京,由中国科学院计算技术研究所承办,今年新增了讲习班、中文人机对话技术评测,还将论坛数由4个增加到了8个,大会吸引了600多人注册,创下SMP大会收费注册人数之最。

兴趣驱动是SMP的基石,清新、轻松、务实、守时是SMP的风格,SMP上的报告没有空泛的内容,更没有广告式的语言,参加SMP可以获得实实在在的收获,这是SMP不断发展壮大的重要原因。

雷锋网:本届大会参会人数有多少?参会人员成员比例大概多少?

沈华伟:本届大会有600多人注册参加,实际参会人数约800人。参会人员以学术群体为主。约占70%(其中学生40%),企业和媒体参会人员约占25%。

雷锋网:本届活动赞助商有哪些?赞助经费大概有多少?接受赞助有哪些衡量标准?

沈华伟:本届大会得到了企业的大力赞助。赞助分为四个级别:钻石赞助商、金牌赞助商、银牌赞助商和铜牌赞助商。本次会议的钻石赞助商是腾讯;金牌赞助商包括拓尔思、科大讯飞、三角兽、国双、微博;银牌赞助商是百度和今日头条;铜牌赞助商是知微数据和考拉新媒。本次会议的赞助经费也是SMP大会历届之最。

只要是在社会媒体处理领域开展工作的企业,相信自己可以通过赞助SMP获得收益,比如:提升企业品牌价值,扩大影响力,找到学术界合作伙伴,发现优秀人才等,就欢迎赞助SMP。

雷锋网:刘教授,根据您在开幕式上的介绍,大会已经或准备筹划的专业组有十多个。这些专业组是基于什么样的考虑成立的?和SMP大会属于什么样的关系?

刘挺:目前专委会成立或筹划的专业组共有十多个,目前正式成立的专业组包括:情感分析专业组 (SMP-SENT)、计算传播学专业组 (SMP-CCC)、计算社会学专业组 (SMP-SOC)、数据挖掘专业组 (SMP-KDD)、表示学习专业组 (SMP-RL),此外今年有两个新的论坛分别由筹划中的智能教育专业组 (SMP-EDU)和智能金融专业组 (SMP-FINTECH)发起组织的。成立专业组,是希望专委会委员聚在一起组织小型论坛,研讨各个子领域的最新进展,同时专业组还会不定期地举办专业组活动,例如今年6月上旬在山西举办的情感分析专业组论坛和6月下旬在杭州举办的数据挖掘专业组论坛。从隶属关系来看,SMP大会和专业组都属于社会媒体处理专委会领导下的活动和分支组织。

大数据时代社会科学在发生巨变,六年来SMP如何基于兴趣驱动促进学科发展? | SMP 2017

大数据时代社会科学在发生巨变,六年来SMP如何基于兴趣驱动促进学科发展? | SMP 2017

大数据时代社会科学在发生巨变,六年来SMP如何基于兴趣驱动促进学科发展? | SMP 2017

雷锋网:看昨天微信朋友圈里大家给特邀嘉宾王伟老师过生日,特别有人情味;浏览过去几届大会的内容,也发现有很多老师历年来都参与到大会的组织和报告的第一线。相比国内别的计算机领域的大会,SMP是如何构建这个大家庭的?

大数据时代社会科学在发生巨变,六年来SMP如何基于兴趣驱动促进学科发展? | SMP 2017

唐杰:社会媒体处理专委会是中国中文信息学会下属的专业委员会,从成立至今不到五年,专委会很年轻,但也同时充满活力,吸引了大量从事一线工作的学者。大会的第一天正好是美国加州大学洛杉矶分校(UCLA)王伟教授的生日,专委会给王教授买了生日蛋糕,并集体为王教授庆祝了生日。这体现了专委会以兴趣为基础、以友谊为纽带的风格。

雷锋网:SMP大会目前还有哪些不足?以后(例如下届)会有什么样的规划和改变?

刘挺:专委会还比较年轻,在很多规则和制度方面还不够明确和完善,目前专委会正在积极努力一步步完善补充。SMP大会的多数代表来自计算机领域,我们未来会努力吸引更多来自社会科学领域的学者、学生参会。新的专业组正在酝酿,比如计算文化学、计算历史学等,计算技术进入到传统的人文学科中,会带来全新的视角,得到一些新颖有趣的研究结果。

雷锋网:目前大会无论是邀请来作报告的老师,还是参会的人员都是中国人(华人)。大会是否有计划走向国际化?

唐杰:大会定位还是一个国内会议,暂时还没有走向国际化的计划,但大会积极开展和国际学者的交流与合作—计划每年的大会特邀讲者中都有来自国外的顶级学者参加,例如今年的特邀讲者就包括来自美国的王伟教授和来自港澳台的祝建华教授。此外,我们还邀请了腾讯AI Lab的张潼博士、和微软亚洲研究院副院长刘铁岩博士等,从特邀讲者和演讲内容来看,SMP大会是非常国际化的。

另外据雷锋网了解,第七届全国社会媒体处理大会(SMP 2018)将会于七、八月份间在凉爽的哈尔滨举办,想要了解社会科学在大数据、人工智能在影响下的巨变,一定不容错过。



本文作者:camel
本文转自雷锋网禁止二次转载, 原文链接
相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
8月前
|
人工智能 弹性计算 Serverless
Serverless+AI驱动的一站式数据平台有哪些可能性
【2月更文挑战第4天】Serverless+AI驱动的一站式数据平台有哪些可能性
|
8月前
|
人工智能 数据管理 Serverless
阿里云数据库走向Serverless与AI驱动的一站式数据平台具有重大意义和潜力
阿里云数据库走向Serverless与AI驱动的一站式数据平台具有重大意义和潜力
454 2
|
8月前
|
人工智能 运维 Cloud Native
、你如何看待阿里云数据库走向Serverless与AI驱动的一站式数据平台?
、你如何看待阿里云数据库走向Serverless与AI驱动的一站式数据平台?
206 2
|
8月前
|
存储 数据采集 大数据
大数据处理与分析技术:驱动智能决策的引擎
本文介绍了大数据处理与分析技术在现代社会中的重要性和应用。从数据采集、存储、处理到分析决策,大数据技术为我们提供了深入洞察和智能决策的能力,推动着各行各业的创新和发展。
300 0
|
3月前
|
SQL 消息中间件 分布式计算
大数据-120 - Flink Window 窗口机制-滑动时间窗口、会话窗口-基于时间驱动&基于事件驱动
大数据-120 - Flink Window 窗口机制-滑动时间窗口、会话窗口-基于时间驱动&基于事件驱动
118 0
|
3月前
|
SQL 分布式计算 大数据
大数据-119 - Flink Window总览 窗口机制-滚动时间窗口-基于时间驱动&基于事件驱动
大数据-119 - Flink Window总览 窗口机制-滚动时间窗口-基于时间驱动&基于事件驱动
135 0
|
5月前
|
自然语言处理 供应链 数据可视化
大数据在市场营销中的应用案例:精准洞察,驱动增长
【8月更文挑战第25天】大数据在市场营销中的应用案例不胜枚举,它们共同展示了大数据技术在精准营销、市场预测、用户行为分析等方面的巨大潜力。通过深度挖掘和分析数据,企业能够更加精准地洞察市场需求,优化营销策略,提升市场竞争力。未来,随着大数据技术的不断发展和普及,其在市场营销领域的应用将更加广泛和深入。
1513 3
|
8月前
|
人工智能 数据管理 大数据
阿里云数据库走向Serverless与AI驱动的一站式数据平台是一个很有前景和意义的发展方向
阿里云数据库走向Serverless与AI驱动的一站式数据平台是一个很有前景和意义的发展方向
113 2
|
6月前
|
存储 算法 数据可视化
云上大数据分析平台:解锁数据价值,驱动智能决策新篇章
实时性与流式处理:随着实时数据分析需求的增加,云上大数据分析平台将更加注重实时性和流式处理能力的建设。通过优化计算引擎和存储架构等技术手段,平台将能够实现对数据流的高效处理和分析,为企业提供实时决策支持。通过优化计算引擎和存储架构等技术手段,平台将能够实现对数据流的高效处理和分析,为企业提供实时决策支持。
869 8
|
6月前
|
人工智能 自然语言处理 数据管理
数据平台演进问题之自然语言处理技术在AI驱动的数据库中的作用是什么
数据平台演进问题之自然语言处理技术在AI驱动的数据库中的作用是什么