大数据视野下的语言学研究新趋势

简介:

大数据、云计算、智能化等新技术的不断涌现,为语言学研究注入了新的活力,语言学在社会科学中的地位越发凸显。4月22日,以“大数据视野下的语言学研究新趋势”为主题的第六届中国语言学研究方法与方法论问题学术讨论会在京召开。此次会议由会议的常设主办单位中国社会科学杂志社和合作单位北京语言大学联合主办。国内十多所高校、科研单位的30余名专家学者围绕大会主题展开研讨和交流。

语言学研究方法的新思考

“语言之学有两个关注,一是关注对语言本身的研究,一是关注对语言研究的研究。”北京语言大学党委书记李宇明教授表示。语言的研究就是方法和方法论的体现,语言研究不能不注重方法。中国社会科学院语言研究所沈家煊研究员认为,语言研究应遵循“能简则简”和“分清主次”两个原则,“能简则简”是为了防止过度生成,“分清主次”是为了防止以偏概全。他指出,一个理论的解释力是由它能排除多少可能性来衡量的,不断增加复杂性和微调程度的理论能排除的可能性变得越来越小,甚至不能排除任何例外,最终变得没有解释力。中国社会科学院语言研究所张振兴研究员则提出大胆的理论假设——动物有语言,但是否有方言?他认为,迄今为止的“语言观”都是从人类语言角度出发的,语言研究也是建立在相对狭隘的观念基础上的。从动物的语言问题出发,将有助于解开人类语言的起源之谜。

具体到微观的语言研究方法,李宇明教授另辟蹊径,打破以往从谱系、结构的角度,从功能角度对语言进行新的分类。他表示,这种分类可以加深对世界语言格局的认识,对外语选择、语言政策和国际组织语种选择有很大的帮助。盛世修典,围绕新时代的韵书编纂,江苏师范大学杨亦鸣教授表示韵书编写最主要的原则是以实际语音为基础,有音韵学理的根据,并能用于创作实践。

新技术成为语言研究的重要手段

大数据在语言学研究中的应用是此次会议的亮点。中国社会科学院语言研究所李蓝研究员表示,利用大数据及计算机技术,传统的汉语方言调查效率得到大大提升。首都师范大学周建设教授关注人脑意象的机器语篇自动表达。他认为,大数据的特性使语言表达智能化逐渐成为可能,汉语表达智能模型的实现必须依赖于大数据资源库建设。

语言数据库建设是落实《国家语言文字事业“十三五”发展规划》关于推进语言文字信息化建设的具体要求。北京语言大学荀恩东教授的设想是建立语块分析库,利用大数据存储技术,以语块为分析单位,使计算机对汉语句法语义进行自动切分。北京师范大学王立军教授则致力于汉字数据库建设,旨在运用数据库技术,描述与现代通用规范汉字及古籍印刷通用汉字有关的汉字属性,构建一个科学系统的通用汉字全息属性库,以有效满足不同领域汉字应用的多元化需求。

新兴学科和交叉学科研究方兴未艾

当今社会的复杂性越来越高,面对这样的一个系统,任何单一学科都不可能解决复杂的社会问题。跨学科研究不仅是社会发展的需要,也是学科本身发展的必然要求。语言学在自身不断发展的同时,与相关学科不断交叉,出现新的研究领域。北京大学袁毓林教授利用认知转喻理论对汉语句法中的省略部分进行重新解释。他认为,认知转喻理论有助于解释语法形式与语法意义之间错综复杂的对应关系,以及词语的词类属性与有关句法表现之间的扭曲关系。同样,广东外语外贸大学魏在江教授也利用转喻机制探讨了汉语量词的超常规构式。

语言资源、语言规划、语言管理等新兴学科不断发展,逐渐成为显学。语言资源作为国家的战略性资源,在文化保护、文化建设、文化输入等方面扮演着重要的角色。武汉大学赵世举教授指出,网络空间语言资源在文化传承、国家安全、科技创新等方面具有重要的战略价值。语言规划、语言管理是一种社会治理活动。随着社会生活的新发展,语言冲突多发,语言规划与管理显得越来越重要。教育部语言文字应用研究所魏晖研究员提出要构建有中国特色的语言管理方案。上海外国语大学赵蓉晖教授从语言政策与语言规划角度重新审视人们对外语考试的批判。此外,与会代表还在全球华语、祖语传承、语言生态等方面展开了热烈的讨论。

此次会议历时两天,与会者普遍认为这次会议汇聚了一批语言和语言学研究新成果,为今后的研究提出了新的思路和方向。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
存储 消息中间件 大数据
Go语言在大数据处理中的实际应用与案例分析
【2月更文挑战第22天】本文深入探讨了Go语言在大数据处理中的实际应用,通过案例分析展示了Go语言在处理大数据时的优势和实践效果。文章首先介绍了大数据处理的挑战与需求,然后详细分析了Go语言在大数据处理中的适用性和核心技术,最后通过具体案例展示了Go语言在大数据处理中的实际应用。
|
7月前
|
数据可视化 大数据 关系型数据库
基于python大数据技术的医疗数据分析与研究
在数字化时代,医疗数据呈爆炸式增长,涵盖患者信息、检查指标、生活方式等。大数据技术助力疾病预测、资源优化与智慧医疗发展,结合Python、MySQL与B/S架构,推动医疗系统高效实现。
|
7月前
|
存储 人工智能 安全
拔俗AI临床大数据科研分析平台:让医学研究更智能、更高效
阿里云原生AI临床大数据科研平台,打通异构医疗数据壁垒,实现智能治理、可视化分析与多中心安全协作,助力医院科研提速增效,推动精准医疗发展。
1349 1
|
8月前
|
存储 并行计算 算法
【动态多目标优化算法】基于自适应启动策略的混合交叉动态约束多目标优化算法(MC-DCMOEA)求解CEC2023研究(Matlab代码实现)
【动态多目标优化算法】基于自适应启动策略的混合交叉动态约束多目标优化算法(MC-DCMOEA)求解CEC2023研究(Matlab代码实现)
363 4
|
存储 数据采集 分布式计算
大数据是什么?用浅显的语言揭开神秘面纱
大数据是什么?用浅显的语言揭开神秘面纱
1226 11
|
人工智能 大数据 安全
拔俗AI临床大数据科研分析平台:用智能技术加速医学研究新突破
AI临床大数据科研平台基于云原生架构,融合医疗NLP、联邦学习与智能分析技术,破解非结构化数据处理难、多源数据融合难、统计周期长等痛点,实现数据治理、智能分析与安全协作全链路升级,赋能医学科研高效、安全、智能化发展。
334 0
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
Java 大视界 -- Java 大数据机器学习模型在自然语言生成中的可控性研究与应用(229)
本文深入探讨Java大数据与机器学习在自然语言生成(NLG)中的可控性研究,分析当前生成模型面临的“失控”挑战,如数据噪声、标注偏差及黑盒模型信任问题,提出Java技术在数据清洗、异构框架融合与生态工具链中的关键作用。通过条件注入、强化学习与模型融合等策略,实现文本生成的精准控制,并结合网易新闻与蚂蚁集团的实战案例,展示Java在提升生成效率与合规性方面的卓越能力,为金融、法律等强监管领域提供技术参考。
|
存储 数据可视化 数据挖掘
大数据环境下的房地产数据分析与预测研究的设计与实现
本文介绍了一个基于Python大数据环境下的昆明房地产市场分析与预测系统,通过数据采集、清洗、分析、机器学习建模和数据可视化技术,为房地产行业提供决策支持和市场洞察,探讨了模型的可行性、功能需求、数据库设计及实现过程,并展望了未来研究方向。
892 4
大数据环境下的房地产数据分析与预测研究的设计与实现
|
机器学习/深度学习 数据采集 大数据
2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 问题一建模方案及代码实现详解
本文详细介绍了2022年第三届MathorCup高校数学建模挑战赛大数据竞赛赛道B的题目——北京移动用户体验影响因素研究,提供了问题一的建模方案、代码实现以及相关性分析,并对问题二的建模方案进行了阐述。
400 0
2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 问题一建模方案及代码实现详解
|
人工智能 分布式计算 大数据
超级计算与大数据:推动科学研究的发展
【9月更文挑战第30天】在信息时代,超级计算和大数据技术正成为推动科学研究的关键力量。超级计算凭借强大的计算能力,在尖端科研、国防军工等领域发挥重要作用;大数据技术则提供高效的数据处理工具,促进跨学科合作与创新。两者融合不仅提升了数据处理效率,还推动了人工智能、生物科学等领域的快速发展。未来,随着技术进步和跨学科合作的加深,超级计算与大数据将在科学研究中扮演更加重要的角色。