大数据视野下的语言学研究新趋势

简介:

大数据、云计算、智能化等新技术的不断涌现,为语言学研究注入了新的活力,语言学在社会科学中的地位越发凸显。4月22日,以“大数据视野下的语言学研究新趋势”为主题的第六届中国语言学研究方法与方法论问题学术讨论会在京召开。此次会议由会议的常设主办单位中国社会科学杂志社和合作单位北京语言大学联合主办。国内十多所高校、科研单位的30余名专家学者围绕大会主题展开研讨和交流。

语言学研究方法的新思考

“语言之学有两个关注,一是关注对语言本身的研究,一是关注对语言研究的研究。”北京语言大学党委书记李宇明教授表示。语言的研究就是方法和方法论的体现,语言研究不能不注重方法。中国社会科学院语言研究所沈家煊研究员认为,语言研究应遵循“能简则简”和“分清主次”两个原则,“能简则简”是为了防止过度生成,“分清主次”是为了防止以偏概全。他指出,一个理论的解释力是由它能排除多少可能性来衡量的,不断增加复杂性和微调程度的理论能排除的可能性变得越来越小,甚至不能排除任何例外,最终变得没有解释力。中国社会科学院语言研究所张振兴研究员则提出大胆的理论假设——动物有语言,但是否有方言?他认为,迄今为止的“语言观”都是从人类语言角度出发的,语言研究也是建立在相对狭隘的观念基础上的。从动物的语言问题出发,将有助于解开人类语言的起源之谜。

具体到微观的语言研究方法,李宇明教授另辟蹊径,打破以往从谱系、结构的角度,从功能角度对语言进行新的分类。他表示,这种分类可以加深对世界语言格局的认识,对外语选择、语言政策和国际组织语种选择有很大的帮助。盛世修典,围绕新时代的韵书编纂,江苏师范大学杨亦鸣教授表示韵书编写最主要的原则是以实际语音为基础,有音韵学理的根据,并能用于创作实践。

新技术成为语言研究的重要手段

大数据在语言学研究中的应用是此次会议的亮点。中国社会科学院语言研究所李蓝研究员表示,利用大数据及计算机技术,传统的汉语方言调查效率得到大大提升。首都师范大学周建设教授关注人脑意象的机器语篇自动表达。他认为,大数据的特性使语言表达智能化逐渐成为可能,汉语表达智能模型的实现必须依赖于大数据资源库建设。

语言数据库建设是落实《国家语言文字事业“十三五”发展规划》关于推进语言文字信息化建设的具体要求。北京语言大学荀恩东教授的设想是建立语块分析库,利用大数据存储技术,以语块为分析单位,使计算机对汉语句法语义进行自动切分。北京师范大学王立军教授则致力于汉字数据库建设,旨在运用数据库技术,描述与现代通用规范汉字及古籍印刷通用汉字有关的汉字属性,构建一个科学系统的通用汉字全息属性库,以有效满足不同领域汉字应用的多元化需求。

新兴学科和交叉学科研究方兴未艾

当今社会的复杂性越来越高,面对这样的一个系统,任何单一学科都不可能解决复杂的社会问题。跨学科研究不仅是社会发展的需要,也是学科本身发展的必然要求。语言学在自身不断发展的同时,与相关学科不断交叉,出现新的研究领域。北京大学袁毓林教授利用认知转喻理论对汉语句法中的省略部分进行重新解释。他认为,认知转喻理论有助于解释语法形式与语法意义之间错综复杂的对应关系,以及词语的词类属性与有关句法表现之间的扭曲关系。同样,广东外语外贸大学魏在江教授也利用转喻机制探讨了汉语量词的超常规构式。

语言资源、语言规划、语言管理等新兴学科不断发展,逐渐成为显学。语言资源作为国家的战略性资源,在文化保护、文化建设、文化输入等方面扮演着重要的角色。武汉大学赵世举教授指出,网络空间语言资源在文化传承、国家安全、科技创新等方面具有重要的战略价值。语言规划、语言管理是一种社会治理活动。随着社会生活的新发展,语言冲突多发,语言规划与管理显得越来越重要。教育部语言文字应用研究所魏晖研究员提出要构建有中国特色的语言管理方案。上海外国语大学赵蓉晖教授从语言政策与语言规划角度重新审视人们对外语考试的批判。此外,与会代表还在全球华语、祖语传承、语言生态等方面展开了热烈的讨论。

此次会议历时两天,与会者普遍认为这次会议汇聚了一批语言和语言学研究新成果,为今后的研究提出了新的思路和方向。

本文转自d1net(转载)

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
4月前
|
SQL 分布式计算 Hadoop
[AIGC ~大数据] 深入理解Hadoop、HDFS、Hive和Spark:Java大师的大数据研究之旅
[AIGC ~大数据] 深入理解Hadoop、HDFS、Hive和Spark:Java大师的大数据研究之旅
|
5月前
|
人工智能 Cloud Native 大数据
从传统软件开发到云原生转型:大数据和AI如何引领软件开发的新趋势
从传统软件开发到云原生转型:大数据和AI如何引领软件开发的新趋势
110 0
|
8月前
|
存储 人工智能 Cloud Native
云原生大数据架构实践与思考-DataFunTalk
导读: 作者:振策-阿里云计算平台-产品解决方案, 20230805 本文将分享当前云原生大数据架构的发展历程/架构定义/核心能力/应用场景及趋势思考。主要包括以下四个部分: - 从大数据上云看架构 - 云原生数据平台的核心能力 - Data+AI with Cloud-Native - 未来趋势与思考
1312 0
|
11月前
|
机器学习/深度学习 存储 运维
论文阅读--异常检测中实时大数据处理的研究挑战
论文阅读--异常检测中实时大数据处理的研究挑战
|
11月前
|
分布式计算 算法 数据可视化
带你读《2022年开源大数据热力报告》——研究目标和研究模型
带你读《2022年开源大数据热力报告》——研究目标和研究模型
311 0
|
11月前
|
机器学习/深度学习 存储 SQL
带你读《2022年开源大数据热力报告》——TOP项目热力跃迁逻辑研究
带你读《2022年开源大数据热力报告》——TOP项目热力跃迁逻辑研究
156 0
|
12月前
|
存储 机器学习/深度学习 数据采集
案例研究:Netflix 大数据分析—数据驱动推荐的出现
Netflix 是当今市场上最大的在线流媒体提供商之一。它于 1997 年开始销售 DVD 并以出租方式提供。但随着时间的推移以及市场和用户需求的变化,Netflix不得不将其商业模式转变为视频流。如今,许多其他视频流媒体平台都在提供优质内容,如 Hulu、espn、disney+ 等,为了留在市场并吸引客户,netflix 在其推荐系统中使用大数据分析。该推荐系统有助于根据客户的兴趣和需求向他们推荐电影和节目。使用从订阅者处收集的大量数据,例如用户的位置;用户观看的内容、用户搜索的数据以及用户观看的时间,Netflix 分析这些数据为客户提供更好的订阅服务。基于这些数据,训练算法以提供最佳的
682 0
|
分布式计算 Cloud Native 数据可视化
重磅报告发布,从102个开源大数据项目深度研究开源大数据技术发展!
《2022年开源大数据热力报告》,由开放原子开源基金会、X-lab开放实验室和阿里巴巴开源委员会联合出品。报告基于公开数据研究最活跃的102个开源大数据项目,探寻出开源大数据技术发展背后的“摩尔定律”。
重磅报告发布,从102个开源大数据项目深度研究开源大数据技术发展!
|
存储 供应链 监控
浅谈大数据背景下公路运输存在的问题及其研究对策
物流运输,特别是公路运输,作为我国现代运输的主要方式之一,它是社会经济发展的一个基础性和先导性产业。随着经济的迅速发展和市场竞争的日益加剧,公路运输已成为掌控本地区经济命脉的重要因素之一。随着人工智能技术及相关产品的普及应用,物流行业发展过程中的仓储,运输,配送,客服等业务模式的改变与更新,在改变原有经营模式的前提下,提升了物流行业整体的工作效率,同时,也给大数据背景下新物流新模式带来了新的挑战与机遇。现阶段,物流运输,特别是公路运输,仍存在着很多的不足与问题,如何运用科学的技术和手段以及智能化模块管理进行弥补,将成为人们关注的焦点。
|
搜索推荐 安全 数据挖掘
学界 | iPOP:首个基于个性化大数据的个性化医学研究
该研究是关于 Mike Snyder 教授的「整合性个人组学图谱」(integrative personal omics profile,iPOP);Mike Snyder 教授是该论文的通讯作者,也是斯坦福大学遗传学系主任。这是首项针对个人的健康与疾病状态进行的大规模 iPOP 研究。该论文于 2012 年发表在 Cell 上。
390 0
学界 | iPOP:首个基于个性化大数据的个性化医学研究