语料库————(二)

简介: 以下是我国20大知名语料库,书到用时方恨少,还不赶快来收藏?! 1.中央研究院近代汉语标记语料库:http://www.sinica.edu.tw/Early_Mandarin/ 2.中央研究院汉籍电子文献(瀚典全文检索系统)http://www.sinica.edu.tw/ftms-bin/ftmsw3 3.国家现代汉语语料库:http://124.207.106

以下是我国20大知名语料库,书到用时方恨少,还不赶快来收藏?!

1.中央研究院近代汉语标记语料库:http://www.sinica.edu.tw/Early_Mandarin/

2.中央研究院汉籍电子文献(瀚典全文检索系统)http://www.sinica.edu.tw/ftms-bin/ftmsw3

3.国家现代汉语语料库:http://124.207.106.21:8080/

4.国家语委现代汉语语料库:http://www.clr.org.cn/retrieval/index.html

5.树图数据库:http://treebank.sinica.edu.tw/

6.语料库语言学在线:corpus4u.org

7.北京大学中国语言学研究中心,简称CCL语料库检索系统(包括:现代汉语语料库、古代汉语语料库、汉英双语语料库)http://ccl.pku.edu.cn/Yuliao_Contents.Asp

8.北京大学《人民日报》标注语料库:http://www.icl.pku.edu.cn

9.北京语言大学的语料库:http://www.blcu.edu.cn/kych/H.htm

 

10.清华大学的汉语均衡语料库THACorpushttp://www.lits.tsinghua.edu.cn/ainlp/source.htm

11.山西大学语料库http://www.sxu.edu.cn/homepage/cslab/sxuc1.htm

12.台湾南岛语典藏:http://www.ling.sinica.edu.tw/Formosan/

13.闽南语典藏:http://southernmin.sinica.edu.tw/

14.香港城市大学的LIVAC共时语料库:http://www.rcl.cityu.edu.hk/livac/http://www.LIVAC.org

15.浙江师范大学的历史文献语料库:http://lib.zjnu.net.cn/xueke/hyywzx/xkjj.htm

16.中国科学院计算所的双语语料库:http://mtgroup.ict.ac.cn/corpus/query_process.php

17.中文语言资源联盟:http://www.chineseldc.org/xyzy.htm

18.红楼梦汉英平行语料库http://score.crpp.nie.edu.sg/hlm/index.htm#

19.SKETCHENGINE多语言语料库:www.sketchengine.co.uk

20.LIVAC共时语料库:http://www.livac.org/

目录
相关文章
|
机器学习/深度学习 自然语言处理 算法
大型语言模型:SBERT — 句子BERT
大型语言模型:SBERT — 句子BERT
213 0
|
3月前
|
自然语言处理 索引
使用BERT进行情感分析
【10月更文挑战第2天】
|
5月前
|
机器学习/深度学习 存储 自然语言处理
【NLP-新闻文本分类】3 Bert模型的对抗训练
详细介绍了使用BERT模型进行新闻文本分类的过程,包括数据集预处理、使用预处理数据训练BERT语料库、加载语料库和词典后用原始数据训练BERT模型,以及模型测试。
85 1
|
8月前
|
自然语言处理 Python
使用Python实现文本分类与情感分析模型
使用Python实现文本分类与情感分析模型
115 1
|
数据采集 自然语言处理 开发工具
fasttext实现文本分类
fasttext实现文本分类
337 0
|
自然语言处理 搜索推荐
|
机器学习/深度学习 自然语言处理 资源调度
论文解读系列| 06:【NER】LatticeLSTM模型详解
Lattice LSTM模型是基于词汇增强方法的中文NER的开篇之作。在该模型中,使用了字符信息和所有词序列信息,具体地,当我们通过词汇信息(词典)匹配一个句子时,可以获得一个类似Lattice的结构。这种方式可以避免因分词错误导致实体识别错误,在中文NER任务上有显著效果。
|
机器学习/深度学习 自然语言处理 算法
论文解读系列| 05:【NER】SoftLexicon模型详解
SoftLexicon是一种简单而有效的将词汇信息纳入字符表示的方法。这种方法避免设计复杂的序列建模结构,并且对于任何NER模型,它只需要细微地调整字符表示层来引入词典信息。在4个中文NER基准数据集上的实验结果表明,该方法的推理速度比现有SOTA方法快6.15倍,性能更好。
|
机器学习/深度学习 自然语言处理 算法
SnowNLP使用自定义语料进行模型训练(情感分析)
SnowNLP使用自定义语料进行模型训练(情感分析)
1883 1
SnowNLP使用自定义语料进行模型训练(情感分析)

相关实验场景

更多