NLP知识图谱项目合集(信息抽取、文本分类、图神经网络、性能优化等)
这段时间完成了很多大大小小的小项目,现在做一个整体归纳方便学习和收藏,有利于持续学习。
1. 信息抽取项目合集
- 1.PaddleNLP之UIE技术科普【一】实例:实体识别、情感分析、智能问答
https://aistudio.baidu.com/aistudio/projectdetail/4180615?contributionType=1
- NLP领域任务选择合适预训练模型以及合适的方案【规范建议】【ERNIE模型首选】
https://aistudio.baidu.com/aistudio/projectdetail/4888188?contributionType=1
- Paddlenlp之UIE模型实战实体抽取任务【打车数据、快递单】
https://aistudio.baidu.com/aistudio/projectdetail/4321385?contributionType=1
- 快递单信息抽取【二】基于ERNIE1.0 预训练模型
https://aistudio.baidu.com/aistudio/projectdetail/4157455?contributionType=1
- 快递单信息抽取[三]:Ernie 1.0至ErnieGram + CRF改进算法
https://aistudio.baidu.com/aistudio/projectdetail/4159638?contributionType=1
- UIE之快递单信息抽取【四】--小样本标注数据提高准确率
https://aistudio.baidu.com/aistudio/projectdetail/4160432?contributionType=1
- Paddlenlp之UIE关系抽取模型【高管关系抽取为例】
https://aistudio.baidu.com/aistudio/projectdetail/4371345?contributionType=1
- 文档级关系抽取模型:基于结构先验产生注意力偏差SSAN模型
https://aistudio.baidu.com/aistudio/projectdetail/4666541?contributionType=1
- 基线提升至96.45%:2022 司法杯犯罪事实实体识别+数据蒸馏+主动学习
https://aistudio.baidu.com/aistudio/projectdetail/4911042?contributionType=1
- [信息抽取]基于ERNIE3.0的多对多信息抽取算法:属性关系抽取
https://aistudio.baidu.com/aistudio/projectdetail/5143572?contributionType=1
- 基于ERNIELayout&PDFplumber-UIEX多方案学术论文信息抽取
https://aistudio.baidu.com/aistudio/projectdetail/5196032?contributionType=1
2.文本分类意图识别项目合集
- 应用实践:分类模型大集成者[PaddleHub、Finetune、prompt]
https://aistudio.baidu.com/aistudio/projectdetail/4357474?contributionType=1
- 小样本学习分类任务:在文心ERNIE3.0应用(提示学习),提速提效快用起来!
https://aistudio.baidu.com/aistudio/projectdetail/4438610?contributionType=1
- 2022 CCF大数据与计算智能大赛:小样本数据分类任务baseline
https://aistudio.baidu.com/aistudio/projectdetail/4479243?contributionType=1
- Paddlenlp之UIE分类模型【以情感倾向分析新闻分类为例】含智能标注方案)
https://aistudio.baidu.com/aistudio/projectdetail/4337189?contributionType=1
- 基于ERNIR3.0文本分类:(KUAKE-QIC)意图识别多分类(单标签)
https://aistudio.baidu.com/aistudio/projectdetail/4362154?contributionType=1
- 基于Ernie-3.0 CAIL2019法研杯要素识别多标签分类任务
https://aistudio.baidu.com/aistudio/projectdetail/4280922?contributionType=1
- 基于ERNIR3.0文本分类:CAIL2018-SMALL罪名预测为例(多标签)
https://aistudio.baidu.com/aistudio/projectdetail/4374631?contributionType=1
- 基于ERNIR3.0文本分类:WOS数据集为例(层次分类)
https://aistudio.baidu.com/aistudio/projectdetail/4382251?contributionType=1
3.模型性能提升项目合集
- 在数据增强、蒸馏剪枝下ERNIE3.0模型性能提升详细方案
https://aistudio.baidu.com/aistudio/projectdetail/4436131?contributionType=1
- Paddle模型性能分析工具Profiler:定位瓶颈点、优化程序、提升性能
https://aistudio.baidu.com/aistudio/projectdetail/4482932?contributionType=1
- 可视化分析工具VisualDL 2.4强势来袭!新增:动态图模型可视化和性能分析
https://aistudio.baidu.com/aistudio/projectdetail/4561034?contributionType=1
- 推广TrustAI可信分析:通过提升数据质量来增强在ERNIE模型下性能
https://aistudio.baidu.com/aistudio/projectdetail/4622139?contributionType=1
- AiTrust下预训练和小样本学习在中文医疗信息处理挑战榜CBLUE表现
https://aistudio.baidu.com/aistudio/projectdetail/4592515?contributionType=1
- UIE Slim满足工业应用场景,解决推理部署耗时问题,提升效能!
https://aistudio.baidu.com/aistudio/projectdetail/4516470?contributionType=1
- 主动学习(Active Learning)综述以及在文本分类和序列标注应用
https://aistudio.baidu.com/aistudio/projectdetail/4897371?contributionType=1
4.知识图谱项目合集
- 技术知识介绍:工业级知识图谱方法与实践
https://aistudio.baidu.com/aistudio/projectdetail/4444783?contributionType=1
- 特定领域知识图谱融合方案:技术知识前置【一】-文本匹配算法
https://aistudio.baidu.com/aistudio/projectdetail/5398069?contributionType=1
特定领域知识图谱(Domain-specific KnowledgeGraph:DKG)融合方案(重点!)
在前面技术知识下可以看看后续的实际业务落地方案和学术方案
关于图神经网络的知识融合技术学习参考下面链接:[PGL图学习项目合集&数据集分享&技术归纳业务落地技巧[系列十]](https://aistudio.baidu.com/aistudio/projectdetail/5127575?contributionType=1)
从入门知识到经典图算法以及进阶图算法等,自行查阅食用!
文章篇幅有限请参考专栏按需查阅:NLP知识图谱相关技术业务落地方案和码源
4.1 特定领域知识图谱知识融合方案(实体对齐):优酷领域知识图谱为例
方案链接:https://blog.csdn.net/sinat_39620217/article/details/128614951
4.2 特定领域知识图谱知识融合方案(实体对齐):文娱知识图谱构建之人物实体对齐
方案链接:https://blog.csdn.net/sinat_39620217/article/details/128673963
4.3 特定领域知识图谱知识融合方案(实体对齐):商品知识图谱技术实战
方案链接:https://blog.csdn.net/sinat_39620217/article/details/128674429
4.4 特定领域知识图谱知识融合方案(实体对齐):基于图神经网络的商品异构实体表征探索
方案链接:https://blog.csdn.net/sinat_39620217/article/details/128674929
4.5 特定领域知识图谱知识融合方案(实体对齐)论文合集
方案链接:https://blog.csdn.net/sinat_39620217/article/details/128675199
论文资料链接:两份内容不相同,且按照序号从小到大重要性依次递减
知识图谱实体对齐资料论文参考(PDF)+实体对齐方案+特定领域知识图谱知识融合方案(实体对齐)
知识图谱实体对齐资料论文参考(CAJ)+实体对齐方案+特定领域知识图谱知识融合方案(实体对齐)
4.6 知识融合算法测试方案(知识生产质量保障)
方案链接:https://blog.csdn.net/sinat_39620217/article/details/128675698
5.图神经网络
1.1 关于图计算&图学习的基础知识概览:前置知识点学习(PGL)[系列一] :https://aistudio.baidu.com/aistudio/projectdetail/4982973?contributionType=1
本项目对图基本概念、关键技术(表示方法、存储方式、经典算法),应用等都进行详细讲解,并在最后用程序实现各类算法方便大家更好的理解。当然之后所有图计算相关都是为了知识图谱构建的前置条件
1.2 图机器学习(GML)&图神经网络(GNN)原理和代码实现(前置学习系列二)
https://aistudio.baidu.com/aistudio/projectdetail/4990947?contributionType=1
现在已经覆盖了图的介绍,图的主要类型,不同的图算法,在Python中使用Networkx来实现它们,以及用于节点标记,链接预测和图嵌入的图学习技术,最后讲了GNN分类应用以及未来发展方向!
1.3 图学习初探Paddle Graph Learning 构建属于自己的图【系列三】
https://aistudio.baidu.com/aistudio/projectdetail/5000517?contributionType=1
本项目主要讲解了图学习的基本概念、图的应用场景、以及图算法,最后介绍了PGL图学习框架并给出demo实践,过程中把老项目demo修正版本兼容问题等小坑,并在最新版本运行便于后续同学更有体验感
1.4 PGL图学习之图游走类node2vec、deepwalk模型[系列四]
https://aistudio.baidu.com/aistudio/projectdetail/5002782?contributionType=1
介绍了图嵌入原理以及了图嵌入中的DeepWalk、node2vec算法,利用pgl对DeepWalk、node2vec进行了实现,并给出了多个框架版本的demo满足个性化需求。
- 图学习【参考资料1】词向量word2vec https://aistudio.baidu.com/aistudio/projectdetail/5009409?contributionType=1
介绍词向量word2evc概念,及CBOW和Skip-gram的算法实现。
- 图学习【参考资料2】-知识补充与node2vec代码注解https://aistudio.baidu.com/aistudio/projectdetail/5012408?contributionType=1
主要引入基本的同构图、异构图知识以及基本概念;同时对deepWalk代码的注解以及node2vec、word2vec的说明总结;(以及作业代码注解)
1.5 PGL图学习之图游走类metapath2vec模型[系列五]
https://aistudio.baidu.com/aistudio/projectdetail/5009827?contributionType=1
介绍了异质图,利用pgl对metapath2vec以及metapath2vec变种算法进行了实现,同时讲解实现图分布式引擎训练,并给出了多个框架版本的demo满足个性化需求。
1.6 PGL图学习之图神经网络GNN模型GCN、GAT[系列六] [https://aistudio.baidu.com/aistudio/projectdetail/5054122?contributionType=1](https://aistudio.baidu.com/aistudio/projectdetail/5054122?c
ontributionType=1)
本次项目讲解了图神经网络的原理并对GCN、GAT实现方式进行讲解,最后基于PGL实现了两个算法在数据集Cora、Pubmed、Citeseer的表现,在引文网络基准测试中达到了与论文同等水平的指标。
1.7 PGL图学习之图神经网络GraphSAGE、GIN图采样算法[系列七] https://aistudio.baidu.com/aistudio/projectdetail/5061984?contributionType=1
本项目主要讲解了GraphSage、PinSage、GIN算法的原理和实践,
并在多个数据集上进行仿真实验,基于PGl实现原论文复现和对比,也从多个角度探讨当前算法的异同以及在工业落地的技巧等。
1.8 PGL图学习之图神经网络ERNIESage、UniMP进阶模型[系列八]
https://aistudio.baidu.com/aistudio/projectdetail/5096910?contributionType=1
ErnieSage 可以同时建模文本语义与图结构信息,有效提升 Text Graph 的应用效果;UniMP 在概念上统一了特征传播和标签传播, 在OGB取得了优异的半监督分类结果。
- PGL图学习之ERNIESage算法实现(1.8x版本)【系列八】
https://aistudio.baidu.com/aistudio/projectdetail/5097085?contributionType=1
ERNIESage运行实例介绍(1.8x版本),提供多个版本pgl代码实现
1.9 PGL图学习之项目实践(UniMP算法实现论文节点分类、新冠疫苗项目)[系列九]
https://aistudio.baidu.com/aistudio/projectdetail/5100049?contributionType=1
本项目借鉴了百度高研黄正杰大佬对图神经网络技术分析以及图算法在业务侧应用落地;实现了论文节点分类和新冠疫苗项目的实践帮助大家更好理解学习图的魅力。
- PGL图学习之基于GNN模型新冠疫苗任务[系列九]
https://aistudio.baidu.com/aistudio/projectdetail/5123296?contributionType=1
图神经网络7日打卡营的新冠疫苗项目拔高实战
- PGL图学习之基于UniMP算法的论文引用网络节点分类任务[系列九]
https://aistudio.baidu.com/aistudio/projectdetail/5116458?contributionType=1
基于UniMP算法的论文引用网络节点分类,在调通UniMP之后,后续尝试的技巧对于其精度的提升效力微乎其微,所以不得不再次感叹百度PGL团队的强大!
- PGL图学习项目合集&数据集分享&技术归纳业务落地技巧[系列十]
https://aistudio.baidu.com/aistudio/projectdetail/5127575?contributionType=1
6.其他项目
强化学习
- 【强化学习项目一】搭建自己的寻宝游戏环境(Qlearning)
https://aistudio.baidu.com/aistudio/projectdetail/2006781?contributionType=1
- MADDPG多智能体深度强化学习算法算法实现(parl)--【追逐游戏复现】
https://aistudio.baidu.com/aistudio/projectdetail/1864915?contributionType=1
- 使用TD3解决四轴飞行器悬浮任务
https://aistudio.baidu.com/aistudio/projectdetail/1705633?contributionType=1
深度学习
- 【深度学习项目一】全连接神经网络实现手写数字识别
https://aistudio.baidu.com/aistudio/projectdetail/1926913?contributionType=1
- 深度学习项目二】卷积神经网络LeNet实现手写数字识别
https://aistudio.baidu.com/aistudio/projectdetail/1928935?contributionType=1
- 【深度学习项目三】ResNet50多分类任务【十二生肖分类】
https://aistudio.baidu.com/bd-cpu-01/user/691158/5427356/home#codelab
- 『深度学习项目四』基于ResNet101人脸关键点检测
https://aistudio.baidu.com/aistudio/projectdetail/1932295?contributionType=1
- 【深度学习项目五】:利用LSTM网络进行情感分析
https://aistudio.baidu.com/aistudio/projectdetail/1994431?contributionType=1
༄ℳ持续更新中ꦿོ࿐