NLP知识图谱项目合集(信息抽取、文本分类、图神经网络、性能优化等)

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
简介: NLP知识图谱项目合集(信息抽取、文本分类、图神经网络、性能优化等)

NLP知识图谱项目合集(信息抽取、文本分类、图神经网络、性能优化等)

这段时间完成了很多大大小小的小项目,现在做一个整体归纳方便学习和收藏,有利于持续学习。

1. 信息抽取项目合集

  • 1.PaddleNLP之UIE技术科普【一】实例:实体识别、情感分析、智能问答

https://aistudio.baidu.com/aistudio/projectdetail/4180615?contributionType=1

  • NLP领域任务选择合适预训练模型以及合适的方案【规范建议】【ERNIE模型首选】

https://aistudio.baidu.com/aistudio/projectdetail/4888188?contributionType=1

  • Paddlenlp之UIE模型实战实体抽取任务【打车数据、快递单】

https://aistudio.baidu.com/aistudio/projectdetail/4321385?contributionType=1

  • 快递单信息抽取【二】基于ERNIE1.0 预训练模型

https://aistudio.baidu.com/aistudio/projectdetail/4157455?contributionType=1

  • 快递单信息抽取[三]:Ernie 1.0至ErnieGram + CRF改进算法

https://aistudio.baidu.com/aistudio/projectdetail/4159638?contributionType=1

  • UIE之快递单信息抽取【四】--小样本标注数据提高准确率

https://aistudio.baidu.com/aistudio/projectdetail/4160432?contributionType=1

  • Paddlenlp之UIE关系抽取模型【高管关系抽取为例】

https://aistudio.baidu.com/aistudio/projectdetail/4371345?contributionType=1

  • 文档级关系抽取模型:基于结构先验产生注意力偏差SSAN模型

https://aistudio.baidu.com/aistudio/projectdetail/4666541?contributionType=1

  • 基线提升至96.45%:2022 司法杯犯罪事实实体识别+数据蒸馏+主动学习

https://aistudio.baidu.com/aistudio/projectdetail/4911042?contributionType=1

  • [信息抽取]基于ERNIE3.0的多对多信息抽取算法:属性关系抽取

https://aistudio.baidu.com/aistudio/projectdetail/5143572?contributionType=1

  • 基于ERNIELayout&PDFplumber-UIEX多方案学术论文信息抽取

https://aistudio.baidu.com/aistudio/projectdetail/5196032?contributionType=1

2.文本分类意图识别项目合集

  • 应用实践:分类模型大集成者[PaddleHub、Finetune、prompt]

https://aistudio.baidu.com/aistudio/projectdetail/4357474?contributionType=1

  • 小样本学习分类任务:在文心ERNIE3.0应用(提示学习),提速提效快用起来!

https://aistudio.baidu.com/aistudio/projectdetail/4438610?contributionType=1

  • 2022 CCF大数据与计算智能大赛:小样本数据分类任务baseline

https://aistudio.baidu.com/aistudio/projectdetail/4479243?contributionType=1

  • Paddlenlp之UIE分类模型【以情感倾向分析新闻分类为例】含智能标注方案)

https://aistudio.baidu.com/aistudio/projectdetail/4337189?contributionType=1

  • 基于ERNIR3.0文本分类:(KUAKE-QIC)意图识别多分类(单标签)

https://aistudio.baidu.com/aistudio/projectdetail/4362154?contributionType=1

  • 基于Ernie-3.0 CAIL2019法研杯要素识别多标签分类任务

https://aistudio.baidu.com/aistudio/projectdetail/4280922?contributionType=1

  • 基于ERNIR3.0文本分类:CAIL2018-SMALL罪名预测为例(多标签)

https://aistudio.baidu.com/aistudio/projectdetail/4374631?contributionType=1

  • 基于ERNIR3.0文本分类:WOS数据集为例(层次分类)

https://aistudio.baidu.com/aistudio/projectdetail/4382251?contributionType=1

3.模型性能提升项目合集

  • 在数据增强、蒸馏剪枝下ERNIE3.0模型性能提升详细方案

https://aistudio.baidu.com/aistudio/projectdetail/4436131?contributionType=1

  • Paddle模型性能分析工具Profiler:定位瓶颈点、优化程序、提升性能

https://aistudio.baidu.com/aistudio/projectdetail/4482932?contributionType=1

  • 可视化分析工具VisualDL 2.4强势来袭!新增:动态图模型可视化和性能分析

https://aistudio.baidu.com/aistudio/projectdetail/4561034?contributionType=1

  • 推广TrustAI可信分析:通过提升数据质量来增强在ERNIE模型下性能

https://aistudio.baidu.com/aistudio/projectdetail/4622139?contributionType=1

  • AiTrust下预训练和小样本学习在中文医疗信息处理挑战榜CBLUE表现

https://aistudio.baidu.com/aistudio/projectdetail/4592515?contributionType=1

  • UIE Slim满足工业应用场景,解决推理部署耗时问题,提升效能!

https://aistudio.baidu.com/aistudio/projectdetail/4516470?contributionType=1

  • 主动学习(Active Learning)综述以及在文本分类和序列标注应用

https://aistudio.baidu.com/aistudio/projectdetail/4897371?contributionType=1

4.知识图谱项目合集

  • 技术知识介绍:工业级知识图谱方法与实践

https://aistudio.baidu.com/aistudio/projectdetail/4444783?contributionType=1

  • 特定领域知识图谱融合方案:技术知识前置【一】-文本匹配算法

https://aistudio.baidu.com/aistudio/projectdetail/5398069?contributionType=1

特定领域知识图谱(Domain-specific KnowledgeGraph:DKG)融合方案(重点!)

在前面技术知识下可以看看后续的实际业务落地方案和学术方案

关于图神经网络的知识融合技术学习参考下面链接:[PGL图学习项目合集&数据集分享&技术归纳业务落地技巧[系列十]](https://aistudio.baidu.com/aistudio/projectdetail/5127575?contributionType=1)

从入门知识到经典图算法以及进阶图算法等,自行查阅食用!

文章篇幅有限请参考专栏按需查阅:NLP知识图谱相关技术业务落地方案和码源

4.1 特定领域知识图谱知识融合方案(实体对齐):优酷领域知识图谱为例

方案链接:https://blog.csdn.net/sinat_39620217/article/details/128614951

4.2 特定领域知识图谱知识融合方案(实体对齐):文娱知识图谱构建之人物实体对齐

方案链接:https://blog.csdn.net/sinat_39620217/article/details/128673963

4.3 特定领域知识图谱知识融合方案(实体对齐):商品知识图谱技术实战

方案链接:https://blog.csdn.net/sinat_39620217/article/details/128674429

4.4 特定领域知识图谱知识融合方案(实体对齐):基于图神经网络的商品异构实体表征探索

方案链接:https://blog.csdn.net/sinat_39620217/article/details/128674929

4.5 特定领域知识图谱知识融合方案(实体对齐)论文合集

方案链接:https://blog.csdn.net/sinat_39620217/article/details/128675199

论文资料链接:两份内容不相同,且按照序号从小到大重要性依次递减

知识图谱实体对齐资料论文参考(PDF)+实体对齐方案+特定领域知识图谱知识融合方案(实体对齐)

知识图谱实体对齐资料论文参考(CAJ)+实体对齐方案+特定领域知识图谱知识融合方案(实体对齐)

4.6 知识融合算法测试方案(知识生产质量保障)

方案链接:https://blog.csdn.net/sinat_39620217/article/details/128675698

5.图神经网络

1.1 关于图计算&图学习的基础知识概览:前置知识点学习(PGL)[系列一]https://aistudio.baidu.com/aistudio/projectdetail/4982973?contributionType=1

本项目对图基本概念、关键技术(表示方法、存储方式、经典算法),应用等都进行详细讲解,并在最后用程序实现各类算法方便大家更好的理解。当然之后所有图计算相关都是为了知识图谱构建的前置条件

1.2 图机器学习(GML)&图神经网络(GNN)原理和代码实现(前置学习系列二)
https://aistudio.baidu.com/aistudio/projectdetail/4990947?contributionType=1

现在已经覆盖了图的介绍,图的主要类型,不同的图算法,在Python中使用Networkx来实现它们,以及用于节点标记,链接预测和图嵌入的图学习技术,最后讲了GNN分类应用以及未来发展方向!

1.3 图学习初探Paddle Graph Learning 构建属于自己的图【系列三】
https://aistudio.baidu.com/aistudio/projectdetail/5000517?contributionType=1

本项目主要讲解了图学习的基本概念、图的应用场景、以及图算法,最后介绍了PGL图学习框架并给出demo实践,过程中把老项目demo修正版本兼容问题等小坑,并在最新版本运行便于后续同学更有体验感

1.4 PGL图学习之图游走类node2vec、deepwalk模型[系列四]
https://aistudio.baidu.com/aistudio/projectdetail/5002782?contributionType=1

介绍了图嵌入原理以及了图嵌入中的DeepWalk、node2vec算法,利用pgl对DeepWalk、node2vec进行了实现,并给出了多个框架版本的demo满足个性化需求。

介绍词向量word2evc概念,及CBOW和Skip-gram的算法实现。

主要引入基本的同构图、异构图知识以及基本概念;同时对deepWalk代码的注解以及node2vec、word2vec的说明总结;(以及作业代码注解)

1.5 PGL图学习之图游走类metapath2vec模型[系列五]
https://aistudio.baidu.com/aistudio/projectdetail/5009827?contributionType=1

介绍了异质图,利用pgl对metapath2vec以及metapath2vec变种算法进行了实现,同时讲解实现图分布式引擎训练,并给出了多个框架版本的demo满足个性化需求。

1.6 PGL图学习之图神经网络GNN模型GCN、GAT[系列六] [https://aistudio.baidu.com/aistudio/projectdetail/5054122?contributionType=1](https://aistudio.baidu.com/aistudio/projectdetail/5054122?c
ontributionType=1)

本次项目讲解了图神经网络的原理并对GCN、GAT实现方式进行讲解,最后基于PGL实现了两个算法在数据集Cora、Pubmed、Citeseer的表现,在引文网络基准测试中达到了与论文同等水平的指标。

1.7 PGL图学习之图神经网络GraphSAGE、GIN图采样算法[系列七] https://aistudio.baidu.com/aistudio/projectdetail/5061984?contributionType=1

本项目主要讲解了GraphSage、PinSage、GIN算法的原理和实践,
并在多个数据集上进行仿真实验,基于PGl实现原论文复现和对比,也从多个角度探讨当前算法的异同以及在工业落地的技巧等。

1.8 PGL图学习之图神经网络ERNIESage、UniMP进阶模型[系列八]
https://aistudio.baidu.com/aistudio/projectdetail/5096910?contributionType=1

ErnieSage 可以同时建模文本语义与图结构信息,有效提升 Text Graph 的应用效果;UniMP 在概念上统一了特征传播和标签传播, 在OGB取得了优异的半监督分类结果。

  • PGL图学习之ERNIESage算法实现(1.8x版本)【系列八】

https://aistudio.baidu.com/aistudio/projectdetail/5097085?contributionType=1

ERNIESage运行实例介绍(1.8x版本),提供多个版本pgl代码实现

1.9 PGL图学习之项目实践(UniMP算法实现论文节点分类、新冠疫苗项目)[系列九]
https://aistudio.baidu.com/aistudio/projectdetail/5100049?contributionType=1

本项目借鉴了百度高研黄正杰大佬对图神经网络技术分析以及图算法在业务侧应用落地;实现了论文节点分类和新冠疫苗项目的实践帮助大家更好理解学习图的魅力。

  • PGL图学习之基于GNN模型新冠疫苗任务[系列九]

https://aistudio.baidu.com/aistudio/projectdetail/5123296?contributionType=1

图神经网络7日打卡营的新冠疫苗项目拔高实战

  • PGL图学习之基于UniMP算法的论文引用网络节点分类任务[系列九]

https://aistudio.baidu.com/aistudio/projectdetail/5116458?contributionType=1

基于UniMP算法的论文引用网络节点分类,在调通UniMP之后,后续尝试的技巧对于其精度的提升效力微乎其微,所以不得不再次感叹百度PGL团队的强大!

  • PGL图学习项目合集&数据集分享&技术归纳业务落地技巧[系列十]

https://aistudio.baidu.com/aistudio/projectdetail/5127575?contributionType=1

6.其他项目

强化学习

  • 【强化学习项目一】搭建自己的寻宝游戏环境(Qlearning)

https://aistudio.baidu.com/aistudio/projectdetail/2006781?contributionType=1

  • MADDPG多智能体深度强化学习算法算法实现(parl)--【追逐游戏复现】

https://aistudio.baidu.com/aistudio/projectdetail/1864915?contributionType=1

  • 使用TD3解决四轴飞行器悬浮任务

https://aistudio.baidu.com/aistudio/projectdetail/1705633?contributionType=1

深度学习

  • 【深度学习项目一】全连接神经网络实现手写数字识别

https://aistudio.baidu.com/aistudio/projectdetail/1926913?contributionType=1

  • 深度学习项目二】卷积神经网络LeNet实现手写数字识别

https://aistudio.baidu.com/aistudio/projectdetail/1928935?contributionType=1

  • 【深度学习项目三】ResNet50多分类任务【十二生肖分类】

https://aistudio.baidu.com/bd-cpu-01/user/691158/5427356/home#codelab

  • 『深度学习项目四』基于ResNet101人脸关键点检测

https://aistudio.baidu.com/aistudio/projectdetail/1932295?contributionType=1

  • 【深度学习项目五】:利用LSTM网络进行情感分析

https://aistudio.baidu.com/aistudio/projectdetail/1994431?contributionType=1

༄ℳ持续更新中ꦿོ࿐

相关文章
|
24天前
|
安全 虚拟化
在数字化时代,网络项目的重要性日益凸显。本文从前期准备、方案内容和注意事项三个方面,详细解析了如何撰写一个优质高效的网络项目实施方案,帮助企业和用户实现更好的体验和竞争力
在数字化时代,网络项目的重要性日益凸显。本文从前期准备、方案内容和注意事项三个方面,详细解析了如何撰写一个优质高效的网络项目实施方案,帮助企业和用户实现更好的体验和竞争力。通过具体案例,展示了方案的制定和实施过程,强调了目标明确、技术先进、计划周密、风险可控和预算合理的重要性。
41 5
|
3月前
|
机器学习/深度学习 算法 TensorFlow
动物识别系统Python+卷积神经网络算法+TensorFlow+人工智能+图像识别+计算机毕业设计项目
动物识别系统。本项目以Python作为主要编程语言,并基于TensorFlow搭建ResNet50卷积神经网络算法模型,通过收集4种常见的动物图像数据集(猫、狗、鸡、马)然后进行模型训练,得到一个识别精度较高的模型文件,然后保存为本地格式的H5格式文件。再基于Django开发Web网页端操作界面,实现用户上传一张动物图片,识别其名称。
107 1
动物识别系统Python+卷积神经网络算法+TensorFlow+人工智能+图像识别+计算机毕业设计项目
|
3月前
|
机器学习/深度学习 人工智能 算法
植物病害识别系统Python+卷积神经网络算法+图像识别+人工智能项目+深度学习项目+计算机课设项目+Django网页界面
植物病害识别系统。本系统使用Python作为主要编程语言,通过收集水稻常见的四种叶片病害图片('细菌性叶枯病', '稻瘟病', '褐斑病', '稻瘟条纹病毒病')作为后面模型训练用到的数据集。然后使用TensorFlow搭建卷积神经网络算法模型,并进行多轮迭代训练,最后得到一个识别精度较高的算法模型,然后将其保存为h5格式的本地模型文件。再使用Django搭建Web网页平台操作界面,实现用户上传一张测试图片识别其名称。
138 22
植物病害识别系统Python+卷积神经网络算法+图像识别+人工智能项目+深度学习项目+计算机课设项目+Django网页界面
|
2月前
|
机器学习/深度学习 人工智能 算法
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
玉米病害识别系统,本系统使用Python作为主要开发语言,通过收集了8种常见的玉米叶部病害图片数据集('矮花叶病', '健康', '灰斑病一般', '灰斑病严重', '锈病一般', '锈病严重', '叶斑病一般', '叶斑病严重'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。再使用Django搭建Web网页操作平台,实现用户上传一张玉米病害图片识别其名称。
71 0
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
|
3月前
|
机器学习/深度学习 算法 TensorFlow
交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面
交通标志识别系统。本系统使用Python作为主要编程语言,在交通标志图像识别功能实现中,基于TensorFlow搭建卷积神经网络算法模型,通过对收集到的58种常见的交通标志图像作为数据集,进行迭代训练最后得到一个识别精度较高的模型文件,然后保存为本地的h5格式文件。再使用Django开发Web网页端操作界面,实现用户上传一张交通标志图片,识别其名称。
115 6
交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面
|
3月前
|
机器学习/深度学习 人工智能 算法
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
文本分类识别系统。本系统使用Python作为主要开发语言,首先收集了10种中文文本数据集("体育类", "财经类", "房产类", "家居类", "教育类", "科技类", "时尚类", "时政类", "游戏类", "娱乐类"),然后基于TensorFlow搭建CNN卷积神经网络算法模型。通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型,并保存为本地的h5格式。然后使用Django开发Web网页端操作界面,实现用户上传一段文本识别其所属的类别。
101 1
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
3月前
|
机器学习/深度学习 人工智能 算法
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台。果蔬识别系统,本系统使用Python作为主要开发语言,通过收集了12种常见的水果和蔬菜('土豆', '圣女果', '大白菜', '大葱', '梨', '胡萝卜', '芒果', '苹果', '西红柿', '韭菜', '香蕉', '黄瓜'),然后基于TensorFlow库搭建CNN卷积神经网络算法模型,然后对数据集进行训练,最后得到一个识别精度较高的算法模型,然后将其保存为h5格式的本地文件方便后期调用。再使用Django框架搭建Web网页平台操作界面,实现用户上传一张果蔬图片识别其名称。
65 0
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
6月前
|
机器学习/深度学习 PyTorch 算法框架/工具
【从零开始学习深度学习】26.卷积神经网络之AlexNet模型介绍及其Pytorch实现【含完整代码】
【从零开始学习深度学习】26.卷积神经网络之AlexNet模型介绍及其Pytorch实现【含完整代码】
|
6月前
|
机器学习/深度学习 PyTorch 算法框架/工具
【从零开始学习深度学习】28.卷积神经网络之NiN模型介绍及其Pytorch实现【含完整代码】
【从零开始学习深度学习】28.卷积神经网络之NiN模型介绍及其Pytorch实现【含完整代码】
|
4月前
|
机器学习/深度学习 PyTorch 算法框架/工具
PyTorch代码实现神经网络
这段代码示例展示了如何在PyTorch中构建一个基础的卷积神经网络(CNN)。该网络包括两个卷积层,分别用于提取图像特征,每个卷积层后跟一个池化层以降低空间维度;之后是三个全连接层,用于分类输出。此结构适用于图像识别任务,并可根据具体应用调整参数与层数。