DAEGC实现

简介: 疫情期间:目前是在个人PC上搭建了DAEGC的运行环境并跑通,现将过程记录如下以备以后使用

DAEGC运行步骤

疫情期间:目前是在个人PC上搭建了DAEGC的环境并能够跑通,现将过程记录如下以备以后使用

个人PC:windows10,python3.7,1050Ti,cuda 11.2

1.首先查看自己的GPU版本和cuda版本

nvidia-smi

image

2.可以看到我的cuda版本为11.2因此安装对应版本torch

pip install torch==1.7.0+cu110 torchvision==0.8.1+cu110 -f https://download.pytorch.org/whl/torch_stable.html

3.安装torch-scatter,torch-sparse,torch-cluster,torch-spline-conv

我是直接通过wheel文件安装,个人感觉这种安装方式最直接,而且不会有什么问题,直接去whl地址根据对应的torch,cuda,以及python版本下载对应的wheel文件,比如我是cuda110+torch1.7.0+python37,根据电脑系统选择win还是linux

image

image

4.cd到已经下载文件的目录

pip install +下载的包名
#如:pip install .\torch_cluster-1.5.9-cp37-cp37m-win_amd64.whl
#依次将四个都运行

5.安装torch-geometric

pip install torch-geometric

6.安装DAEGC所需要的包

pip install munkres
pip install -U scikit-learn #-U表示更新到最新版本

7.至此环境搭建完成,cdDAEGC目录下

预训练(Cora,Citeseer):

 python pretrain.py --name Cora --max_epoch 50  #预训练
 python pretrain.py --name Citeseer --max_epoch 50 #预训练

image

训练(Cora Citeseer):

 python daegc.py --update_interval 5 --name Cora --epoch 45 --max_epoch 200 #训练(--epoch是可变参数,根据预训练文件夹下的内容可以改变)
 python daegc.py --update_interval 5 --name Citeseer --epoch 45 --max_epoch 200 #训练

参考链接:

Colab Notebook

原论文:

Attributed Graph Clustering: A Deep Attentional Embedding Approach

相关文章
|
机器学习/深度学习 算法 数据可视化
深度解读DBSCAN聚类算法:技术与实战全解析
深度解读DBSCAN聚类算法:技术与实战全解析
1924 0
|
6月前
|
机器学习/深度学习 算法 数据挖掘
【机器学习】聚类算法中的距离度量有哪些及公式表示?
聚类算法中常用的距离度量方法及其数学表达式,包括欧式距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、余弦相似度等多种距离和相似度计算方式。
580 1
|
6月前
|
机器学习/深度学习 人工智能 数据可视化
技术开源|语音情感基座模型emotion2vec
技术开源|语音情感基座模型emotion2vec
|
9月前
|
负载均衡 网络协议 中间件
掌握 SOME/IP :访问进程数据 构建高效通信系统的关键技术
掌握 SOME/IP :访问进程数据 构建高效通信系统的关键技术
426 2
|
6月前
|
消息中间件 NoSQL Java
Java必备面试题(100题)-八股篇
主要包括一些高频的Java面试的八股文面试题和答案
|
9月前
|
数据采集 Dart Apache
Github 2024-05-07 Python开源项目日报 Top10
在2024年5月7日的Github Trendings中,Python开源项目占据主导,共有10个项目上榜。其中热门项目包括:yt-dlp,一个增强版的youtube-dl分支,具有64K+星标;Home Assistant,专注本地控制和隐私的开源家庭自动化项目,拥有65K+星标;以及openpilot,一个开源驾驶辅助系统,支持多种车型,45K+星标。其他项目涵盖爬虫工具、实时应用框架Flet、可观测性平台Logfire等,涉及Python、Dart和C++等多种语言。
368 10
|
7月前
|
机器学习/深度学习 Serverless Python
`sklearn.metrics`是scikit-learn库中用于评估机器学习模型性能的模块。它提供了多种评估指标,如准确率、精确率、召回率、F1分数、混淆矩阵等。这些指标可以帮助我们了解模型的性能,以便进行模型选择和调优。
`sklearn.metrics`是scikit-learn库中用于评估机器学习模型性能的模块。它提供了多种评估指标,如准确率、精确率、召回率、F1分数、混淆矩阵等。这些指标可以帮助我们了解模型的性能,以便进行模型选择和调优。
|
自然语言处理 算法
SIFRank New Baseline for Unsupervised Keyphrase Extraction Based on Pre-Trained Language Model
在社交媒体上,面临着大量的知识和信息,一个有效的关键词抽取算法可以广泛地被应用的信息检索和自然语言处理中。传统的关键词抽取算法很难使用外部的知识信息。
181 0
SIFRank New Baseline for Unsupervised Keyphrase Extraction Based on Pre-Trained Language Model
|
8月前
|
存储 供应链 开发者
Python列表打造简易进销存系统:轻松管理库存信息!
Python列表打造简易进销存系统:轻松管理库存信息!
166 0
|
人工智能 自然语言处理 算法
大语言模型的预训练[6]:思维链(Chain-of-thought,CoT)定义原理详解以及在LLM上应用
大语言模型的预训练[6]:思维链(Chain-of-thought,CoT)定义原理详解以及在LLM上应用