1. AMiner
from torch_geometric.datasets import AMiner dataset = AMiner(root='/data/pyg_data/AMiner') data = dataset[0]
这个数据集需要下载的两个文件分别是label.zip和net_aminer.zip,我都已放到百度网盘。
下载后将两个压缩文件分别解压,net_aminer.zip解压后得到net_aminer里面的文件都放到root文件夹下新建的raw文件夹,label.zip解压后的文件都放到root文件夹下新建的raw文件夹。
也就是说,最后raw文件夹下需要有这些文件/文件夹:
'id_author.txt', 'id_conf.txt', 'paper.txt', 'paper_author.txt','paper_conf.txt', 'label'
2. DBLP
from torch_geometric.datasets import DBLP dataset = DBLP(root='/data/pyg_data/DBLP') data = dataset[0]
这个数据集需要下载的文件是DBLP_processed.zip,我已放到百度网盘。
将文件解压后的文件都放到root文件夹下的raw文件夹即可。
3. IMDB
from torch_geometric.datasets import IMDB dataset = IMDB(root='/data/pyg_data/IMDB') data = dataset[0]
这个数据集需要下载的文件是IMDB_processed.zip,我已放到百度网盘。
将文件解压后的文件都放到root文件夹下的raw文件夹即可。
4. LastFM
from torch_geometric.datasets import LastFM dataset = LastFM(root='/data/pyg_data/LastFM') data = dataset[0]
这个数据集需要下载的文件是LastFM_processed.zip,我已放到百度网盘。
将文件解压后的文件都放到root文件夹下的raw文件夹即可。