聚类小分子数据集(基于RDKit的Python脚本)

简介: 聚类小分子数据集(基于RDKit的Python脚本)

聚类分子(Clustering molecules)

聚类是一种有价值的化学信息学技术,用于将大型化合物数据集合细分为单个小组相似化合物。其中一个优点是处理非常大的小分子数据集时特别有用。通常用于分析高通量筛选结果、虚拟筛选或对接研究的分析。


基于RDKit的Python脚本用于聚类分子


image.png

image.png

image.png

阅读原文查看完成代码:


#!/usr/bin/python3


def ClusterFps(fps,cutoff=0.2):


   from rdkit import DataStructs


   from rdkit.ML.Cluster import Butina


   # first generate the distance matrix:


   dists = []


   nfps = len(fps)


   for i in range(1,nfps):


       sims = DataStructs.BulkTanimotoSimilarity(fps[i],fps[:i])


       dists.extend([1-x for x in sims])


   # now cluster the data:


   cs = Butina.ClusterData(dists,nfps,cutoff,isDistData=True)


   return cs


from rdkit import Chem


from rdkit.Chem import AllChem


#generate fingerprints


ms = [x for x in Chem.ForwardSDMolSupplier('ApprovedDrugs.sdf') if x is not None]


fps = [AllChem.GetMorganFingerprintAsBitVect(x,2,1024) for x in ms]


#cluster


clusters=ClusterFps(fps,cutoff=0.4)


# show one of the clusters


print(clusters[20])


#now display structures from one of the clusters


from rdkit.Chem import Draw


from rdkit.Chem.Draw import IPythonConsole


#look at a specific cluster


m1 = ms[1630]


m2 = ms[1010]


m3 = ms[1022]


m4 = ms[1023]


m5 = ms[1034]


m6 = ms[1043]


mols=(m1,m2,m3,m4,m5,m6)


Draw.MolsToGridImage(mols)



目录
相关文章
|
13天前
|
JSON 算法 API
深度分析小红书城API接口,用Python脚本实现
小红书作为以UGC内容为核心的生活方式平台,其非官方API主要通过移动端抓包解析获得,涵盖内容推荐、搜索、笔记详情、用户信息和互动操作等功能。本文分析了其接口体系、认证机制及请求规范,并提供基于Python的调用框架,涉及签名生成、登录态管理与数据解析。需注意非官方接口存在稳定性与合规风险,使用时应遵守平台协议及法律法规。
|
20天前
|
JSON API 数据安全/隐私保护
【干货满满】分享微店API接口到手价,用python脚本实现
微店作为知名社交电商平台,其开放平台提供商品查询、订单管理等API接口。本文介绍如何通过微店API获取商品到手价(含优惠、券等),涵盖认证机制、Python实现及关键说明。
|
21天前
|
JSON API 数据安全/隐私保护
【干货满满】分享淘宝API接口到手价,用python脚本实现
淘宝开放平台通过API可获取商品到手价,结合商品详情与联盟接口实现优惠计算。需使用AppKey、AppSecret及会话密钥认证,调用taobao.tbk.item.info.get接口获取最终价格。代码示例展示签名生成与数据解析流程。
|
22天前
|
JSON API 数据安全/隐私保护
深度分析苏宁API接口,用Python脚本实现
苏宁易购开放平台提供覆盖商品、订单、库存、门店等零售全链路的API服务,采用RESTful架构与“AppKey+AppSecret+签名”认证机制,支持线上线下一体化业务处理。本文详解其API特性、认证流程及Python调用实现。
|
22天前
|
自然语言处理 安全 API
深度分析洋码头API接口,用Python脚本实现
洋码头是国内知名跨境电商平台,专注于海外商品直购。本文基于其API的通用设计逻辑,深入解析了认证机制、签名规则及核心接口功能,并提供了Python调用示例,适用于商品与订单管理场景。
|
22天前
|
JSON API 数据格式
深度分析易贝API接口,用Python脚本实现
本文深度解析了eBay开放平台的RESTful API接口体系,涵盖其核心功能、OAuth 2.0认证机制、请求规范及限流策略,并基于Python构建了完整的API调用框架。内容包括商品与订单管理接口的实现逻辑、认证流程、错误处理机制及实战调用示例,适用于跨境电商系统开发与多平台集成。
|
22天前
|
JSON 监控 BI
深度分析亚马逊API接口,用Python脚本实现
本内容深度解析亚马逊SP-API接口体系,涵盖商品、订单、库存等核心功能域,详解LWA认证、AWS签名及Python调用实现,适用于跨境电商系统开发与集成。
|
22天前
|
JSON 缓存 API
深度分析淘宝API接口,用Python脚本实现
本内容深入解析淘宝开放平台 API 的接口设计与 Python 实现,涵盖接口体系、认证机制、签名规则及限流策略,并提供完整的 Python 调用框架,适用于电商系统对接与自动化运营。
|
22天前
|
API Python 数据格式
深度分析京东API接口,用Python脚本实现
深度分析京东API接口,用Python脚本实现
|
11天前
|
机器学习/深度学习 数据采集 算法
【CNN-BiLSTM-attention】基于高斯混合模型聚类的风电场短期功率预测方法(Python&matlab代码实现)
【CNN-BiLSTM-attention】基于高斯混合模型聚类的风电场短期功率预测方法(Python&matlab代码实现)

热门文章

最新文章

推荐镜像

更多