Drug Discovery Today | 频繁命中化合物机制探究:PAINS规则的局限性

简介: Drug Discovery Today | 频繁命中化合物机制探究:PAINS规则的局限性

频繁出现的假阳性结果对高效的药物研发是一个极大的挑战。为了能够提前筛选假阳性化合物,避免无效的成本和投入,2010年Baell等人提出一套PAINS筛选规则(Pan-assay interference compounds)用于假阳性化合物筛选。然而,在后续研究中发现,PAINS筛选规则对于假阳性化合物筛选的有效性和正确性有待考证。基于这个问题,本文收集了一个涵盖6种常见频繁命中化合物机制且包含600,000分子的大型基准数据集用于PAINS规则测评。


image.png

背景


高通量筛选是药物研发的一个重要手段,然而研究中发现一些化合物在不同类型靶点筛选中均表现出阳性结果,这类化合物称为“频繁命中化合物”。其中,通过干扰实验条件而在多个实验中呈现出阳性结果的假阳性化合物是应该在药物研发前期尽量避免的无效投入。2010年,Baell等人在基于六个不同靶点AlphaScreen高通量筛选实验结果,并将其中频繁出现(≥4次)的化合物和相关结构总结为包含480个子结构的筛选规则PAINS(Pan-assay interference compounds)用于假阳性化合物筛选。这篇文章在Google Scholarship的引用次数已经超过2090次,药学领域权威杂志《Journal of Medicinal Chemistry》要求作者在提交论文时必须附带研究分子通过PAINS筛选规则的结果,对于含有PAINS子结构的化合物需要提供实验数据证明该化合物不是频繁命中化合物。然而,在实际应用中,PAINS规则筛选的化合物类型实际多种多样且甚至相互矛盾的,包括无活性化合物、已上市药物及候选化合物等。由于机制的不明确,使得后续PAINS规则筛选化合物的处理复杂且不明朗。


数据库筛选


为了探究PAINS规则背后的机制和筛选能力,课题组从文献及数据库中收集到6种常见频繁命中化合物机制的大型基准数据集,包括胶体聚集化合物、自荧光化合物、荧光酶抑制剂、易反应化合物和多靶点化合物。经过一系列分子预处理,包含正集和负集,超过600,000个分子用于PAINS规则测评。

image.png

图1. PAINS规则测评结果


结果发现,PAINS规则只能大约检测出10%的频繁命中化合物,平均正确率在42%左右。后续对于PAINS子结构具体分析的环节发现,虽然部分PAINS子结构对于频繁命中化合物有鉴别能力,但是仍然有241个PAINS子结构在这次筛选中并未检测到,结合后续对从 ZINC数据库中收集的400,000,000可购买分子的PAINS筛选结果,仍然有超过13%的PAINS子结构在这两次筛选中都未出现。以上数据表明PAINS规则仍需改进。

image.png

图2. PAINS规则具体情况


与其他规则比较


为了进一步探究PAINS规则的筛选能力,课题组收集了一些其他常用的频繁命中化合物筛选规则用于基准数据集筛选。结果表明,相较PAINS规则,机制分明的规则的筛选结果普遍更高效且更准确。这个结果也说明探究原始数据机制对于规则筛选能力的重要性。

image.png

总结

频繁命中化合物的筛选对于药物正常高效研发具有重要作用,然而现今使用的PAINS子结构规则仍有较大的发展空间,后续相关筛选规则的发展需要注意:(1). 机制分明的原始数据集,包含正集和负集;(2). 对于子结构规则的合理编排;(3). 与筛选模型的结合,相互补充。

目录
相关文章
|
安全 Shell Linux
【Shell 命令集合 系统管理 】Linux 锁定终端 vlock命令 使用指南
【Shell 命令集合 系统管理 】Linux 锁定终端 vlock命令 使用指南
528 1
|
Linux 网络安全
linux避免ssh远程超时断开
linux避免ssh远程超时断开
linux避免ssh远程超时断开
|
7月前
|
人工智能 前端开发 测试技术
Kimi K2 模型更新,带来更强的代码能力、更快的 API
今天,Kimi K2 模型的最新版本 0905 开源发布,进一步提升其在真实编程任务中的表现
1736 0
|
应用服务中间件 nginx
流媒体技术学习笔记之(十四)FFmpeg进行笔记本摄像头+麦克风实现流媒体直播服务
FFmpeg推送视频流,Nginx RTMP模块转发,VLC播放器播放,实现整个RTMP直播 查看本机电脑的设备 ffmpeg -list_devices true -f dshow -i dummy 红色标记表示视频设备和麦克风设备 看到乱码了吧!来这里查看哦   FFmpeg编码推送到R...
4042 0
|
Web App开发 数据采集 JavaScript
CDP与Selenium相结合——玩转网页端自动化数据采集/爬取程序
本文介绍了Selenium、Chrome DevTools及Chrome DevTools Protocol (CDP) 的基本功能与应用。Selenium是一款开源自动化测试工具,适用于网页端应用程序测试和数据采集,具备跨平台特性。Chrome DevTools内置浏览器中,提供调试、分析Web应用程序的功能,包括元素、控制台、源代码和网络选项卡等。CDP是一套用于与Chromium内核浏览器通信的API,支持自动化测试和性能分析。文中还展示了Selenium与CDP结合使用的示例,如捕获网络请求数据和打印网页内容,并推荐了相关书籍和资源以供深入学习。
1966 39
CDP与Selenium相结合——玩转网页端自动化数据采集/爬取程序
|
JSON 人工智能 前端开发
用markdown语法制作一个好看的网址导航页面(markdown-web-nav)
这是一篇关于创建网址导航页面的工具分享文章。作者介绍了从手动编写HTML代码到开发可视化工具 *markdown-web-nav* 的历程,旨在简化网址管理与导航页面生成的过程。该工具支持新增、编辑和删除网址数据,通过导入/导出JSON文件、实时预览Markdown效果以及一键复制等功能,让用户轻松制作美观的网站导航页面。文章还提供了详细的操作步骤及常见问题解答,如还原数据、获取网站图标链接等,适合不同技术水平的用户使用。
665 28
|
Linux Python Windows
Matplotlib 中设置自定义中文字体的正确姿势
【11月更文挑战第16天】Matplotlib 默认不支持中文字体显示,需手动配置。方法包括:1) 修改全局字体设置,适用于整个脚本;2) 局部设置特定元素的字体;3) 使用系统字体名称,但可能因系统而异。通过这些方法可以有效解决中文乱码问题,确保图表中文本的正确显示。
1576 3
|
9月前
|
机器学习/深度学习 数据可视化 数据安全/隐私保护
抖音留痕脚本,快手小红书微博,自动留痕插件工具
就是用autojs写的一个自动化工具脚本,其实写了好几天,感觉有点价值就分享出来吧 核心代码实现
|
人工智能 算法 机器人
DeepSeek眼中无法替代的职业领域
根据DeepSeek的研究,未来10年内,某些依赖人类核心能力的岗位将对AI具备“免疫性”。这些岗位包括需要生物性体验与情感联结的职业(如教育、心理咨询、母婴护理),依赖创造力与隐性经验积累的职业(如艺术创作、手工艺传承、科研决策),涉及伦理与文明合法性的职业(如司法、宗教领袖、文化遗产守护者),应对非结构化环境的职业(如紧急救援、复杂医疗决策),以及新兴的“反AI化职业”(如AI伦理审计师、人类真实性鉴定师)。这些职业的本质在于验证人类身份的独特性和不可替代性,涵盖生物性特权、伦理责任及文明解释权。
360 0
|
存储 自然语言处理 API
HarmonyOS SDK使用:熟悉HarmonyOS提供的开发工具和API
【10月更文挑战第21天】随着智能设备的普及,操作系统的重要性日益凸显。华为推出的HarmonyOS凭借其跨平台、分布式特性受到广泛关注。本文将从开发工具、API使用、SDK更新维护及社区支持等方面,探讨HarmonyOS SDK的使用,旨在帮助开发者高效利用这一强大平台,开启鸿蒙应用开发之旅。
1391 5

热门文章

最新文章

下一篇
开通oss服务