刚刚,我们一起登上国际顶级学术期刊《Cell》

简介: 刚刚,我们一起登上国际顶级学术期刊《Cell》


10月10日,阿里云与中山大学合作的科研成果登上国际顶级学术期刊《Cell》,研究团队利用云计算与AI技术发现了180个超群、16万余种全新RNA病毒,是已知病毒种类的近30倍,大幅提升了业界对RNA病毒多样性和病毒演化历史的认知。




病毒与人类的健康密切相关,但人类已知已确认的病毒种类仅有5000余种,这只是病毒世界的冰山一角。传统RNA病毒鉴定方法高度依赖于序列同源性比对,即通过比较未知病毒与已知病毒的序列相似性来进行识别。然而,RNA病毒种类繁多且高度分化,传统方法难以捕捉缺乏同源性或同源性极低的“暗物质病毒”,新病毒发现的效率较低。


AI与病毒学研究的结合正在突破这一难题。本篇论文提出了全新的深度学习模型"LucaProt",它基于Transformer框架与大模型表征技术,结合蛋白质序列和内在结构性特征,在独立的测试数据集上表现优异,具有极高的准确性(假阳性率仅为0.014%)和特异性(假阴性率为1.72%)。


image.png


研究团队对来自全球生物环境样本的10,487份数据进行病毒挖掘,发现了513,134条病毒基因组,代表161,979个潜在病毒种及180个RNA病毒超群。使RNA病毒超群数量扩容约9倍,病毒种类增加约30倍,其中23个超群无法通过序列同源方法识别,被称为病毒圈的“暗物质“。


该论文还揭示了多个病毒学领域新发现:发现迄今为止最长的RNA病毒基因组,长度达到47,250个核苷酸;识别出超出以往认知的基因组结构,展示了RNA病毒基因组进化的灵活性;此外,在高温的深海热泉等极端环境中,RNA病毒依旧存在多样性。


过去几年,阿里云积极与国内高校和研究机构展开合作,在生命科学领域已发表核酸和蛋白质统一基础模型-LucaOne、RNA病毒发现-LucaProt、磷循环蛋白家族识别-LucaPCycle等研究成果。


《Cell》是国际公认学术声誉最高的期刊,代表生命科学领域的最高水平。国内每年入选《Cell》的论文数量仅有数十篇。此次入选的论文提出了一种基于深度学习的RNA病毒发现方法,是深度学习算法在病毒发现领域的里程碑式进展,为病毒学研究开创了全新范式。


/ END /

目录
相关文章
|
安全 物联网 Android开发
|
安全 数据可视化 量子技术
Nature Index增刊发布:中科院影响力位列榜首,天津大学获最高国际合作得分
Nature Index增刊发布:中科院影响力位列榜首,天津大学获最高国际合作得分
241 0
|
存储 分布式计算 Cloud Native
偶数科技入选 IDC 中国分布式数据库报告,获 Innovator 殊荣
偶数科技入选 IDC 中国分布式数据库报告,获 Innovator 殊荣
78 0
|
存储 关系型数据库 分布式数据库
阿里云论文连续两年入选国际数据库顶级会议SIGMOD 国内唯一
论文介绍了面向大规模流量场景设计的自研存储引擎X-Engine,创新之处在于采用分层存储的全新理念,可以根据数据访问频度将数据合理归位,实现快存快取。
7303 0
|
计算机视觉 安全 自然语言处理
信息与通信工程——重要国际学术会议和国际顶级期刊(仅供参考)
<p><strong>一、信息与通信工程的重要国际学术会议</strong></p> <p>主要包含两类:</p> <p>A类会议:本学科最顶尖级水平的国际会议;<br></p> <p>B类会议:学术水平较高、组织工作成熟、按一定时间间隔系列性召开的国际会议。<br></p> <p><br></p> <p>A类会议(序号不表示优先顺序)<br></p> <p>序号 / 英文名称
10868 1
|
机器学习/深度学习 人工智能
2018全球Top 1000 计算机科学家h指数发布,中国29名学者上榜!
Guide2Research网站日前发布了2018年全球计算机科学和电子领域H-index排名前1000的科学家。密歇根州立大学的 Anil K. Jain 教授超越诺贝尔奖得主司马贺成为最新的榜首。源码资本的张宏江博士是中国第一。中国共有29名科学家上榜,距离美国(632人)仍有很远的距离。
2233 0
|
关系型数据库 分布式数据库 数据库