癌症基因的探索 : 路漫漫其修远

简介: 【大数据文摘】翻译:孙强 校对:夏之未至(转载请保留)   癌症是细胞基因出了问题而得的疾病。当某些基因发生变异,会导致细胞行为表现怪异。细胞分裂迅速,并躲过人体免疫系统的杀伤,从母体获取生长所需的营养,并最终发展成肿瘤。

 

癌症是细胞基因出了问题而得的疾病。当某些基因发生变异,会导致细胞行为表现怪异。细胞分裂迅速,并躲过人体免疫系统的杀伤,从母体获取生长所需的营养,并最终发展成肿瘤。

 

科学家们在20世纪70年代开始研究并鉴定这些癌症基因,已知的癌症基因数量逐年增长。通过研究它们,科学家会更清楚不同类型的癌症如何发展,甚至在某些情况下,还能够开发针对这些基因的靶向药物。 例如,去年五月美国食品和药物管理局批准的名为Tarceva的治疗肺癌的一线药物,就是针对其中一个叫做EGFR的变异基因。

 

美国国立卫生研究院,为加快癌症基因的鉴定,于2005年批准了一个雄心勃勃的项目 “癌症基因组图谱(The Cancer Genome Atlas)” 。 该项目涵盖了超过20种癌症,每种癌症分析了大约500个样本,发现了很多的新基因。 该项目搜集的海量基因组数据已经帮助科学家们更好的了解了癌细胞是怎样利用人体的资源发展成肿瘤的。

 

冷泉港实验室的总裁布鲁斯•斯蒂尔曼博士说:“癌症基因组图谱项目取得了令人瞩目的成就,这一点毫无疑问 ”。但现在随着该项目即将结束,从属麻省理工学院和哈佛大学的Broad研究所的研究人员最近在Nature杂志上发表了一项研究,讨论癌症研究应该何去何从。 他们估计,科学家们将至少需要检测约10万癌症样本,以鉴定涉50种不同癌症的癌症基因:这一样本数是癌症基因组图谱项目所测样本数的10倍,而该项目的资助高达3亿7千5百万美元,目前已经收集了几十个Terabytes的各种基因组数据供全世界科学家研究。

 

Broad研究所的所长埃里克•S兰德博士(也是该研究的作者之一)说:“我们现在知道怎样才能建立一个完整的癌症基因目录,我们现在才刚刚开始,还有很多东西要学习。”传统上,科学家们通过比较癌细胞与健康细胞来确定癌基因。如果他们发现在统计意义上不寻常的高数量细胞在某个特定的基因存在突变,他们就会进一步研究该基因,看它是否确实有助于细胞癌化 - 或者它只是一个无害的突变。

 

兰德博士和他的同事怀疑这种方法可能会错过一些癌基因。 虽然一些癌基因会影响某种癌症的大多数癌细胞,但也有些基因只涉及肿瘤的一小部分细胞。前文所提的Tarceva能够治疗的EGFR基因,其突变只占非小细胞肺癌病例的10%。太少的癌细胞样本可能找不到这种低频率突变。

 

Broad研究所的研究人员认为通过同时检测多个癌症类型,他们能找到一些常规方法找不到的基因,因为这些基因可能不限于单一类型的癌症。在他们的新研究中,他们分析了来自21种癌症的共4,742样本,一部分样本来自癌症基因组图谱项目,另一部分是Broad研究所自己搜集的。


这项新研究检测到了许多其他科学家此前已经在这21种癌症样本种找到的基因。 但他们也新发现了不少曾经被忽视的致癌基因。 他们总共确定了33个基因,这些基因被高度怀疑促进细胞癌化过程。这可能使得癌症基因目录的基因数量增加约 25%。

 

“对我来说这真是大开眼界。”兰德博士说。兰德博士和他的同事们开始怀疑,如果科学家们检测更多的癌症样本,可能会发现更多的致癌基因。 癌症基因目录的建立工作,或许才刚刚开始?
“我们第一次开始怀疑,”我们的路还有多远?“兰德博士说。


他们从自己的结果预测,以了解科学家将需要检测多少样本,以发现某特定类型的癌症中至少占2%癌细胞的大部分癌症基因。要找到涉及50种最常见癌症的癌基因,研究人员估计,他们将不得不分析10万个样本。 换句话说,癌症基因组图谱项目分析的样本量,只占该预测样本量的十分之一


兰德博士认为,癌症基因组项目能以合理的成本来完成,而且还可以得到慈善组织或国际合作伙伴的支持。他说,现在大家应该来讨论一下随着科学的发展,我们将在何时完成癌症基因组目录的编录。


“如果有人说,'我不知道还需要五年,甚至10年才能完成这一科学使命”,这样怀疑是有道理的,“兰德博士说。 “但我更希望早一些知道。”



原文发布时间为:2014-03-14


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号
相关文章
|
安全 JavaScript Java
SpringBoot实现定时发送邮件
SpringBoot实现定时发送邮件
245 0
|
10月前
|
缓存 Rust 算法
从混沌到秩序:Python的依赖管理工具分析
Python 的依赖管理工具一直没有标准化,主要原因包括历史发展的随意性、社区的分散性、多样化的使用场景、向后兼容性的挑战、缺乏统一治理以及生态系统的快速变化。依赖管理工具用于处理项目中的依赖关系,确保不同环境下的依赖项一致性,避免软件故障和兼容性问题。常用的 Python 依赖管理工具如 pip、venv、pip-tools、Pipenv、Poetry 等各有优缺点,选择时需根据项目需求权衡。新工具如 uv 和 Pixi 在性能和功能上有所改进,值得考虑。
330 35
|
11月前
|
存储 程序员 编译器
C 语言中的数据类型转换:连接不同数据世界的桥梁
C语言中的数据类型转换是程序设计中不可或缺的一部分,它如同连接不同数据世界的桥梁,使得不同类型的变量之间能够互相传递和转换,确保了程序的灵活性与兼容性。通过强制类型转换或自动类型转换,C语言允许开发者在保证数据完整性的前提下,实现复杂的数据处理逻辑。
|
数据采集 存储 自然语言处理
基于Python的微博热点李佳琦忒网友话题的评论采集和情感分析的方法,利用情感分析技术对评论进行情感倾向性判断
本文介绍了一种基于Python的方法,用于采集微博热点话题下的评论数据,并运用情感分析技术对这些评论进行情感倾向性判断,进而通过统计分析和可视化技术展示网友对特定话题的情感态度,对品牌或个人形象管理、用户需求发现、舆情监测和危机管理等方面具有重要价值。
379 2
基于Python的微博热点李佳琦忒网友话题的评论采集和情感分析的方法,利用情感分析技术对评论进行情感倾向性判断
算法备案提示主体名称已被填报,请修改后再进行填报怎么办?
在数字化浪潮中,算法备案是企业合规运营的关键。近期有企业在提交主体备案时遇“主体名称已被填报”的提示,原因是内部信息沟通不畅。解决方案包括找回原账号继续操作或驳回申请重新提交。为预防类似问题,企业应建立备案档案、加强团队沟通并明确责任分工,确保备案流程顺利进行。
|
11月前
|
人工智能 前端开发 Serverless
解决方案评测:主动式智能导购AI助手构建
解决方案评测:主动式智能导购AI助手构建
291 3
|
安全 量子技术 数据安全/隐私保护
解密未来:量子加密技术在信息安全领域的革新展望
【10月更文挑战第28天】信息安全是现代社会的重要组成部分,量子加密技术作为新兴手段,利用量子力学原理,为信息安全带来革命性变革。本文介绍量子密钥分发(QKD)的基本原理,并通过代码示例展示其实际应用潜力。量子加密具有无条件安全、抗量子计算攻击等优势,未来有望成为保护信息安全的重要工具。
503 6
|
监控 算法 项目管理
闲聊项目经理和技术经理的区别
【10月更文挑战第24天】项目经理和技术经理在职责、技能要求、关注重点、管理对象等方面存在明显差异。项目经理负责项目整体规划、资源协调、风险管理及交付;技术经理则侧重技术研发、技术方案制定、团队建设和技术标准维护。项目经理需具备出色的沟通协调、项目管理和风险管理能力,而技术经理则需拥有深厚的技术专长、团队管理能力和持续学习的精神。两者虽有不同,但需紧密合作,共同推动项目成功。
478 4
|
监控 算法 数据安全/隐私保护
基于三帧差算法的运动目标检测系统FPGA实现,包含testbench和MATLAB辅助验证程序
本项目展示了基于FPGA与MATLAB实现的三帧差算法运动目标检测。使用Vivado 2019.2和MATLAB 2022a开发环境,通过对比连续三帧图像的像素值变化,有效识别运动区域。项目包括完整无水印的运行效果预览、详细中文注释的代码及操作步骤视频,适合学习和研究。
|
机器学习/深度学习 算法 数据可视化
如果你的PyTorch优化器效果欠佳,试试这4种深度学习中的高级优化技术吧
在深度学习领域,优化器的选择对模型性能至关重要。尽管PyTorch中的标准优化器如SGD、Adam和AdamW被广泛应用,但在某些复杂优化问题中,这些方法未必是最优选择。本文介绍了四种高级优化技术:序列最小二乘规划(SLSQP)、粒子群优化(PSO)、协方差矩阵自适应进化策略(CMA-ES)和模拟退火(SA)。这些方法具备无梯度优化、仅需前向传播及全局优化能力等优点,尤其适合非可微操作和参数数量较少的情况。通过实验对比发现,对于特定问题,非传统优化方法可能比标准梯度下降算法表现更好。文章详细描述了这些优化技术的实现过程及结果分析,并提出了未来的研究方向。
390 1