写在前面
葛兰素史克(GlaxoSmithKline)是一家全球制药公司,总部设在英国。葛兰素史克公司的使命是“帮助人们做到更多,感觉更舒适,生活更长久,改善人们的生活质量”。他们正在利用数据科学这种方法来研发可以提高人们生活质量的新药物配方。
在DockerCon 欧洲大会上,大数据解决方案总监Ranjith Raghunath和葛兰素史克公司呼吸系统数据科学总监 Lindsay Edwards一同分享了Docker 企业版(EE)是如何帮助他们公司通过一个名为“Edge Node”的项目来促进新药研发的速度。
如何利用数据科学提高产出?
制药研究面临的最大挑战是需要创造出数百种药物配方,而其中仅有3%的药物配方能真正的制成药物并流通上市。Lindsay Edwards 领导的数据科学小组专注于研究如慢性阻塞性肺病 ( COPD ) 和哮喘这类的呼吸系统疾病。他的小组使用大数据分析来挖掘研究数据和以前的患者试验数据,以便更快地得出结果。
数据科学作为一个新兴领域。在市面上,总会出现一些新的软件工具和开源数据分析解决方案,以及专门为这种类型的计算而设计的不同硬件和芯片组。然而每一种新兴技术可能都需要3到6个月的时间,才能被像葛兰素史克这样拥有高度监管机构的公司批准使用。
Lindsay 需要一个更快的方式让她的团队在不同的硬件平台上安全地测试和实验这些新技术,同时也可以让她的科学家们能够轻松的相互分享各自的研究成果。她的组织需要一个敏捷的平台,它可以支持不同的软件工具和应用程序,以及不同的硬件配置,同时还要可以根据需求扩展这些工具。
使用 Edge Node On Demand 进行快速原型设计
为满足数据科学小组的需要,Ranjith 需要一种方法,即可以快速向各种研究人员提供新技术,而又不需要依赖基础设施。他寻求了各种各样的方法,最终选择了Docker 企业版(EE),因为对研究人员来说它是最安全最高效的平台。
这些环境已经预先配置好了类似于通过Active Directory进行身份验证等企业必备的集成软件,但研究人员可以不受这类集成软件的限制,仍然可以根据自己的喜好来安装并使用适合他们的软件。使用Docker EE可以实现完全的基础设施独立性和真正的应用程序可移植性,从而使Lindsay的团队能够从一个集群转移到另一个集群,同时保持其完整性。
关于 Edge Node On Demand
名为Edge Node On Demand [ENOD] 的全新解决方案,由Docker EE提供支持,并与各种Cloudera集群和MongoDB结合。该解决方案为葛兰素史克提供了以下5点关键的好处:
- 单一接口——标准化的Docker EE 意味着所有不同的应用程序都可以以一种一致的方式进行处理。此外,Ranjith 的团队利用Docker API将环境信息整合到单一接口,该接口用于服务请求和追踪应用程序部署的情况。
- 用户隔离——每个研究人员都拥有一个与其他人隔离的实验沙盒。在这个实验沙盒中,他们可以大胆的进行实验而不必担心影响到其他人。
- 可复用性——如果研究人员一旦有所发现,他们就可以使用Docker EE轻松的一遍又一遍的重建并且重新部署相同的应用程序。
- 无缝迁移——无论是从开发环境转移到生产环境,还是从一个硬件配置转移到另一个硬件配置,Edge Node on Demand从真正意义上实现了跨环境的无缝迁移。
- 共享——Docker EE使葛兰素史克公司能够轻松地共享研究成果和实验数据,提高了合作效率并且加快了研发速度。
葛兰素史克公司的数据科学技术在最近的Hadoop Strata会议上为其获得了“年度最佳新秀”奖。他们使用Docker EE实现了创新的交付模式,这使得他们提高了研究效率,并有望发现更多拯救生命的药物。