近日,据美联社官网报道,MapD Technologies将MapD Core数据库发布到了开源社区。MapD是使用图形处理单元(GPU)以毫秒为单位分析数十亿行数据的先驱,比传统的基于CPU的数据库快几个数量级。MapD Core数据库及其可视化库开源让每个人都可以使用这个世界上最快的分析平台。
Todd是MapD Technologies创始人兼首席执行官,据其博客介绍,他们在5年前开始MapD项目时就一直希望将其开源,当时没有那么做,是因为他们希望等代码库成熟。现在,他们注意到,整个GPU ML和深度学习技术栈都是开源的,但却没有一个开源的数据处理引擎。开源MapD Core数据库就是为了填补这项空白。开源让他们可以和生态系统的其他部分整合。同时,他们还宣布,和Continuum Analytics及H2O.ai成立了GPU Open Analytics Initiative(GOAI),并公布了第一个项目GPU Data Frame(GDF)。该项目可以实现数据在GPU进程之间的高效交换,而且避免了复制数据的开销。
此次开源包含如下内容:
MapD Core开源数据库——MapD Core数据库源代码遵循Apache 2许可协议,提供了SQL查询多GPU加速所需要的一切; MapD可视化库——MapD提供了开源的JavaScript库,让用户可以构建基于MapD Core数据库的定制化Web可视化应用。该库包含生成图表、交叉筛选数据及管理MapD Core数据库连接的功能。其中,图表和交叉筛选库基于流行的Dimensional Charting项目(DC.js )。
同时,他们还公布了MapD分析平台企业版,其中包括MapD Core数据库、MapD Core GPU渲染引擎及MapD Immerse可视化分析客户端。它还提供了开源版本不具备的分布式扩展、高可用(HA)、LDAP及ODBC特性。他们的路线图上还有其他后续会增加到企业版的特性,尤其是在安全方面。
此外,MapD还发布了一个社区版本,供非商业开发和学术使用。MapD社区版遵循非商业性的学术许可,包含MapD Core数据库、GPU渲染引擎及MapD Immerse可视化分析客户端。
这一消息引起了广泛的反响。New Enterprise Associates投资合伙人Greg Papadopoulos表示:
一个开源的GPU数据库将会让全新的应用程序成为可能,尤其是在机器学习方面,GPU在这方面的影响是如此之大。和MapD合作,我们非常自豪,因为它迈出了关键的一步。
加州大学教授John Owens则表示:
我的研究小组主要是针对并行计算设备,尤其是GPU,开发更快的算法。一段时间以来,MapD正在做的工作给我们留下了深刻的印象,只是希望我们可以在研究中把它作为真实世界的测试平台。现在,他们开源了自己的数据库产品,我们的团队很高兴将其作为研究平台,并向其代码库做贡献。
DGX Systems NVIDIA总经理Jim McHugh认为,MapD开源Core数据库的决定意义重大,它进一步激励了本来就已经很活跃的GPU分析社区。
本文转自d1net(转载)