Cloudera 发布自助式数据科学开发环境 原生支持 R、Python、Scala 和各大开源框架

简介:

相关技术来自于 Cloudera 去年收购的数据科学初创公司 Sense.io。该产品的最大特点是原生支持 Apache Spark、Hadoop 和 R、Python、Scala 等开发语言。 开发者能在 Cloudera 的企业平台上同时使用这些工具和语言,这将加速数据分析项目从研发到最终产品的过程。

Cloudera 高级副总裁  Charles Zedlewski 表示:

“Cloudera 专注于提升数据科学和工程团队的使用体验,尤其是想要用 Spark 来协助数据处理和机器学习,来对分析任务进行扩展的用户。对 Sense.io 的收购,以及其团队的加入,为该产品提供了牢固的基石。Data Science Workbench 向我们的客户,提供了开展大规模自助式数据科学工作的能力。”

Cloudera 发布自助式数据科学开发环境 原生支持 R、Python、Scala 和各大开源框架

 Charles Zedlewski (中)

那么,Cloudera Data Science Workbench 具体能够带来什么?

对于数据科学家:

  • 能在多个开源软件库和框架上使用 R, Python 和 Scala。可以直接在浏览器使用。

  • 使用 Spark 和 Impala,能直接从十分安全的 Hadoop 数据簇获取数据。

  • 与团队分享经验。

对于 IT 管理者:

  • 给你的数据科学团队更高的工作灵活性

  • 服从完整的 Hadoop 安全方案,尤其是 Kerberos

  • 既能在本地运行,也能在云端。

现在,正是数据科学开源浪潮一浪高过一浪,不但席卷 Python 和 R语言生态,还吸纳进各个深度学习框架(比如 Tensorflow、Microsoft Cognitive Toolkit、MXnet、BigDL 等)的时候。数据科学团队需要将这些工具应用于 Hadoop 环境下的数据。Cloudera Data Science Workbench 便是为此而设计。

雷锋网消息,在大会上 Charles Zedlewski 进一步解释道:

“我们的 IT 企业客户往往对于怎么让数据科学家在分享环境下工作十分头疼。这是由于,数据科学家们的需求十分多样,尤其是涉及到开源工具。这经常导致重复工作、有限的安全性和管理,以及 analytic silos。同时,数据科学家一直在寻找,把他们的工作扩展到更大的数据集和更强大计算平台上的方法。通过 Data Science Workbench,Cloudera 帮助 IT 团队和数据科学家相互协作,把更多用户带到共享的环境中。我们的方案既保证灵活性,又在关键的安全环节不妥协。”

详情:https://www.cloudera.com/products/data-science-and-engineering/data-science-workbench.html 




本文作者:三川
本文转自雷锋网禁止二次转载, 原文链接
目录
相关文章
|
22天前
|
机器学习/深度学习 数据可视化 数据挖掘
探索Python的奥秘:数据科学中的利器
本文将深入探讨Python编程语言在数据科学领域的强大应用。通过简洁易懂的语言,我们将解析Python的核心概念、流行库以及在实际项目中的应用,帮助您理解为何Python成为数据科学家的首选工具。
37 0
|
3月前
|
机器学习/深度学习 IDE 开发工具
Python集成开发环境的选择
【7月更文挑战第6天】Python集成开发环境的选择
52 2
|
16天前
|
机器学习/深度学习 数据可视化 TensorFlow
探索Python在数据科学中的应用
这篇文章深入探讨了Python编程语言在数据科学领域的强大应用。从数据处理、分析到可视化,再到机器学习和深度学习,Python因其丰富的库和框架而成为数据科学家的首选工具。文章不仅介绍了Python的基本语法和数据结构,还详细讨论了如何使用Pandas进行数据清洗和预处理,以及NumPy和SciPy在数值计算中的重要性。此外,文章还涵盖了使用Matplotlib和Seaborn进行数据可视化的技巧,以及Scikit-learn和TensorFlow在构建预测模型中的应用。通过综合运用这些工具,数据科学家能够更有效地分析大量复杂的数据集,从而洞察趋势、模式和关联性,支持决策制定和策略优化。
21 2
|
28天前
|
数据采集 机器学习/深度学习 数据可视化
Python 在数据科学中的应用
这篇文章将深入探讨 Python 在数据科学中的多种应用,包括数据清洗、数据分析、可视化及机器学习。我们将通过实例展示如何利用 Python 的强大库和工具,如 Pandas、NumPy、Matplotlib、Seaborn 以及 Scikit-learn,来高效地进行数据处理与分析。无论您是初学者还是有经验的开发者,这篇文章都能为您提供宝贵的见解和实用技巧。
|
2月前
|
SQL 关系型数据库 API
Python 开发环境的准备以及一些常用类库模块的安装
在学习和开发Python的时候,第一步的工作就是先准备好开发环境,包括相关常用的插件,以及一些辅助工具,这样我们在后续的开发工作中,才能做到事半功倍。下面介绍一些Python 开发环境的准备以及一些常用类库模块的安装和使用的经验总结,供大家参考了解。
|
2月前
|
Python
Mac安装Python3.12开发环境
Mac安装Python3.12开发环境
124 2
|
2月前
|
开发工具 Python Windows
【Python专栏】搭建Pyhthon运行环境及开发环境 | 安装Python | 安装PyCharm
【Python专栏】搭建Pyhthon运行环境及开发环境 | 安装Python | 安装PyCharm
129 4
|
2月前
|
机器学习/深度学习 数据采集 数据可视化
使用Python进行数据科学入门指南
【8月更文挑战第6天】使用Python进行数据科学是一条充满挑战和机遇的道路。本文提供了入门指南,帮助您快速上手Python数据科学。通过实践项目和资源推荐,您将能够深入学习Python数据科学,成为一名合格的数据科学家。
|
3月前
|
机器学习/深度学习 数据采集 IDE
使用Python进行数据科学探索
【7月更文挑战第30天】通过本文,我们了解了如何使用Python进行数据科学探索的全过程,从环境搭建、数据收集、清洗、分析到机器学习应用。Python的强大功能和丰富的库使得数据科学探索变得简单而高效。希望这篇文章能为您的数据科学之旅提供有价值的参考。随着实践的深入,您将逐渐掌握更多高级技术和方法,解锁数据背后的无限潜力。
|
3月前
|
IDE 数据可视化 安全
Python学习中设置开发环境
【7月更文挑战第26天】
31 2