DataV Note:让Jupyter Notebook绽放新活力

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
实时计算 Flink 版,5000CU*H 3个月
简介: 分享阿里云旗下的一款基于Jupyter底座的工具(DataV Note,智能分析文档)给大家。这是一款以Notebook文档形式为基础、由强大AI模型驱动的智能分析、允许多人协作的数据可视分析平台。

一、导读

Jupyter Notebook的官网定义:是一个基于网络的交互式计算平台。该笔记本结合了实时代码方程式叙述性文本可视化交互式仪表板其他媒体。换句话来说,假如你有数据加工数据分析模型训练绘图写作的需求,那Jupyter Notebook绝对是你不二的选择。

image.png

二、背景:

众所周知,虽然Jupyter的生态相当的丰富,但Jupyter Notebook的安装、上手成本是较高,而且由于Jupyter Notebook的原生设计限制,导致使用不便。我花了一些时间收集社区上对Jupyter的使用意见,总结分以下几点:

  • 安装成本高:依赖操作系统;依赖Python环境
  • 上手成本高:过程由纯代码实现;没有AI辅助
  • 浏览数据困难
  • 对于DB、Excel、JSON的数据来说,没办法方便地查看数据,只能用Py代码查询出来看
  • 如下图所示,由于Jupyter Notebook采用了数据探索性分析(Exploratory Data Analysis,简称EDA),上一个单元格的输出作为下一个单元格的输入。但原生的Jupyter Notebook没有把所有变量管理起来,而且没办法看到kernel内变量的具体值,每次分析都变得无法追溯。

image.png

  • 交互性弱:通常在Jupyter Notebook中都是使用matplotlib来绘图,但绘图的美观性和交互性都不如人意。

image.png

  • IDE的功能弱:无法选中运行;代码提示弱

三、分享

分享阿里云旗下的一款基于Jupyter底座的工具(DataV Note,智能分析文档)给大家。这是一款以Notebook文档形式为基础、由强大AI模型驱动的智能分析、允许多人协作的数据可视分析平台。

image.png

这款工具不仅能完美地解决以上的问题,并且在可视化领域和大模型辅助的领域有出人意料的效果,这就给大家介绍一下:

(1)无安装成本

不需要安装,直接云上使用,默认帮你配置初始化Jupyter依赖的所有环境,并且内核配备了常用的Py库进去,假如你需要安装自己需要的库,简单执行以下命令即可:

image.png

完全适配原生ipynb文件格式导入

image.png

(2)上手成本低:AI全面加持
  • NLP2SQL(自然语言生成SQL):业务人员可一键生成SQL并进行取数、聚合

nl2sql.gif

  • NLP2Python(自然语言生成Python):相比于SQL,Python代码具有更高的灵活性,通过 Python 代码可以生成算法预测和归因分析模块

nl2py.gif

  • AI智能绘图:系统将自动识别表中每个字段的数据类型,并根据抽样数据的特征智能推荐最适合的数据可视化图表

ai_draw.gif

(3)管理数据源:中间变量、文件、数据库;并轻松浏览数据

image.png

(4)图表交互高
  • 丰富的图表类型
  • 拖拽实现绘图
  • 强大的信息标注功能
  • 丰富的主题样式设置功能

image.png

(5)IDE的功能增强
  • 可选择运行
  • 提示增强
  • 代码可折叠

image.png

四、点睛之笔

惊喜的是,DataV Note是分为两种形态:编辑态预览态。编辑态为上述分析的过程;在预览态中,提供了丰富的定制化功能,包括主题选择布局调整样式优化水印添加等,确保展示材料既专业又美观。与此同时,还支持导出为PngPdfWord格式,并可通过钉钉微信邮件轻松分享,满足多样化的汇报需求。

image.png

image.png

五、总结:

从本地传统Jupyter Notebook的工具,到全新Jupyter Notebook云时代,跨部门在同一个Notebook画布中协同创作,边写代码边绘图的感觉非常爽,而且做好的文档还能数字化下来月度、年度复用;同时,DataV Note提供了很多AI小功能十分惊喜,例如:根据数据AI绘图自然语言生成SQL、Python等等;此外,价格感人,有任何问题直接放到钉钉群答疑,服务到位,绝对是Jupyter用户不错的选择。

相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
阿里云实时数仓实战 - 项目介绍及架构设计
课程简介 1)学习搭建一个数据仓库的过程,理解数据在整个数仓架构的从采集、存储、计算、输出、展示的整个业务流程。 2)整个数仓体系完全搭建在阿里云架构上,理解并学会运用各个服务组件,了解各个组件之间如何配合联动。 3 )前置知识要求   课程大纲 第一章 了解数据仓库概念 初步了解数据仓库是干什么的 第二章 按照企业开发的标准去搭建一个数据仓库 数据仓库的需求是什么 架构 怎么选型怎么购买服务器 第三章 数据生成模块 用户形成数据的一个准备 按照企业的标准,准备了十一张用户行为表 方便使用 第四章 采集模块的搭建 购买阿里云服务器 安装 JDK 安装 Flume 第五章 用户行为数据仓库 严格按照企业的标准开发 第六章 搭建业务数仓理论基础和对表的分类同步 第七章 业务数仓的搭建  业务行为数仓效果图  
目录
打赏
0
34
34
0
41
分享
相关文章
DataV Note | 又在为年终报告头疼?让 AI 成为你的得力助手!
DataV Note | 又在为年终报告头疼?让 AI 成为你的得力助手!
164 2
数据团队必读:智能数据分析文档(DataV Note)五种高效工作模式
数据项目复杂,涉及代码、数据、运行环境等多部分。随着AI发展,数据科学团队面临挑战。协作式数据文档(如阿里云DataV Note)成为提升效率的关键工具。它支持跨角色协同、异构数据处理、多语言分析及高效沟通,帮助创建知识库,实现可重现的数据科学过程,并通过一键分享报告促进数据驱动决策。未来,大模型AI将进一步增强其功能,如智能绘图、总结探索、NLP2SQL/Python和AutoReport,为数据分析带来更多可能。
238 21
vue2+datav可视化数据大屏(3)
接上一节所说,当我们将接口封装完了后,我们需要给大屏进行内容填充啦
982 0
vue2+datav可视化数据大屏(2)
接上一节所说 我们已经讲骨架搭好 这节我们讲述的如何在vue2中使用mock数据和封装axios
578 0
vue2+datav可视化数据大屏(1)
最近打算出一个前端可视化数据大屏的系列专栏,这次将很全面的教大家设计可视化大屏,从开始到打包结束,其中,包括如何设计框架,如何封装axios,等等,本次使用的数据均为mock数据。与正常使用一致。本文会从开始的创建vu23项目到最后的项目打包,本篇共计3节。
1507 1
react+datav+echarts实现可视化数据大屏
最近有点闲,就学习了下react,没想到就把react学完了,觉得还不错,就打算出一把react+datav的简易版可视化数据大屏供大家做个参考
1035 2
react+datav+echarts实现可视化数据大屏
vue3+DataV+Echarts搭建数据大屏模板(建议收藏)
vue3+DataV+Echarts搭建数据大屏模板(建议收藏)
2420 0
vue3+DataV+Echarts搭建数据大屏模板(建议收藏)
使用阿里云dataV实现大屏自动轮播
使用阿里云dataV实现大屏自动轮播进行动态展示
1985 0
使用阿里云dataV实现大屏自动轮播
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问