什么是Streamlit

简介: 什么是Streamlit

最近,我在数据分析的一些任务中尝试了闻名已久的Streamlit,再一次感受到Python的强大之处。

于是,准备根据自己的掌握情况,写一个介绍Streamlit的系列。

本文作为第一篇, 先介绍介绍Streamlit是什么,以及它和Jupyter和传统Web应用的区别。

  1. 是什么

Streamlit是一个用于快速构建数据科学和机器学习应用程序的Python库,

使用Streamlit,我们可以使用简单的Python代码来创建交互式和可视化的应用,无需深入掌握前端技术或编写大量的底层代码。

Streamlit的发展历史可以追溯至2019年10月,当时Streamlit是作为一个专门针对机器学习和数据科学的应用开发框架而发布的。

刚开始的设计目标是取代Flask在机器学习项目中的地位,帮助机器学习工程师快速开发用户交互工具。

Streamlit的核心理念是“Scriptability”,即用户只需编写简单的Python脚本,就可以构建出一个完整的应用程序。

所以,Streamlit中封装了大量的交互式组件,支持表格、图表、数据表等对象的渲染,并具备栅格化响应式布局能力。

随后,Streamlit逐渐发展并受到数据科学社区的广泛关注。

其开源的性质和简洁高效的设计哲学受到越来越多的数据科学家和开发者的喜爱,他们使用Streamlit创建和分享各种美观的、交互式的Web应用。

Streamlit也开始支持越来越多的数据可视化库,如Matplotlib、Plotly和Altair等,使得在应用中集成丰富的图表和视觉化元素变得非常简单。

值得一提的是,Streamlit在发展过程中还经历了被Snowflake收购的重要事件,

这一收购进一步推动了Streamlit在数据科学和机器学习领域的应用和发展。

对我来说,使用Streamlit最大的好处是,只要会Python就能构建一个漂亮的交互式应用,

不需要再陷入编写前端时,为了调整一个样式折腾半天的痛苦。

  1. 用在哪里

以我自己的使用经验,Streamlit主要用在两个地方。

其一是在数据分析和机器学习项目的早期,使用Streamlit快速构建一个应用来探索项目中的各种可能性。

也可以用来做项目的原型,这比做静态原型要好很多,一方面可以轻易的实现各种交互,

另一方面,其中的图表组件可以将结果动态展示出来,更好的给客户演示项目可能的效果。

另一个可以使用的地方是教学演示,比如想做线上课程时,它可以让讲师轻松地将复杂的数据转化为直观的图表和图像,帮助学员更好地理解数据和背后的知识。

同时,Streamlit的交互式特性允许学员在界面上进行实时操作和探索,这大大增强了学习的参与度和互动性。

此外,Streamlit还支持多种数据科学库和工具的集成,使得讲师可以根据教学需求自由选择和组合不同的工具,进一步丰富教学内容和形式。

对于用户量有一定规模的应用,比如需要认证,权限以及其他业务功能时,不建议使用Streamlit。

毕竟,传统的前后端开发方式还是更容易应对业务的频繁变更,也利于多人协作开发。

  1. 与Jupyter相比

使用Streamlit之前,我在项目早期用的比较多的是Jupyter notebook。

Jupyter也是交互式的,可以一边编码一边看结果,还可以结合markdown写一些说明文档。

使用之后,我感觉两者之间的区别主要有:
3.1. 交互性

Streamlit提供简洁的用户界面,其中可以轻松添加各种控件(如按钮、滑块等)。

而Jupyter是以笔记本形式组织代码、文本和可视化输出。支持代码块的即时执行和结果展示。

相比之下,Jupyter是以代码的形式分享,更适合自己尝试各种数据分析的路径,以及在开发人员之间分享。

Streamlit以应用的形式分享,不需要了解代码,可以直接操作界面,更适合给客户分享。
3.2. 可视化能力

Streamlit内置了丰富的可视化组件,支持多种图表类型和交互式数据展示,可以轻松地将数据分析结果以图表形式呈现给用户。

Jupyter需要通过代码块生成各种可视化图表,通常是导入其他第三方库(如matplotlib、seaborn等)来帮助实现。其可视化能力很大程度依赖于所使用的库和开发者的编程技能。

相比之下,Streamlit对开发者的编程技能要求更低一些,因为使用内置封装好的组件比直接使用第三方可视化库要简单很多。
3.3. 扩展性

Streamlit本身就是纯粹的Python代码文件,所以可以很轻松地将现有的Python代码转集成到Streamlit应用中,并通过添加控件和可视化组件来增强应用功能。

Jupyter是以笔记形式组织的代码块,并不是纯粹的Python代码,代码的复用和扩展更多依赖于代码块的组合和笔记本的编辑,需要考虑更多。

相比之下,Streamlit扩展更加简单,功能复杂度提高之后,封装一些通用功能,布局代码结构也更加直观。
[box.azvii.com)
[box.back2myself.com)
[box.bike-way.net)
[box.bingoufan.com)
[box.chen-an-zhi.net)
[box.bgmake.com)

  1. 与Web应用相比

Streamlit功能是介于Jupyter和传统Web应用之间的,比Jupyter强但是比传统Web应用弱。

最近没怎么做过数据分析和机器学习相关的Web应用了,对于两者的比较可能会考虑不周。

Streamlit的交互性上一节已经提过,传统Web应用的交互性无需多说,几乎是没有上限的,看看现在互联网上各式各样的Web应用就知道了。

不过,对于专注于数据分析和机器学习方面的开发人员来说,

传统Web应用的开发过于困难,不仅需要掌握多种技术和工具,还需要编写大量的前端和后端代码,以及进行复杂的调试和测试。

上一节提到的其他两点,可视化能力和扩展性。

传统Web应用能做到的也肯定比Streamlit强,Web应用发展这么多年,

尤其是近些年前端的飞速发展,Web应用既可以做各种复杂的游戏,也可以做业务复杂的电子商务平台等等。

问题仍然在于开发的困难程度,选择的时候得看你的应用有多复杂,你的团队是否能够覆盖开发Web应用所需要的各类技术。

  1. 总结

总的来说,Streamlit,Jupyter和传统的Web应用三者各有适合的应用场景,并不是某一种可以完全取代另一种。

具体如何选择可以参考下图:

对于专注于数据分析和机器学习方向的个人或者学生来说,Streamlit绝对值得一试。

相关文章
|
23天前
|
弹性计算 人工智能 架构师
阿里云携手Altair共拓云上工业仿真新机遇
2024年9月12日,「2024 Altair 技术大会杭州站」成功召开,阿里云弹性计算产品运营与生态负责人何川,与Altair中国技术总监赵阳在会上联合发布了最新的“云上CAE一体机”。
阿里云携手Altair共拓云上工业仿真新机遇
|
16天前
|
存储 关系型数据库 分布式数据库
GraphRAG:基于PolarDB+通义千问+LangChain的知识图谱+大模型最佳实践
本文介绍了如何使用PolarDB、通义千问和LangChain搭建GraphRAG系统,结合知识图谱和向量检索提升问答质量。通过实例展示了单独使用向量检索和图检索的局限性,并通过图+向量联合搜索增强了问答准确性。PolarDB支持AGE图引擎和pgvector插件,实现图数据和向量数据的统一存储与检索,提升了RAG系统的性能和效果。
|
20天前
|
机器学习/深度学习 算法 大数据
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
2024“华为杯”数学建模竞赛,对ABCDEF每个题进行详细的分析,涵盖风电场功率优化、WLAN网络吞吐量、磁性元件损耗建模、地理环境问题、高速公路应急车道启用和X射线脉冲星建模等多领域问题,解析了问题类型、专业和技能的需要。
2575 22
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
|
18天前
|
人工智能 IDE 程序员
期盼已久!通义灵码 AI 程序员开启邀测,全流程开发仅用几分钟
在云栖大会上,阿里云云原生应用平台负责人丁宇宣布,「通义灵码」完成全面升级,并正式发布 AI 程序员。
|
3天前
|
JSON 自然语言处理 数据管理
阿里云百炼产品月刊【2024年9月】
阿里云百炼产品月刊【2024年9月】,涵盖本月产品和功能发布、活动,应用实践等内容,帮助您快速了解阿里云百炼产品的最新动态。
阿里云百炼产品月刊【2024年9月】
|
2天前
|
存储 人工智能 搜索推荐
数据治理,是时候打破刻板印象了
瓴羊智能数据建设与治理产品Datapin全面升级,可演进扩展的数据架构体系为企业数据治理预留发展空间,推出敏捷版用以解决企业数据量不大但需构建数据的场景问题,基于大模型打造的DataAgent更是为企业用好数据资产提供了便利。
162 2
|
20天前
|
机器学习/深度学习 算法 数据可视化
【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析、数学模型、python 代码
2024年中国研究生数学建模竞赛C题聚焦磁性元件磁芯损耗建模。题目背景介绍了电能变换技术的发展与应用,强调磁性元件在功率变换器中的重要性。磁芯损耗受多种因素影响,现有模型难以精确预测。题目要求通过数据分析建立高精度磁芯损耗模型。具体任务包括励磁波形分类、修正斯坦麦茨方程、分析影响因素、构建预测模型及优化设计条件。涉及数据预处理、特征提取、机器学习及优化算法等技术。适合电气、材料、计算机等多个专业学生参与。
1575 16
【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析、数学模型、python 代码
|
22天前
|
编解码 JSON 自然语言处理
通义千问重磅开源Qwen2.5,性能超越Llama
击败Meta,阿里Qwen2.5再登全球开源大模型王座
968 14
|
3天前
|
Linux 虚拟化 开发者
一键将CentOs的yum源更换为国内阿里yum源
一键将CentOs的yum源更换为国内阿里yum源
211 2
|
17天前
|
人工智能 开发框架 Java
重磅发布!AI 驱动的 Java 开发框架:Spring AI Alibaba
随着生成式 AI 的快速发展,基于 AI 开发框架构建 AI 应用的诉求迅速增长,涌现出了包括 LangChain、LlamaIndex 等开发框架,但大部分框架只提供了 Python 语言的实现。但这些开发框架对于国内习惯了 Spring 开发范式的 Java 开发者而言,并非十分友好和丝滑。因此,我们基于 Spring AI 发布并快速演进 Spring AI Alibaba,通过提供一种方便的 API 抽象,帮助 Java 开发者简化 AI 应用的开发。同时,提供了完整的开源配套,包括可观测、网关、消息队列、配置中心等。
731 10