基于 Datasheet 二次开发：一个纯浏览器端的 PostgreSQL 数据分析工具-阿里云开发者社区

基于 Datasheet 二次开发：一个纯浏览器端的 PostgreSQL 数据分析工具

2026-06-29 33

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 一款无需安装、直接在浏览器中运行的数据管理工具，让 SQL 查询和数据可视化触手可及

一款无需安装、直接在浏览器中运行的数据管理工具，让 SQL 查询和数据可视化触手可及

缘起：积分统计的烦恼

最近我一直在使用 CodeBuddy 和 WorkBuddy 辅助日常开发工作。每次对话都会生成详细日志，记录着使用了哪些模型、消耗了多少积分、调用时间。这些数据被导出为一个 Excel 文件，按理说用 Excel 做统计分析应该很轻松——但现实总是不那么理想。

我对 Excel 的使用并不算精通，复杂的数据透视表、公式统计常常把我绕晕。每次想统计"某月各模型的使用次数与积分消耗"或"某月每天的积分使用趋势"时，我都得在 Excel 里折腾半天，结果还常常出错。

更理想的方式是什么呢？把数据导入数据库，用 SQL 查询——这才是我最顺手的方式。但每次都要启动本地数据库、写导入脚本，实在太麻烦了。我想要的是一款工具：

无需安装，打开浏览器就能用
支持 SQL 查询，用我最熟悉的方式分析数据
数据持久化，刷新页面不会丢失
最好还能有一些可视化能力，让数据更直观

正好，我在 GitHub 上刷到了一个很有意思的开源项目——Datasheet。它基于 PGlite 在浏览器中运行完整的 PostgreSQL 数据库，数据存储在 IndexedDB 中，完美满足了我"浏览器内 SQL 分析"的需求。

于是我 Fork 了这个项目，在使用过程中修复了一些 Bug，根据实际需求新增了不少功能。现在把我的修改记录下来，希望能帮到有类似需求的朋友。

项目地址：https://github.com/xiuji008/datasheet

在线体验：https://xiuji008.github.io/datasheet/

什么是 Datasheet？

Datasheet 是一个基于浏览器的 PostgreSQL 数据管理工具，核心技术是 PGlite——一个将 PostgreSQL 编译为 WebAssembly 的方案，可以在浏览器中直接运行完整的 PG 数据库。

原项目的核心特性

浏览器内 PostgreSQL：无需安装数据库，数据持久化到 IndexedDB
多工作区管理：通过 Schema 隔离，支持创建/切换/删除工作区
SQL 编辑器：基于 CodeMirror，支持语法高亮、智能提示
数据导入：从 Excel/CSV 导入数据，可视化配置映射关系
表结构浏览：左侧栏展示数据库表列表
查询结果编辑：表格形式展示，支持直接编辑并保存

我做了哪些修改？

说明：此项目基于开源项目 Datasheet 二次开发，在原作基础上修复了若干 Bug 并新增了大量功能。感谢原作者的开源贡献。

Bug 修复

1. 数据导入表头错误

问题：导入 Excel 时，表头被当作数据行一起导入。

原因：ImportDialog.vue 中获取数据行时使用了错误的切片起点。原代码用 headerRow 作为切片起点，实际上应该用 dataStartRow。

修复后：数据从正确的行开始读取，表头独立映射为列名。

2. 查询结果首行缺失

问题：执行 SELECT 查询后，结果集的首行数据不显示。

原因：index.vue 中对查询结果做了 rows.slice(1) 处理，原本可能用于跳过表头，但这导致真正的数据行被错误跳过。对于聚合查询（如 SUM、COUNT），结果只有一行时会直接不显示。

修复后：不再对查询结果进行切片，完整显示所有行。

3. 类型推断精度不足

问题：导入数据时，如果数值列后续行有大数值，会报 numeric field overflow 错误。

原因：useImport.ts 中类型推断只采样了前 10 行数据来判断列类型，如果前 10 行都是小数，但后面有大整数，会导致类型设置过小。

修复后：改为扫描全部数据行进行类型推断，确保精度足够。

4. 日期时间类型丢失时间部分

问题：包含时间的日期列导入后被推断为 DATE 类型，丢失了时间部分。

原因：日期和日期时间都被检测为 DATE 类型。

修复后：增加时间检测逻辑，区分 DATE（仅日期）和 TIMESTAMP（日期+时间），并在导入时格式化为标准格式。

新增功能

1. AI SQL 生成

这是我最喜欢的新功能。接入兼容 OpenAI 格式的大模型 API，用自然语言描述需求，AI 自动生成 SQL。

支持的平台：

DeepSeek
OpenAI
通义千问
Moonshot
SiliconFlow

配置项：

API 地址、Key、模型自定义
系统提示词可调整
支持选择表结构作为上下文，减少 Token 消耗
可配置是否携带对话历史及轮数

2. 数据可视化

查询结果可以一键生成图表，这对于数据分析来说太实用了。

支持的图表类型：

柱状图
折线图
饼图

特色：

多选数值列，多 Y 轴交替左右分布
不同颜色区分数据系列
图例支持点击开关
AI 根据 SQL 自动生成图表标题
图表下载为 PNG 图片
双饼图合并导出

柱状图的细节优化：

自适应宽度，横坐标过长时斜 45° + 省略号截断
网格边距防遮挡

3. 表结构查看

在左侧 TABLES 树中右键点击表名，弹出菜单选择"查看表结构"。

展示信息：

字段名
数据类型
是否可空
主键标识
默认值
字段备注
索引信息

一键复制为 Markdown：方便在文档中记录表结构，或作为 AI 生成 SQL 的上下文。

4. SQL 收藏

常用 SQL 可以保存下来，方便随时复用。

保存时填写标题、SQL 内容、描述
左侧 SAVED SQL 列表展示所有收藏
点击即可加载到编辑器
支持编辑和删除

5. 标签页增强

多标签页管理更加顺手：

右键菜单：关闭其它标签、关闭左侧标签、关闭右侧标签
"新建查询"按钮重新设计为青绿色渐变样式，更加醒目

6. 删除功能完善

补充了原来缺失的删除操作：

删除表：表行末固定显示删除按钮
删除工作区（非 default）：工作区列表行末显示删除按钮
删除文件：侧边栏、对话框、详情页均添加删除按钮

7. 日期格式化显示

所有查询结果中的 Date 对象统一显示为 yyyy-MM-dd HH:mm:ss 格式，让时间数据一目了然。

8. 列宽拖拽 ↔️

查询结果表格支持鼠标拖拽调整列宽，列头右侧显示蓝色拖拽手柄，方便查看长文本内容。

9. GitHub Pages 自动部署

新增 deploy.yml GitHub Actions 工作流，push 到 main 分支自动构建并部署到 GitHub Pages。

项目技术栈

Nuxt 4 + Vue 3 + TypeScript
Element Plus UI 组件库
PGlite 浏览器内 PostgreSQL
CodeMirror 5 SQL 编辑器
ECharts 5 数据可视化
UnoCSS 原子 CSS
Pinia + VueUse

如何使用

在线体验

直接访问：https://xiuji008.github.io/datasheet/

本地开发

# 安装依赖
pnpm install

# 启动开发服务器
pnpm dev

# 构建生产版本
pnpm build

# 静态生成（用于 GitHub Pages 部署）
pnpm generate

Github Pages 部署

直接fork 本项目后设置 Pages, 然后在Actions执行完成即可访问

Docker部署

创建部署目录 mkdir datasheet
创建docker-compose.yml 文件，内容如下：

services:
  datasheet:
    image: registry.cn-hangzhou.aliyuncs.com/xj_lew/datasheet:1.0.0 
    container_name: datasheet
    ports:
      - '3000:3000'
    restart: unless-stopped

启动容器

docker-compose up -d

访问项目

在浏览器中打开部署地址即可访问

使用场景

场景一：积分统计与分析

回到我最初的需求——把 CodeBuddy/WorkBuddy 的日志 Excel 导入 Datasheet：

点击"导入数据"，选择 Excel 文件
自动识别表头和数据，映射到表中

在 SQL 编辑器中写查询：

SELECT 
 TO_CHAR(use_time, 'YYYY-MM-DD') AS "日期",
 SUM(points) AS "积分使用数量",
 COUNT(requestid) AS "积分使用次数"
FROM 
 "request_usage_2026_06_28"
WHERE 
 EXTRACT(MONTH FROM use_time) = 6 AND EXTRACT(YEAR FROM use_time) = 2026
GROUP BY 
 "日期";

点击"图表"，选择柱状图，选择日期作为 X 轴，使用次数和积分作为 Y 轴
分析结果一目了然

场景二：AI 辅助 SQL 生成

不熟悉 SQL 语法也没关系：

点击「✨ AI 生成 SQL」按钮
用自然语言描述：统计6月份各个时间段（上午，下午，晚上）的积分使用情况（次数和数量）
AI 自动生成 SQL，点击"回填并执行"即可

场景三：数据探索与可视化

导入任意数据后：

左侧查看所有表结构
写 SQL 探索数据
一键生成图表
保存常用查询，下次一键复用

与原项目对比

功能	原版 Datasheet	修改版
SQL 编辑器	✅	✅
数据导入	✅	✅（修复表头错误、类型推断）
多工作区	✅	✅（增加删除功能）
表结构查看	基础	✅ 右键弹窗 + Markdown 复制
SQL 收藏	❌	✅
AI 生成 SQL	❌	✅
数据可视化	❌	✅（柱状/折线/饼图）
列宽拖拽	❌	✅
日期格式化	❌	✅
标签页管理	基础	✅ 右键关闭其它/左侧/右侧

写在最后

这个项目目前还在持续迭代中，作为一个纯前端工具，它很好地解决了"在浏览器中分析数据"这个需求。如果你也有类似的使用场景——比如分析日志数据、探索数据集、或者单纯想在浏览器里用 SQL 分析 Excel 数据——不妨试试这个工具。

开源项目最有趣的地方就在于：你可以根据自己的需求去修改它、扩展它，让它真正为你所用。

项目地址：https://github.com/xiuji008/datasheet

在线体验：https://xiuji008.github.io/datasheet/

基于 Datasheet 二次开发：一个纯浏览器端的 PostgreSQL 数据分析工具

缘起：积分统计的烦恼

什么是 Datasheet？

原项目的核心特性

我做了哪些修改？

Bug 修复

1. 数据导入表头错误

2. 查询结果首行缺失

3. 类型推断精度不足

4. 日期时间类型丢失时间部分

新增功能

1. AI SQL 生成

2. 数据可视化

3. 表结构查看

4. SQL 收藏

5. 标签页增强

6. 删除功能完善

7. 日期格式化显示

8. 列宽拖拽 ↔️

9. GitHub Pages 自动部署

项目技术栈

如何使用

在线体验

本地开发

Github Pages 部署

Docker部署

使用场景

场景一：积分统计与分析

场景二：AI 辅助 SQL 生成

场景三：数据探索与可视化

与原项目对比

写在最后

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

基于 Datasheet 二次开发：一个纯浏览器端的 PostgreSQL 数据分析工具

缘起：积分统计的烦恼

什么是 Datasheet？

原项目的核心特性

我做了哪些修改？

Bug 修复

1. 数据导入表头错误

2. 查询结果首行缺失

3. 类型推断精度不足

4. 日期时间类型丢失时间部分

新增功能

1. AI SQL 生成

2. 数据可视化

3. 表结构查看

4. SQL 收藏

5. 标签页增强

6. 删除功能完善

7. 日期格式化显示

8. 列宽拖拽 ↔️

9. GitHub Pages 自动部署

项目技术栈

如何使用

在线体验

本地开发

Github Pages 部署

Docker部署

使用场景

场景一：积分统计与分析

场景二：AI 辅助 SQL 生成

场景三：数据探索与可视化

与原项目对比

写在最后

热门文章

最新文章

相关电子书