开源学习神器把2小时网课压成5分钟脑图！BiliNote：一键转录哔哩哔哩视频，生成结构化学习文档

2025-04-17 3046

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本文介绍基于FastAPI与React构建的开源视频笔记工具BiliNote，其整合多模态AI技术实现视频内容结构化解析，支持跨平台视频源处理与本地化部署方案，提供从语音转写到智能摘要的全流程自动化能力。

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发感兴趣，我会每日分享大模型与 AI 领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜：蚝油菜花 🥦

🎥 "你的视频笔记该进化了！开源神器把2小时网课压成5分钟脑图"

大家好，我是蚝油菜花。当知识博主还在手敲视频字幕时，这个AI工具已经让学习笔记进入「全自动时代」！

你是否经历过这些崩溃场景：

📺 看完教程想整理重点，却发现根本没做时间戳标记
🖊️ 手抄PPT内容到手抽筋，关键图表却无法直接复用
💻 想搜索视频里的某个概念，只能在进度条上来回拖动...

今天要解剖的 BiliNote ，正是破解这些痛点的「视频学习加速器」！这个由开发者社区打造的开源神器，用三大核心理念重构知识管理：

✅ 全栈解析能力：从语音转写到关键帧截取，实现多模态内容提取
✅ 智能结构化：自动生成带跳转链接的Markdown文档，支持深度搜索
✅ 模型自由配置：兼容OpenAI/DeepSeek等多类大模型，满足定制需求

已有教育机构用它批量处理慕课视频——准备好迎接认知效率革命了吗？

🚀 快速阅读

BiliNote是基于现代Web技术栈开发的智能化视频内容处理工具。

核心功能：实现跨平台视频解析、语音转写、智能摘要与结构化文档生成
技术原理：采用FastAPI构建微服务架构，结合React实现交互界面，支持多模态AI模型集成

BiliNote 是什么

BiliNote

BiliNote 是基于微服务架构设计的智能视频处理系统，通过整合语音识别、大语言模型和计算机视觉技术，实现视频内容到结构化文档的自动化转换。该系统支持哔哩哔哩、YouTube等主流视频平台，提供从URL解析到最终文档输出的完整处理链路。

其技术架构采用前后端分离设计，后端使用FastAPI搭建高性能REST API服务，前端基于Vite+React构建交互界面。系统支持本地部署的Whisper语音识别模型，同时兼容多类云端大模型接口，在保证处理效率的同时兼顾隐私安全。

BiliNote 的主要功能

跨平台解析：支持哔哩哔哩、YouTube等视频链接自动识别与内容抓取
多模态处理：同步执行语音转写、关键帧截取与文字内容分析
智能结构化：自动生成带章节跳转链接的Markdown文档
模型可配置：支持OpenAI/DeepSeek/Qwen等多类大模型接口切换
历史追溯：完整记录处理任务日志与生成版本

BiliNote 的技术原理

服务架构：采用FastAPI构建异步微服务，处理峰值并发请求
转写引擎：集成Fast-Whisper实现本地化语音识别
内容分析：通过大模型提取视频语义结构并生成摘要
渲染系统：使用React动态渲染Markdown文档与交互元素
部署方案：提供Docker容器化部署配置，支持快速环境搭建

如何运行 BiliNote

快速开始

1. 克隆仓库

git clone https://github.com/JefferyHcool/BiliNote.git
cd BiliNote
mv .env.example .env

2. 启动后端（FastAPI）

cd backend
pip install -r requirements.txt
uvicorn app.main:app --reload

3. 启动前端（Vite + React）

cd BiliNote_frontend
pnpm install
pnpm dev

访问：http://localhost:5173

依赖说明

FFmpeg

本项目依赖 ffmpeg 用于音频处理与转码，必须安装：

# Mac (brew)
brew install ffmpeg

# Ubuntu / Debian
sudo apt install ffmpeg

# Windows
# 安装 ffmpeg：https://ffmpeg.org/download.html

⚠️ 若系统无法识别 ffmpeg，请将其加入系统环境变量 PATH

CUDA 加速（可选）

若你希望更快地执行音频转写任务，可使用具备 NVIDIA GPU 的机器，并启用 fast-whisper + CUDA 加速版本：

具体 fast-whisper 配置方法，请参考：fast-whisper 项目地址

使用 Docker 一键部署

确保你已安装 Docker 和 Docker Compose：

1. 克隆本项目

git clone https://github.com/JefferyHcool/BiliNote.git
cd BiliNote
mv .env.example .env

2. 启动 Docker Compose

docker compose up --build

默认端口：

前端：http://localhost:${FRONTEND_PORT}

后端：http://localhost:${BACKEND_PORT}

.env 文件中可自定义端口与环境配置。

环境变量配置

后端 .env 示例：

API_BASE_URL=http://localhost:8000
OUT_DIR=note_results
IMAGE_BASE_URL=/static/screenshots
MODEL_PROVIDER=openai
OPENAI_API_KEY=sk-xxxxxx
DEEP_SEEK_API_KEY=xxx
QWEN_API_KEY=xxx

资源

GitHub 仓库：https://github.com/JefferyHcool/BiliNote
在线体验 Demo：https://www.bilinote.app/