复旦印藏变革者:助力古籍数字化

简介: 复旦印藏变革者:助力古籍数字化

AI 可以把我们思维体系当中,过度专业化、过度细分的这些所谓的知识都替代掉,让我们集中精力去体验自己的生命。我挺幸运的,代码能够有 AI 辅助,也能够有 Serverless 解决我的运营成本问题。Serverless 它是一个 game changer,就是彻底改变整个云计算模式的一个创新。

我叫宋杰,是一个上海人。从初级的程序员一直到做企业的架构工作,现在是想利用 IT 技术做古籍方面的开发与利用。

数字化普及传统文化

数字化对古籍有一个非常大的好处在于它的修复是异常高效的,传统的古籍修复对人才的要求门槛是很高的,但数字化就创造了另外一种可能,首先,修改相对简单,另外,它还可以做版本跟踪。即便我这一次修的不成功,那后面的人他可以根据原始图片再次修改,让古籍资源能够充分地活化起来。

Serverless 函数计算助力印藏项目

机缘巧合下,我承担了这个任务。印藏项目源于香港的一位私人收藏者,他收藏了历朝历代的印谱后把这些印谱的数字化版本,无偿的捐献给了复旦大学图书馆。

我第一次尝试着以 IIIF 对印藏项目进行大规模的呈现。在互联网这样可能产生极高流量波峰波谷的环境下,到底怎么去设计它的架构,才能既满足业务的需要,又比较经济呢?阿里的 Serverless 技术,对于整个项目帮助极大,它性价比相当的高,根据经验估算来说,每次收费基本上是等于单机开发的 10%。

其实像复旦大学印谱文献虚拟图书馆这样的网站,它的原始图像就有三个 T,近 50 万张图片,包括现在已经用 AI 识别的图片,整个运营费用一年下来也就几千块,而传统的方式一个月的话就要花费一两千。

Serverless 让程序员集中精力做应用的事

原来大家做网站开发,第一考虑是要用什么 web 服务器,后端用什么数据库。但 Serverless 出现之后,已经把底层的这些操作系统、应用软件、容器编排全部抽象掉了。对大多数程序员来说,需要解决的是一个领域问题。不用去关心下面的运维问题,只需要把精力投入在怎么解决业务问题上去。在计算方面,Serverless 也彻底帮助我们做到了计算和存储分离,从而算力的估算方式就发生了变化。在 Serverless 的环境当中,我们只需要指定它的内存大小、运行时间,给到这两个参数就可以把算力定下来了。而且你能支配的总的容量其实是没有上限的,让程序员能彻底集中精力做应用的事。

AI 助力估计数字化建设

我现在做的项目,叫IIIF与易图,是一个平台,可以说是对印藏项目的一般化。对于一些中小型的机构,甚至于个人的收藏爱好者,他只要在网页上进行上传,就能够出现一个跟印藏一样的网站,这是我个人的创业项目。

我的左手是 Serverless,右手是 AI。强人工智能是一定高度依赖于文化的,在某一个文化领域当中产生出符合文化与价值观、审美倾向,包括对世界的基本认知的一个智能的大模型。要知道模型都挺大的,至少不能让我等个1分钟才看到推理结果。阿里通过函数计算来做的 GPU 的应用,通过自研的一套镜像快速部署的方案,第一次有可能等个 10 秒 20 秒,接下来的体验就非常流畅了。同时这个过程是按需计费的,本身对所有开发 AI 应用程序的程序员来说是一个福音,彻底让程序员能够集中精力做应用的事。

相关实践学习
【AI破次元壁合照】少年白马醉春风,函数计算一键部署AI绘画平台
本次实验基于阿里云函数计算产品能力开发AI绘画平台,可让您实现“破次元壁”与角色合照,为角色换背景效果,用AI绘图技术绘出属于自己的少年江湖。
从 0 入门函数计算
在函数计算的架构中,开发者只需要编写业务代码,并监控业务运行情况就可以了。这将开发者从繁重的运维工作中解放出来,将精力投入到更有意义的开发任务上。
相关文章
|
编译器 Go
Golang 语言 gRPC 使用的接口设计语言 protobuf
Golang 语言 gRPC 使用的接口设计语言 protobuf
225 0
|
4月前
|
文字识别 自然语言处理 数据处理
《大模型赋能文化遗产数字化:古籍修复与知识挖掘的技术实践》
本文记录大模型赋能文化遗产数字化的实践,针对古籍异体字识别难、残缺文本补全不准、隐性知识难挖掘、多模态数据割裂、中小机构部署难、知识难更新等痛点,提出对应方案:搭建古籍文字与语境知识库提升识别理解率,以多源史料关联与历史逻辑约束实现文本精准补全,构建多层级框架挖掘隐性知识,设计多模态语义对齐整合多元信息,通过轻量化优化与混合部署降低使用门槛,建立动态机制保障知识迭代。优化后多项关键指标显著提升,为古籍数字化提供有效路径。
301 9
|
5月前
|
机器学习/深度学习 文字识别 算法
面向古籍版面数字化识别应用研究—基于HisDoc-DETR模型深入剖析
针对古籍版面复杂、文字稀疏、数据稀缺等难题,合合信息与华南理工大学联合提出HisDoc-DETR模型。该框架融合Transformer全局建模与CNN局部特征提取优势,创新引入语义关系学习、双流特征融合及GIoU感知预测头三大模块,显著提升古籍逻辑与物理结构的识别精度,在SCUT-CAB数据集上性能超越主流方法,为古籍数字化、知识库构建与文化遗产传播提供强有力的技术支撑。
面向古籍版面数字化识别应用研究—基于HisDoc-DETR模型深入剖析
|
7月前
|
人工智能 算法 安全
MCP提示词工程:上下文注入的艺术与科学
作为一名深耕AI技术领域多年的技术博主摘星,我深刻认识到提示词工程(Prompt Engineering)在现代AI系统中的核心地位,特别是在Model Context Protocol(MCP)框架下,提示词工程已经演进为一门融合艺术直觉与科学严谨的综合性学科。在我多年的实践经验中,我发现MCP不仅仅是一个简单的协议标准,更是一个革命性的上下文管理平台,它通过精密的提示词机制和动态上下文注入技术,彻底改变了AI系统与外部资源的交互方式。本文将深入探讨MCP中提示词的作用机制,从底层协议设计到高层应用策略,全面剖析动态提示词生成与模板化的技术实现,详细阐述上下文长度优化与截断策略的核心算法,并
520 0
MCP提示词工程:上下文注入的艺术与科学
|
7月前
|
机器学习/深度学习 人工智能 分布式计算
AI 大模型时代的网络架构演进
​2025 年 7 月 26 日,第二届中国计算机学会(CCF)分布式计算大会暨中国算力网大会(CCF Computility 2025)在甘肃兰州隆重召开。大会以“算力网:新质生产力背景下的分布式系统”为主题,吸引了来自学术界与产业界的 1200 余位专家学者、行业代表齐聚一堂,共探分布式计算与算力网络的前沿技术与未来趋势。
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
通古大模型:古籍研究者狂喜!华南理工开源文言文GPT:AI自动断句+写诗翻译,24亿语料喂出来的学术神器
通古大模型由华南理工大学开发,专注于古籍文言文处理,具备强大的古文句读、文白翻译和诗词创作功能。
2241 11
通古大模型:古籍研究者狂喜!华南理工开源文言文GPT:AI自动断句+写诗翻译,24亿语料喂出来的学术神器
|
12月前
|
边缘计算 文字识别 自然语言处理
当OCR遇见大语言模型:智能文本处理的进化之路
简介:本文探讨光学字符识别(OCR)技术与大语言模型(LLM)结合带来的革新。传统OCR在处理模糊文本、复杂排版时存在局限,而LLM的语义理解、结构解析和多模态处理能力恰好弥补这些不足。文中通过代码实例展示了两者融合在错误校正、文档解析、多语言处理、语义检索及流程革新上的五大优势,并以财务报表解析为例,说明了该技术组合在实际应用中的高效性。此外,文章也展望了未来的技术发展趋势,包括多模态架构、小样本学习和边缘计算部署等方向,预示着文本处理技术正迈向智能认知的新时代。(240字)
|
人工智能 双11 云计算
阿里云华东合作伙伴年会成功举办,小牛云获年度最佳合作伙伴奖
1月13日,阿里云华东合作伙伴年会在杭州举行,表彰了十余家优秀合作伙伴。其中,杭州小牛云信息科技有限公司因在中长尾客户拓新和大模型用户激活方面的突出贡献,荣获年度最佳合作伙伴奖。

热门文章

最新文章