引入时间概念的分布式系统,让业务更好实现了吗?
运用数字技术方法研究人文社会科学,应以多学科交叉的学术团队为研究主体,以数据为基础、以平台为支撑。北京大学人工智能研究院教授王军结合北京大学数字人文研究中心相关工作提出,相关研究应以古籍资源的智能开发与利用为核心研究目标,在相关古籍整理研究与保护单位的支持下,将古籍的研究机构、教学单位、收藏机构、出版渠道和商业组织连接在一起,共同探讨古籍数字化、智能化平台的建设以及相关标准规范的制定,凝聚多方智慧,协力推动古籍资源的深度开发、利用与传播。
数字人文研究改变了古代文学资料的查询检索方式,从电子文献到结构化数据库、从点状检索到网状关联、从逐条拷贝到分类打包,传统的静态文本转化为可随意组合的动态文本。浙江大学人文学院教授徐永明及其团队致力于探索文史古籍大数据结构化和智慧化建设。徐永明介绍,“智慧古籍平台”是借鉴知识图谱理念,综合运用大数据的计量统计、定位查询、空间分析、数据关联等技术开发的平台。它相比传统古籍处理平台有更多优势,例如,以篇目为单位,人机共同完成,内容可关联,随时可修改等。
数字人文技术的运用解决了古代文学研究资料离散、时空分离的难题。四川大学文学与新闻学院讲席教授王兆鹏领衔的“唐宋文学编年系地信息平台建设”项目,借助新技术手段,实现了时间、空间、作家、作品等多维度的检索、查询、显示、统计,甚至可以显示相关的人文地理环境、遗迹遗址图像、视频材料。王兆鹏表示,研发唐宋文学编年地图平台旨在解决年谱和文学编年史时地分离的缺憾。平台数据来源于唐宋人年谱、别集,挖掘提取数据时更注重补缺正误,尤其注重增补谱主的任职地、经行地、出生地、创作地信息。力求既能反映作家活动和作品创作的时间,又能反映作家活动和作品创作的空间地理环境,体现出文献资料的集成性和文学史呈现的全景性。
古籍数字化带来的不仅仅是庞大的古籍存储,还为技术与人文的融合构筑了新平台。上海外国语大学图书馆研究馆员欧阳剑致力于开发中国古籍基础数据分析平台。他认为,平台建设过程中需要克服人文数据碎片化带来的弊病,采用数据复原与重构的方式,恢复或重建人文数据所蕴含的知识间的联系,采用数据化、数据融合、数据关联及发布等手段,最终实现知识单元的精细粒度化、知识组织的语义化、知识呈现的可视化。
突破学术圈壁垒
古籍数字化平台如何突破学术圈的壁垒,激活学者的研究成果,将学术研究前沿成果转化为社会大众共享的文化资源?对此,王军认为,学界和业界应将一些资源以授权的方式开放供学术研究使用,并为学术成果展示提供平台,将有潜质的成果商业化,为后续研究提供支持,在保护学术研究的同时保证商业利益。
古籍整理平台不仅是一个系统,还代表着一整套的商业模式。中华书局古联公司总经理洪涛认为,作为商业化大型古籍数据机构,如何面向多类型用户,集合多种技术功能,提高编辑的生产效率;探索与高校合作设置网络学院等途径,建立人才培养机制,为古籍整理出版储备人才等都是亟须完善的问题。
数字人文技术在古代文学研究中的实践,不仅是技术操作问题,也需要古代文学研究观念上的主动对接。王兆鹏谈到,古籍数智化具有数字化和智能化双重意义,它既有功能性的提升也有深层次结构性的转变。大数据将促使今后的知识和信息由过去的分隔走向贯通,实现时空贯通、部类贯通等。同时,古籍还可为文创实践助力,例如,“李清照陪你游开封”这类文旅线路的设计,将故事、诗词呈现其中,重建古代文学历史现场,实现了阅读欣赏与沉浸式体验的完美结合,是古籍数字化的创新性探索。
在人文数据类学术成果转化方面,元引科技有限公司创始人朱厚权认为,数字人文平台的业态正在不断演进,需要有商业介入推动学术发展,助力学者发现新选题,并根据研究需求开发相关模型;构建开放平台,帮助平台打通信息孤岛。朱厚权还表示,学术研究的独创性与工程实践的可复制性既相辅相成又差异显著,学术公益承诺与商业化出版的趋利性需要得到妥善解决。
古代文学研究者借助数字技术,建构文学的历史现场、复原作家的创作兴境、挖掘古籍的时代价值,是方兴未艾的研究课题。系统整理、传承和转化优秀古籍文献,发挥古籍古为今用、启迪民智的作用,必将为弘扬中华优秀传统文化贡献力量。
赞0
踩0