在数字化转型的大潮中,越来越多的数据正在以图的形式发生关联。有效地挖掘这些数据中的知识,以满足专业化和个性化需求的增长,已经成为一个迫切需要解决的问题。大语言模型(LLM)和知识图谱(KG)作为两种关键的知识处理技术,它们的能力具有高度的互补性,并正在经历深度融合的发展。
为了加速产业共识的形成,并推动大模型在数据应用领域的快速进展,中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)在线上召开了《大模型驱动的智能知识图谱》标准第一次讨论会。本次会议邀请了来自清华大学、北京交通大学、中移杭研、中国联通研究院、中国电科大数据院、浦发银行、中电信人工智能、杭州悦数等 50 余家企业的 100 余位专家,围绕标准框架进行了深入的讨论。中国通信标准化协会大数据技术标准推进委员会旨在凝聚产业链各个环节,识别和解决大数据发展面临的重大问题,开展大数据技术、数据资产管理、数据共享与流通、数据安全等共性基础标准研究,以标准推进工作为纽带,推动大数据与实体经济深度融合。会上,WG10&WG16 工作组先是对《大模型驱动的智能知识图谱》标准的编制背景和工作计划进行了简要介绍,参会专家围绕标准框架和主要内容进行了深入讨论。接着还探讨了大模型与知识图谱融合的未来,包括大模型发展现状、智能知识图谱的建设与应用,以及两者结合所能带来的革命性变化。
作为中国通信标准化协会大数据技术标准推进委员会的合作伙伴,杭州悦数科技有限公司应邀参与了这次的研讨会,积极分享观点并与业内外专家进行深入的交流,共同探讨了大语言模型与图技术结合的广泛应用可能性。此前,杭州悦数一直致力于图和大模型结合的探索,在行业内首次提出了 Graph RAG 的概念,即利用知识图谱结合大语言模型(LLM)为搜索引擎提供更全面的上下文信息,可以帮助用户以更低成本获得更智能、更精准的搜索结果。同时也率先实现了与大语言模型框架 Llama Index 、LangChain 等的深度适配,助力一站式生成高质量、低成本的企业级大语言模型应用。
展望未来,杭州悦数将继续专注于大语言模型与知识图谱的结合领域,进一步提升其技术的成熟度和应用范围,致力于持续优化自然语言处理与知识图谱的交互方式,使得用户可以更为便捷地使用和理解知识图谱。同时,将探索推动图与大语言模型在各行业的应用,助力更多政企机构最大化提炼数据价值。