CHRONOS:阿里通义联合上海交大推出时间线摘要生成框架,适用于大规模新闻数据的时间线生成任务

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
简介: CHRONOS 是由阿里通义实验室与上海交大联合推出的时间线摘要生成框架,支持开放域与封闭域,通过迭代自问自答机制生成连贯的时间线摘要,适用于新闻、金融、教育等多个领域。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. 功能:CHRONOS 支持开放域与封闭域的时间线摘要生成,适用于新闻、金融、教育等多个领域。
  2. 技术:基于迭代自问自答机制,结合大型语言模型(LLMs)和问题重写技术,生成连贯的时间线摘要。
  3. 应用:广泛应用于新闻报道整理、金融事件追踪、政策分析等场景,帮助用户快速理解事件发展脉络。

正文(附运行示例)

CHRONOS 是什么

chronos-overview

CHRONOS 是由上海交通大学计算机科学与工程系、阿里巴巴集团通义实验室等机构联合推出的时间线摘要生成框架。该框架基于迭代自问自答的方式,利用大型语言模型(LLMs)构建开放域和封闭域的时间线。CHRONOS 通过生成与新闻主题相关的 5W1H 问题,检索相关信息,逐步扩展新闻数据库,最终生成连贯的事件摘要。

CHRONOS 在实验中表现出色,能够有效处理信息过载和数据噪声问题,适用于大规模新闻数据的时间线生成任务。其核心优势在于能够通过问题重写机制提高搜索精度,并采用分而治之的策略生成并合并时间线。

CHRONOS 的主要功能

  • 新闻时间线生成:从大量新闻文档中提取关键事件,按照时间顺序生成连贯的时间线摘要。
  • 开放域和封闭域支持:支持从互联网直接检索新闻生成时间线,也支持在预定义的新闻集中构建时间线。
  • 迭代自问自答:通过不断提出与新闻主题相关的问题,逐步扩展和丰富时间线内容,确保信息的全面性和准确性。
  • 问题重写与优化:将复杂问题分解为更具体的查询,提高搜索的精确性和效率,获取更相关的信息。
  • 数据集支持:引入 Open-TLS 数据集,提供丰富的新闻时间线样本,用于训练和评估模型性能。

CHRONOS 的技术原理

  • 基于检索的生成:通过检索外部知识源(如互联网或预定义的新闻集)增强语言模型的生成能力,解决信息过载和数据噪声问题。
  • 迭代自问自答机制:模拟人类信息检索过程,生成 5W1H 问题,逐步深入挖掘与新闻主题相关的事件信息,构建事件之间的因果关系图。
  • 问题重写技术:利用 LLMs 对复杂问题进行分解和重写,生成更具体、更易于检索的查询,提高检索结果的相关性和准确性。
  • 分而治之的策略:将时间线生成任务分解为多个子任务,分别从每一轮检索中生成单独的时间线,通过合并和冲突解决等步骤,生成最终的连贯时间线摘要。
  • 大型语言模型(LLMs):作为核心工具,用于理解文本、生成高质量的摘要和问题,并进行有效的信息检索和整合。

如何运行 CHRONOS

1. 安装依赖

首先,确保你已经安装了所有必要的依赖项。可以通过以下命令安装:

pip install -r requirements.txt

2. 生成示例问题

接下来,生成与主题相关的问题示例。运行以下命令:

python question_exampler.py

你也可以使用我们提供的 data/question_examples.json 文件,其中包含了针对 crisis, T17 和 Open-TLS 数据集的示例问题。

3. 运行 CHRONOS

运行 CHRONOS 框架,生成时间线摘要。具体命令如下:

python chronos.py

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
2月前
|
人工智能 Java API
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
本文介绍AI大模型的核心概念、分类及开发者学习路径,重点讲解如何选择与接入大模型。项目基于Spring Boot,使用阿里云灵积模型(Qwen-Plus),对比SDK、HTTP、Spring AI和LangChain4j四种接入方式,助力开发者高效构建AI应用。
1201 122
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
|
4月前
|
人工智能 弹性计算 API
再不玩通义 VACE 模型你就过时了!一个模型搞定所有视频任务
介绍通义的开源模型在 ecs 或 acs 场景如何一键部署和使用,如何解决不同视频生成场景的问题。
|
4月前
|
人工智能 弹性计算 JSON
再不玩通义VACE模型你就过时了!一个模型搞定所有视频任务
阿里巴巴开源通义万相Wan2.1-VACE,业界功能最全的视频生成与编辑模型,支持文生视频、图像参考生成、视频重绘、局部编辑、背景延展等,统一模型实现多任务自由组合,轻量版本消费级显卡即可运行。
|
2月前
|
人工智能 自然语言处理 测试技术
有没有可能不微调也能让大模型准确完成指定任务?(少样本学习)
对于我这种正在从0到1构建AI产品的一人公司来说,Few Shots学习的最大价值在于:用最少的资源获得最大的效果。我不需要大量的标注数据,不需要复杂的模型训练,只需要精心设计几个示例,就能让大模型快速理解我的业务场景。
225 43
|
7月前
|
机器学习/深度学习 人工智能 编解码
AI视频生成也能自动补全!Wan2.1 FLF2V:阿里通义开源14B视频生成模型,用首尾两帧生成过渡动画
万相首尾帧模型是阿里通义开源的14B参数规模视频生成模型,基于DiT架构和高效视频压缩VAE,能够根据首尾帧图像自动生成5秒720p高清视频,支持多种风格变换和细节复刻。
1392 9
AI视频生成也能自动补全!Wan2.1 FLF2V:阿里通义开源14B视频生成模型,用首尾两帧生成过渡动画
|
2月前
|
人工智能 安全 开发工具
不只是写代码:Qwen Code 如何规划、执行并验证软件工程任务
本文以阿里推出的 CLI 工具 Qwen Code 为例,深入剖析其如何通过精细化的 Prompt 设计(角色定义、核心规范、任务管理、工作流控制),赋予大模型自主规划、编码、测试与验证的能力。
|
4月前
|
人工智能 自然语言处理 并行计算
大模型面经:任务、clip、diffusion
本文简要介绍了文本生成的常见预训练任务(如MLM、CLM、NSP等),多模态模型中的SOTA模型及CLIP的优势,以及多模态大模型如Stable Diffusion的原理。重点解析了Stable Diffusion的扩散机制与图像生成流程,帮助理解其高效性和广泛应用的原因。
307 5
|
4月前
|
机器学习/深度学习 人工智能 算法
面向工业4.0的AI Agent多任务协作与调度系统设计
随着人工智能(AI)技术的飞速发展,智能制造成为现代工业的核心驱动力。传统制造系统在面对多任务、高频次和动态变化的调度需求时,往往效率低下。而基于AI Agent的多任务协作与调度机制为解决这一问题提供了全新思路。本文聚焦于面向智能制造场景中,如何通过AI Agent实现多任务协作调度,并引入强化学习方法进行算法优化。

热门文章

最新文章