发布日期:2025-01-09 09:58 点击次数:52
当今卡通色图,大模子不错帮你梳理新闻时刻线了,以后吃瓜就更便捷了!
AI Agent 的风,我们赛博乐子东谈主也得吹吹。
这便是来自阿里巴巴通义实验室与上海交通大学的新料到,他们建议了一种基于 Agent 的新闻时刻线节录新框架——CHRONOS。
它不仅不错帮你从海量新闻中回归出迫切事件,更迫切的是,它还不错梳理出明晰的时刻线,以后上网冲浪时各式复杂事件都一目了然。
其中的 CHRONOS 一词取自希腊传说中的时刻之神柯罗诺斯。
该框架通过迭代多轮的自我发问形貌,结合检索增强生成时刻,从互联网上检索关系事件信息,并生成时刻规章的新闻节录,为新闻时刻线节录生成提供了一种全新的处分决议。
先来一谈瞅瞅几个例子。
比如对于新闻"国足 1-0 巴林",CHRONOS 简略回归海量新闻,呈现事件的世代相承。
对于粉饰时刻更长的新闻"中国探月工程",CHRONOS 也能聚焦要点事件,呈当前刻线发展,使得用户简略一目了然。
补皆灵通域 TLS 短板
av天堂时刻线回归(Timeline Summarization, TLS)任务是一种当然讲话处理界限的经典时刻挑战,它旨在从多数文本数据中索要环节事件,并如时代规章成列,以提供对某一主题或界限历史发展的结构化视图。
举例,在新闻界限,时刻线回归不错匡助用户快速了解一个新闻事件的世代相承。该任务不仅条目识别出迫切的事件,还需要纠合事件之间的时刻关系和因果洽商,以便生成一个连贯、率性且信息丰富的时刻线节录。
凭据可检索事件的起原,不错将 TLS 任务细分为阻塞域(closed-domain)和灵通域(open-domain)两个设定:在阻塞域 TLS 任务中,时刻线是从一组预界说的、与特定主题或界限关系的新闻著作中创建的,而灵通域 TLS 指的是从互联网上径直搜索和检索新闻著作来生成时刻线的经由。
畴昔的责任东要荟萃于处分阻塞域上时刻线生成问题,而灵通域 TLS 则需要雄壮的信息检索和筛选才能,以及在莫得全局视图的情况下识别和建造事件之间洽商的才能,为这项任务建议了新的要乞降挑战。
迭代检索的 CHRONOS 框架
为了应酬上述挑战,团队建议 CHRONOS 框架,通过迭代发问进行关系事件检索,生成准确、全面的时刻线节录,简略灵验地处分灵通域和阻塞域两种设定下的 TLS 任务。
1. 动机
时刻线生成的中枢在于建造事件之间的时刻和因果关系。
每个新闻事件都不错被暗示为一个不同的节点,任务的方向是建造这些节点之间的边,以展示它们的关系性,并最终酿成一个异构图,从主题新闻的节点脱手。
因此,通过一个检索机制来检索关系的新闻著作,不错灵验建造这些边,酿成事件之间的洽商。
2. 轮廓
CHRONOS 诓骗大模子的才能,通过模拟东谈主类信息检索的经由,即通过建议问题、基于检索适度进一步建议新的问题,最终蚁集对于关系事件的全面信息并回归为时刻线。
CHRONOS 包括以下几个模块:
自我发问 ( Self-Questioning ) :领先搜索粗粒度的新闻配景信息,然后迭代地建议问题,以检索更多关系新闻。
问题改写 ( Question Rewriting ) :将复杂或说明欠安的问题瓦解为更具体、更易检索的查询。
时刻线生成 ( Timeline Generation ) :通过归并每一轮检索生成的时刻线来去归一个隆起迫切事件的时刻线。
3. 自我发问 3.1 粗粒度配景调研
在自我发问的启动阶段,CHRONOS 使用方向新闻的标题动作环节词进行搜索,以蚁集与方向新闻最径直关系的信息。
这些信息组成了新闻配景(News Context),为自我发问打下初步基础。
3.2 发问示例选拔
在粗粒度配景调研之后,CHRONOS 诓骗大模子的高下体裁习才能,通过一丝样本教导来领导模子生成对于方向新闻的问题。
为了评估问题样本色量,引入了时序信息量(Chrono-Informativeness, CI)的主张,用来量度模子建议的问题检索与参考时刻线对皆事件的才能,即高 CI 值的问题更有可能指引检索到与方向新闻事件关系的著作,用检索生成的时刻线和参考时刻线中包含日历的 F1 分数进行量度。
基于最大化问题集时序信息量的方向,构建一个"新闻 - 问题"的示例池,用于领导新方向新闻的问题生成。
对于每个新的方向新闻,通过余弦相似性动态检索与方向新闻最相似的样本,确保了样本的高下文关系性和时刻信息的准确性。
3.3 迭代发问
CHRONOS 通过一语气迭代发问,逐渐深化探索事件的细节。
每一轮迭代都基于前一轮的检索适度,以发现新的问题和信息,直到委宛时刻线中事件数目或达到最大迭代次数。
3.4 问题改写
查询改写(Query Rewriting)是检索增强生成中常用的优化才能。
在 CHRONOS 框架中,团队通过对启动发问阶段产生的普通或复杂问题改写为 2-3 个更易于检索的子问题,简略生成更具体、更有针对性的查询,从而提高搜索引擎的检索遵循。
他们雷同在教导中加入一丝样本,领导大模子进行灵验改写,将复杂问题转变为更具体的查询,同期保抓问题的原始意图。
3.5 时刻线生成
CHRONOS 通过两阶段生成完好的时刻线回归:生成(Generation)和归并(Merging)。
生成:通过分析每一轮检索到的新闻著作来识别环节事件和注重信息。诓骗大模子的纠合和生成才能,索要每个事件的发寿辰期和关系细节,并为每个事件撰写率性的形容。这些事件和形容被组织成初步的时刻线,按照时刻规章成列,为后续的归并阶段提供基础。
归并:将多轮检索生成的初步时刻线整合成一个连贯的最终节录。这照旧由波及对皆不同时代线中的事件、处分任何日历或形容上的浮松,并选拔最具代表性和迫切性的事件。
全新数据集 OPEN-TLS
为了评估 TLS 系统,料到团队还蚁集了由专科记者撰写的对于近期新闻事件的时刻线,构建了一个名为Open-TLS的新数据集。
与以往阻塞域的数据集比较,Open-TLS 不仅在数据集范围和内容上愈加各样化,粉饰政事、经济、社会、体育和科学时刻等多个界限,何况在时效性上更具上风,为灵通域 TLS 任务提供了一个更全面和更具挑战性的基准。
实验适度 1. 实验设定
实验基于 GPT-3.5-Turbo、GPT-4 和 Qwen2.5-72B 永诀构建 CHRONOS 系统,评测灵通域和阻塞域两个设定下 TLS 的性能说明。使用的评估缱绻主要有:
ROUGE-N: 量度生成时刻线和参考时刻线之间的 N-gram 类似。具体包括:(1)Concat F1:通过将统共日历节录伙同起来计较 ROUGE,以评估举座的一致性;(2)Agree F1:仅使用匹配日历的节录计较 ROUGE,以评估特定日历的准确性;(3)Align F1:在计较 ROUGE 之前,先凭据相似性和日历接近性对预计节录和参考节录进行对皆,评估对皆后的一致性。
Date F1:量度生成时刻线中日历与参考时刻线中真确日历匹配进度。
2. 灵通域 TLS
在灵通域 TLS 的实验中,CHRONOS 与几个基线才能进行了比较,包括径直搜索方向新闻(DIRECT)和重写方向新闻以创建查询用于检索(REWRITE)。
对比之下,CHRONOS 通过迭代自我发问和检索关系新闻著作的才能,权臣提高了事件回归的质料和日历对皆的准确性,在所谈论上都卓著于基线才能。
3. 阻塞域 TLS
在阻塞域 TLS 的实验中,CHRONOS 与之前的代表性责任进行了比较,包括:(1)基于事件团员才能的 CLUST ( Gholipour Ghalandari and. Ifrim, 2020 ) ;(2)基于事件图模子 EGC(Li et al., 2021)和(3)诓骗大模子进行事件聚类的 LLM-TLS(Hu et al., 2024)。
在 Crisis 和 T17 这两个经典数据集上的比较适度融会,CHRONOS 达到了与这些责任类似的说明,在两个数据集的 AR-2 缱绻上得回了 SOTA 遵循,诠释了其在不同类型事件和时刻跨度上的雄壮性能和稳当性。
4. 运行时刻分析
CHRONOS 的另一个上风体当今遵循方面。
与雷同基于大模子、但需要处理新闻库中统共著作的 LLM-TLS 才能比较,它通过检索增强机制专注于最关系的新闻著作,权臣减少了处理时刻。
这种遵循的培育使其在施行应用中更为实用,尤其是在需要快速反应的场景中。
案例料到:苹果居品发布时刻线
团队深化分析了模子在处理具体新闻事件时的说明,通过选拔具有代表性的新闻事件,如苹果公司的要紧居品发布,简略不雅察到 CHRONOS 如何通过行远自迩的自我发问和信息检索来生成时刻线。
在案例料到中,CHRONOS 展示了其简略准确索要环节事件和日历的才能,同期也揭示了在某些情况下可能需要调动的地点,举例对某些事件的遗漏或日历幻觉。
结语
CHRONOS 框架通过结合大型讲话模子的迭代自我发问和检索增强生成时刻,为时刻线回归任务提供了一种新颖且灵验的处分决议。
这种才能的中枢在于模拟东谈主类的信息检索经由,通过不断地建议和回答新问题来逐渐深化纠合事件,最终身成一个全面且连贯的时刻线节录。
实验适度已经充分诠释了 CHRONOS 在复杂事件检索和构建时刻线方面的才能,展示了该框架在施行新闻时刻线生成应用中的应用后劲和准确性。
同期,这种迭代发问的检索生成才能是否具有泛化到通用任务上的才能也值得将来进一步料到。
论文:https://arxiv.org/abs/2501.00888
Github: https://github.com/Alibaba-NLP/CHRONOS
Demo: https://modelscope.cn/studios/vickywu1022/CHRONOS
Reference:
[ 1 ] Demian Gholipour Ghalandari and Georgiana Ifrim. 2020. Examining the state-of-the-art in news timeline summarization. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pages 1322 – 1334, Online. Association for Computational Linguistics.
[ 2 ] Manling Li, Tengfei Ma, Mo Yu, Lingfei Wu, Tian Gao, Heng Ji, and Kathleen McKeown. 2021. Timeline summarization based on event graph compression via time-aware optimal transport. In Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 6443 – 6456, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.
[ 3 ] Qisheng Hu, Geonsik Moon, and Hwee Tou Ng. 2024. From moments to milestones: Incremental timeline summarization leveraging large language models. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics ( Volume 1: Long Papers ) , pages 7232 – 7246, Bangkok, Thailand. Association for Computational Linguistics.
— 完 —
投稿请发邮件到:
ai@qbitai.com
标题注明【投稿】,告诉我们:
你是谁,从哪来,投稿内容
附上论文 / 样子主页相连,以及洽商形貌哦
我们会(尽量)实时回答你
点这里� � 温顺我,难忘标星哦~
一键三连「共享」、「点赞」和「在看」
科技前沿进展日日再见 ~
【对于国补,这三个音信令东说念主深想】闻明博主“阿尔法军事”昨晚和一位一又友聊天卡通色图,谈到国补卡通色图,他流露了三大音信,相配令东说念主颠簸! 第一,2025年的补贴领域会更大,手机仅仅冰山一角。数据夸耀,客岁超3600万名购买了八大类家电,换新带动汽车销售额9200多亿,总体销售额超13000多亿。不错说,客岁的补贴相配有后果。2025岁首始,家电已扩围了,从客岁的8大类推广到了12类,新增微波炉、清水器、洗碗机、电饭煲四类,3C数码也厚爱被纳入补贴范围。音信一出,各地糜费者也曾跋扈了,...
【对于国补,这三个音信令东说念主深想】闻明博主“阿尔法军事”昨晚和一位一又友聊天卡通色图,谈到国补卡通色图,他流露了三大音信,相配令东说念主颠簸! 第一,2025年的补贴领域会更大,手机仅仅冰山一角。...
当今卡通色图,大模子不错帮你梳理新闻时刻线了,以后吃瓜就更便捷了! AI Agent 的风,我们赛博乐子东谈主也得吹吹。 这便是来自阿里巴巴通义实验室与上海交通大学的新料到,他们建议了一种基于 Age...
av天堂 锣饱读声声卡通色图,秧歌登场,跃舞迎春,喜气洋洋……1月7日上昼,2025单县“黄河大集”新春季暨改俗迁风字画巡伸开动典礼在单县文化中心广场举行。 市政协副主席、单县县委布告耿振华,市委宣传...
每逢年底,齐是深陷债务的供应链高卑劣公司最愁肠的日子。匡助它们经管资金问题卡通色图,频年来也成了一门故意可图的生意。 和那些坏心的“老赖”不一样,供应链高卑劣公司的债务纠纷有我方的独到性。在任业催债东...