发布日期:2025-01-09 11:21 点击次数:157
陈丹琦团队又带着他们的降本大法来了——麻豆 视频
数据砍掉三分之一,大模子性能却完全不减。
他们引入了元数据,加速了大模子预查考的同期,也不加多单独的谋划支拨。
在不同模子范围(600M - 8B)和查考数据起原的情况下,均能收尾性能方面的培育。
诚然之前元数听说念过好多,但一作高天宇暗示,他们是第一个展示它怎样影响卑鄙性能,以及具体怎样执行以确保推理中具备大批实用性。
来望望具体是怎样作念到的吧?
元数据加速大模子预查考
言语模子预查考语料库中存在着述风、范围和质料水平的高大相反,这关于开发通用模子智力至关遑急,然而高效地学习和部署这些异构数据源中每一种数据源的正确活动却极具挑战性。
在这一配景下,他们建议了一种新的预查考设施,称为元数据调遣然后冷却(MeCo,Metadata Conditioning then Cooldown)。
具体包括两个查考阶段。
预查考阶段(90%)麻豆 视频,将元数据(如文档 URL 的全齐域名 c)与文档拼接(如 " URL: en.wikipedia.orgnn [ document ] ")进行查考。
(举例,如若文档的 URL 是 https://en.wikipedia.org/wiki/Bill Gates,那么文档 URL 的全齐域名 c 即是 en.wikipedia.org;这种 URL 信息在许多预查考语料库中齐很容易获取,它们大多来自 CommonCrawl2(一个绽放的收罗合手取数据存储库))
当使用其他类型的元数据时,URL 应替换为相应的元数据称呼。
他们只谋划文档象征的交叉熵亏空,而不琢磨模板或元数据中的象征,因为在初步实验中发现,对这些象征进行查考会稍稍损伤卑鄙性能。
终末 10% 的查考手艺为冷却阶段,使用规范数据查考,接受元数据调遣阶段的学习率和优化器景况,即从上一阶段的终末一个检查点脱手化学习率、模子参数和优化器景况,并链接笔据谋划调整学习率:
1)禁用跨文档 Attention,这既加速了查考速率(1.6B 模子的查考速率提高了 25%),又提高了卑鄙性能。
2)当将多个文档打包成一个序列时,咱们确保每个序列从一个新文档脱手,而不是从一个文档的中间脱手—当将文档打包成固定长度时,这可能会导致一些数据被丢弃,但事实解释这有益于提陡立游性能。
本次实验使用了 Llama Transformer 架构和 Llama-3 tokenizer。咱们使用四种不同的模子大小进行了实验:600M、1.6B、3B 和 8B,以及干系优化开荒。
限制暴露,MeCo 的进展廓清优于规范预查考,其平均性能与 240B 象征的基线特殊,而使用的数据却减少了 33%。
终末纪念,他们主要完成了这三项孝顺。
1、 MeCo 大幅加速了预查考。
实考解释,MeCo 使一个 1.6B 的模子在少用 33% 的查考数据的情况下,达到了与规范预查考模子交流的平均卑鄙性能。在不同的模子范围(600M、1.6B、3B 和 8B)和数据源(C4、RefinedWeb 和 DCLM)下,MeCo 暴露出一致的收益。
2、MeCo 开启了联络言语模子的新设施。
举例,使用 factquizmaster.com(非真确 URL)不错提高学问性任务的性能(举例,在零次学问性问题解答中全齐提高了 6%),而使用 wikipedia.org 与规范的无要求推理比较,毒性生成的可能性镌汰了数倍。
3、消解了 MeCo 的联想选择,并解释 MeCo 与不同类型的元数据兼容。
av偶像使用散列 URL 和模子生成的主题进行的分析标明,元数据的主要作用是按起原将文档归类。因此,即使莫得 URL,MeCo 也能有用地整合不同类型的元数据,包括更细致的选项。
陈丹琦团队
论文作家来自普林斯顿 NLP 小组(附庸于普林斯顿言语与智能 PLI)博士生高天宇、Alexander Wettig、Luxi He、YiHe Dong、Sadhika Malladi 以及陈丹琦。
一作高天宇,本科毕业于清华,是 2019 年清华特奖得主,当今普林斯顿五年事博士生,预测本年毕业,链接在学界搞商讨,商讨范围包括当然言语措置和机器学习的交叉范围,终点调整大言语模子(LLM),包括构建欺诈规范、提高 LLM 功能和效果。
Luxi He 当今是普林斯顿谋划机专科二年事博士生,当今商讨重心是考虑言语模子并改善其一致性和安全性,硕士毕业于哈佛大学。
YiHe Dong 当今在谷歌从事机器学习商讨和工程使命,专注于结构化数据的暗示学习、自动化特征工程和多模态暗示学习麻豆 视频,本科毕业于普林斯顿。
眼瞅着年味儿越来越浓美女 自慰,春节马上就到跟前儿了,一念念到阖家团圆,亲戚一又友凑一块儿热吵杂闹的场景,心里就暖烘烘的。 不外,这里头有个事儿可辞谢冷落,那即是发红包。 发红包事看着小,其实里头藏着不少门谈,如果没搞显然,说不定花了钱,还惹得东谈主不安静。 过年发红包压力大 如今,过年发红包成了酬酢平台上的热点话题,热度只增不减,“过年红包若何包”这话题阅读量又开动抓续飞扬。 有位在北京打拼的网友大倒苦水:“北漂这些年,工资没攒下几许,过年回趟家,光是给侄子侄女包红包,就得好几千块,我我方齐...
眼瞅着年味儿越来越浓美女 自慰,春节马上就到跟前儿了,一念念到阖家团圆,亲戚一又友凑一块儿热吵杂闹的场景,心里就暖烘烘的。 不外,这里头有个事儿可辞谢冷落,那即是发红包。 发红包事看着小,其实里头藏着...
穷冬腊月欧美性色图,冰城哈尔滨行将迎来一场艺术的盛宴。1月22日至23日欧美性色图,哈尔滨芭蕾舞团倾情打造的“芭蕾诗剧《尔滨·印象》之第四章——冬 芭蕾杰作晚会”,将在哈尔滨芭蕾舞团丁香戏院拉起头演的...
新赛季LCK迎来了T1新声势的首秀欧美性色图,这是T1在更换上单选手后的初次比赛,敌手是DK,最终两边打满3局之后欧美性色图,T1以1-2的战绩不敌DK,新赛季惨遭首败。 先来简便转头一下这场BO3,...
相似是天灾,中国西藏的震后重建责任依然启动,而的大火于今都在扩张肛交 av,火势难罢休,央视记者直面现场,暗示火势比战场都要惨烈。 洛杉矶大火 在好意思国的加利福尼亚州,似乎山火依然成为了见怪不怪的常...