麻豆 视频 陈丹琦团队降本大法又来了:数据砍掉三分之一,性能却完全不减

发布日期:2025-01-09 11:21    点击次数:155

麻豆 视频 陈丹琦团队降本大法又来了:数据砍掉三分之一,性能却完全不减

陈丹琦团队又带着他们的降本大法来了——麻豆 视频

数据砍掉三分之一,大模子性能却完全不减。

他们引入了元数据,加速了大模子预查考的同期,也不加多单独的谋划支拨。

在不同模子范围(600M - 8B)和查考数据起原的情况下,均能收尾性能方面的培育。

诚然之前元数听说念过好多,但一作高天宇暗示,他们是第一个展示它怎样影响卑鄙性能,以及具体怎样执行以确保推理中具备大批实用性。

来望望具体是怎样作念到的吧?

元数据加速大模子预查考

言语模子预查考语料库中存在着述风、范围和质料水平的高大相反,这关于开发通用模子智力至关遑急,然而高效地学习和部署这些异构数据源中每一种数据源的正确活动却极具挑战性。

在这一配景下,他们建议了一种新的预查考设施,称为元数据调遣然后冷却(MeCo,Metadata Conditioning then Cooldown)。

具体包括两个查考阶段。

预查考阶段(90%)麻豆 视频,将元数据(如文档 URL 的全齐域名 c)与文档拼接(如 " URL:   en.wikipedia.orgnn [ document ] ")进行查考。

(举例,如若文档的 URL 是   https://en.wikipedia.org/wiki/Bill   Gates,那么文档 URL 的全齐域名 c 即是 en.wikipedia.org;这种 URL 信息在许多预查考语料库中齐很容易获取,它们大多来自 CommonCrawl2(一个绽放的收罗合手取数据存储库))

当使用其他类型的元数据时,URL 应替换为相应的元数据称呼。

他们只谋划文档象征的交叉熵亏空,而不琢磨模板或元数据中的象征,因为在初步实验中发现,对这些象征进行查考会稍稍损伤卑鄙性能。

终末 10% 的查考手艺为冷却阶段,使用规范数据查考,接受元数据调遣阶段的学习率和优化器景况,即从上一阶段的终末一个检查点脱手化学习率、模子参数和优化器景况,并链接笔据谋划调整学习率:

1)禁用跨文档 Attention,这既加速了查考速率(1.6B 模子的查考速率提高了 25%),又提高了卑鄙性能。

2)当将多个文档打包成一个序列时,咱们确保每个序列从一个新文档脱手,而不是从一个文档的中间脱手—当将文档打包成固定长度时,这可能会导致一些数据被丢弃,但事实解释这有益于提陡立游性能。

本次实验使用了 Llama Transformer 架构和 Llama-3 tokenizer。咱们使用四种不同的模子大小进行了实验:600M、1.6B、3B 和 8B,以及干系优化开荒。

限制暴露,MeCo 的进展廓清优于规范预查考,其平均性能与 240B 象征的基线特殊,而使用的数据却减少了 33%。

终末纪念,他们主要完成了这三项孝顺。

1、  MeCo 大幅加速了预查考。

实考解释,MeCo 使一个 1.6B 的模子在少用 33% 的查考数据的情况下,达到了与规范预查考模子交流的平均卑鄙性能。在不同的模子范围(600M、1.6B、3B 和 8B)和数据源(C4、RefinedWeb 和 DCLM)下,MeCo 暴露出一致的收益。

2、MeCo 开启了联络言语模子的新设施。

举例,使用 factquizmaster.com(非真确 URL)不错提高学问性任务的性能(举例,在零次学问性问题解答中全齐提高了 6%),而使用 wikipedia.org 与规范的无要求推理比较,毒性生成的可能性镌汰了数倍。

3、消解了 MeCo 的联想选择,并解释 MeCo 与不同类型的元数据兼容。

av偶像

使用散列 URL 和模子生成的主题进行的分析标明,元数据的主要作用是按起原将文档归类。因此,即使莫得 URL,MeCo 也能有用地整合不同类型的元数据,包括更细致的选项。

陈丹琦团队

论文作家来自普林斯顿 NLP 小组(附庸于普林斯顿言语与智能 PLI)博士生高天宇、Alexander Wettig、Luxi He、YiHe Dong、Sadhika Malladi 以及陈丹琦。

一作高天宇,本科毕业于清华,是 2019 年清华特奖得主,当今普林斯顿五年事博士生,预测本年毕业,链接在学界搞商讨,商讨范围包括当然言语措置和机器学习的交叉范围,终点调整大言语模子(LLM),包括构建欺诈规范、提高 LLM 功能和效果。

Luxi He 当今是普林斯顿谋划机专科二年事博士生,当今商讨重心是考虑言语模子并改善其一致性和安全性,硕士毕业于哈佛大学。

YiHe Dong 当今在谷歌从事机器学习商讨和工程使命,专注于结构化数据的暗示学习、自动化特征工程和多模态暗示学习麻豆 视频,本科毕业于普林斯顿。



热点资讯

母狗 拳交 中国“莫得冬天”的7座城市,均温20℃东谈主少景好意思,东谈主均1000元吃好玩爽

这个时候不少东谈主应该曾经在想考母狗 拳交,去那里过一个“暖冬”的沐日了。 去三亚?淌若拖家带口的话,这但是一笔不小的花费。 那么国内还有哪些方位不错避寒呢? 旅行菌就为巨匠整理几个性价比高但是风物优好意思、好意思食随处的避寒胜地! 01 昆明 素有“春城”的好意思誉,即使在冬季,这里也保留着独到的魔力。当朔方曾经银装素裹,昆明的街头仍似锦似锦,只不外多了一份宁静与高深。 翠湖的湖水在冬日暖阳下水光潋滟,周围的山峦依然是邑邑芊芊,陈旧的建设在蓝天的衬托下更显古朴。 冬天的滇池亦然最好意思的。...

相关资讯