偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<rt id="cmvkm"></rt>

<tt id="cmvkm"></tt>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

ICML 2024 | 脫離LoRA架構(gòu)，訓(xùn)練參數(shù)大幅減少，新型傅立葉微調(diào)來了

輕薄滴假象

發(fā)布于 2024-5-27 09:06

瀏覽

0收藏

本文介紹了香港科技大學(xué)（廣州）的一篇關(guān)于大模型高效微調(diào)（LLM PEFT Fine-tuning）的文章「Parameter-Efficient Fine-Tuning with Discrete Fourier Transform」，本文被 ICML 2024 接收，代碼已開源。

ICML 2024 | 脫離LoRA架構(gòu)，訓(xùn)練參數(shù)大幅減少，新型傅立葉微調(diào)來了-AI.x社區(qū)

論文地址：https://arxiv.org/abs/2405.03003
項(xiàng)目地址：https://github.com/Chaos96/fourierft

背景

大型基座模型在自然語(yǔ)言處理（NLP）和計(jì)算機(jī)視覺（CV）領(lǐng)域都獲得了矚目的成就。微調(diào)（Finetuning）大型基座模型，使其更加適應(yīng)特殊的下游任務(wù)，成為了一項(xiàng)熱門研究課題。然而，在模型越來越大，下游任務(wù)越來越多樣的今天，微調(diào)整個(gè)模型帶來的計(jì)算、存儲(chǔ)消耗已大到不再能被接受。LoRA 采用低秩擬合微調(diào)增量的方案，成功降低了大量的此類消耗，但每個(gè)適應(yīng)器（adapter）的大小仍然是不可忽視的。這激發(fā)了本文的核心問題：相比 LoRA，如何進(jìn)一步大幅減少可訓(xùn)練參數(shù)？此外，一個(gè)有趣的附加問題是能否采用更少的參數(shù)量得到高秩增量矩陣。

方法

傅立葉基底在各類數(shù)據(jù)壓縮應(yīng)用中廣泛使用，例如一維向量信號(hào)和二維圖像的壓縮。在這些應(yīng)用中，稠密的空域信號(hào)通過傅立葉變換被轉(zhuǎn)化為稀疏的頻域信號(hào)。基于這一原理，作者推測(cè)模型權(quán)重的增量也可以被視為一種空域信號(hào)，其對(duì)應(yīng)的頻域信號(hào)可以通過稀疏表示來實(shí)現(xiàn)。

在這一假設(shè)的基礎(chǔ)上，作者提出了一種新的方法，用于在頻域中學(xué)習(xí)增量權(quán)重信號(hào)。具體來說，該方法通過隨機(jī)位置的稀疏頻域信號(hào)來表示空域權(quán)重增量。在加載預(yù)訓(xùn)練模型時(shí)，首先隨機(jī)選擇 n 個(gè)點(diǎn)作為有效的頻域信號(hào)，然后將這些信號(hào)拼接成一個(gè)一維向量。在前向傳播過程中，這個(gè)一維向量被用來通過傅立葉變換恢復(fù)空域矩陣；在反向傳播過程中，由于傅里葉變換的可導(dǎo)性，可以直接對(duì)此可學(xué)習(xí)的向量進(jìn)行更新。這種方法不僅有效減少了模型微調(diào)時(shí)所需的參數(shù)數(shù)量，同時(shí)保證了微調(diào)性能。通過這種方式，作者不僅實(shí)現(xiàn)了對(duì)大規(guī)模基礎(chǔ)模型的高效微調(diào)，還展示了傅立葉變換在機(jī)器學(xué)習(xí)領(lǐng)域中的潛在應(yīng)用價(jià)值。

ICML 2024 | 脫離LoRA架構(gòu)，訓(xùn)練參數(shù)大幅減少，新型傅立葉微調(diào)來了-AI.x社區(qū)

得益于傅立葉變換基底的高信息量，僅需很小的 n 值即可達(dá)到與 LoRA 相當(dāng)甚至超過 LoRA 的表現(xiàn)。一般來說，傅立葉微調(diào)的可訓(xùn)練參數(shù)僅為 LoRA 的千分之一到十分之一。

實(shí)驗(yàn)

1. 自然語(yǔ)言理解

作者在自然語(yǔ)言理解的 GLUE 基準(zhǔn)測(cè)試上對(duì)傅立葉微調(diào)方法進(jìn)行了評(píng)估?；€對(duì)比方法包括全量微調(diào)（FF，F(xiàn)ull Finetuning）、Bitfit、適應(yīng)器微調(diào)（Adapter Tuning）、LoRA、DyLoRA 和 AdaLoRA。下表展示了各種方法在 GLUE 各個(gè)任務(wù)上的表現(xiàn)及其所需的訓(xùn)練參數(shù)量。結(jié)果表明，傅立葉微調(diào)以最少的參數(shù)量達(dá)到了甚至超越了其他微調(diào)方法的性能。

ICML 2024 | 脫離LoRA架構(gòu)，訓(xùn)練參數(shù)大幅減少，新型傅立葉微調(diào)來了-AI.x社區(qū)

2. 自然語(yǔ)言指令微調(diào)

大模型的自然語(yǔ)言生成是目前模型微調(diào)的重要應(yīng)用領(lǐng)域。作者在 LLaMA 系列模型、MT-Bench 任務(wù)和 Vicuna 任務(wù)上評(píng)估了傅立葉微調(diào)的性能。結(jié)果顯示，傅立葉微調(diào)以極低的訓(xùn)練參數(shù)量達(dá)到了與 LoRA 相似的效果，進(jìn)一步驗(yàn)證了傅里葉微調(diào)方法的通用性和有效性。

ICML 2024 | 脫離LoRA架構(gòu)，訓(xùn)練參數(shù)大幅減少，新型傅立葉微調(diào)來了-AI.x社區(qū)

3. 圖像分類

作者在 Vision Transformer 上測(cè)試了傅里葉微調(diào)的性能，涵蓋了 8 個(gè)常見的圖像分類數(shù)據(jù)集。實(shí)驗(yàn)結(jié)果表明，雖然在圖像分類任務(wù)中傅立葉微調(diào)相較LoRA的壓縮率提升并不比自然語(yǔ)言任務(wù)中顯著，但其仍然以遠(yuǎn)小于 LoRA 的參數(shù)量超越了 LoRA 的效果。這進(jìn)一步展示了傅立葉微調(diào)在不同應(yīng)用領(lǐng)域中的有效性和優(yōu)勢(shì)。

ICML 2024 | 脫離LoRA架構(gòu)，訓(xùn)練參數(shù)大幅減少，新型傅立葉微調(diào)來了-AI.x社區(qū)

4. 突破低秩

在 GLUE 基準(zhǔn)的 RTE 數(shù)據(jù)集上，F(xiàn)ourierFT 可以實(shí)現(xiàn)明顯高于 LoRA (通常為 4 或 8) 的增量的秩。

ICML 2024 | 脫離LoRA架構(gòu)，訓(xùn)練參數(shù)大幅減少，新型傅立葉微調(diào)來了-AI.x社區(qū)

5.GPU 資源消耗

微調(diào)過程中，F(xiàn)ourierFT 可以實(shí)現(xiàn)比 LoRA 更少的 GPU 消耗。下圖為采用單張 4090 顯卡在 RoBERTa-Large 模型上的巔峰內(nèi)存消耗。

ICML 2024 | 脫離LoRA架構(gòu)，訓(xùn)練參數(shù)大幅減少，新型傅立葉微調(diào)來了-AI.x社區(qū)

結(jié)論

作者介紹了一種名為傅立葉微調(diào)的高效微調(diào)方法，通過利用傅里葉變換來減少大基礎(chǔ)模型微調(diào)時(shí)的可訓(xùn)練參數(shù)數(shù)量。該方法通過學(xué)習(xí)少量的傅里葉譜系數(shù)來表示權(quán)重變化，顯著降低了存儲(chǔ)和計(jì)算需求。實(shí)驗(yàn)結(jié)果顯示，傅立葉微調(diào)在自然語(yǔ)言理解、自然語(yǔ)言生成、指令調(diào)優(yōu)和圖像分類等任務(wù)上表現(xiàn)優(yōu)異，與現(xiàn)有的低秩適應(yīng)方法（如 LoRA）相比，傅立葉微調(diào)在保持或超過 LoRA 性能的同時(shí)，所需的可訓(xùn)練參數(shù)大幅減少。

本文轉(zhuǎn)自機(jī)器之心，作者：機(jī)器之心

原文鏈接:??https://mp.weixin.qq.com/s/jaYeIfByJaWU5-4jBmnrzQ??

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

大模型微調(diào)新范式：當(dāng)LoRA遇見MoE

zhangyannni ? 3958瀏覽 ? 0回復(fù)
單GPU實(shí)現(xiàn)LLM多LoRA微調(diào)

angel ? 4648瀏覽 ? 0回復(fù)
LLM高效微調(diào)詳解-從Adpter、PrefixTuning到LoRA

angel ? 4263瀏覽 ? 0回復(fù)
新型多智能體系統(tǒng)MESA，探索效率大幅提升

AI論文解讀 ? 4192瀏覽 ? 1回復(fù)
ICML 2024 | 大語(yǔ)言模型預(yù)訓(xùn)練新前沿：「最佳適配打包」重塑文檔處理標(biāo)準(zhǔn)

輕薄滴假象 ? 2709瀏覽 ? 0回復(fù)
LoRA數(shù)學(xué)編程任務(wù)不敵全量微調(diào) | 哥大&Databricks新研究

Crystalcxt ? 3012瀏覽 ? 0回復(fù)
ICML 2024：從視覺語(yǔ)言基礎(chǔ)模型反饋中進(jìn)行強(qiáng)化學(xué)習(xí)

AIGC最前線 ? 4230瀏覽 ? 0回復(fù)
原作者帶隊(duì)的Mamba 2來了，新架構(gòu)訓(xùn)練效率大幅提升

輕薄滴假象 ? 2890瀏覽 ? 0回復(fù)
LLM微調(diào)技術(shù)LoRA圖解

51CTO內(nèi)容精選 ? 3443瀏覽 ? 0回復(fù)
ICML 2024 Oral｜外部引導(dǎo)的深度聚類新范式

輕薄滴假象 ? 3158瀏覽 ? 0回復(fù)
ETH北航字節(jié)推出LoRA新范式 | ICML 2024

Crystalcxt ? 2741瀏覽 ? 0回復(fù)
谷歌開源TimesFM：1000億個(gè)時(shí)間點(diǎn)訓(xùn)練，入選ICML 2024

duhorse ? 3229瀏覽 ? 0回復(fù)
ICML 2024：AI對(duì)齊與可變和可影響?yīng)剟?lì)函數(shù)

AIGC最前線 ? 2907瀏覽 ? 0回復(fù)
ICML 2024｜Transformer究竟如何推理？基于樣例還是基于規(guī)則

輕薄滴假象 ? 3060瀏覽 ? 0回復(fù)
ICML 2024高分論文 | 零階優(yōu)化器微調(diào)大模型，大幅降低內(nèi)存

輕薄滴假象 ? 3176瀏覽 ? 0回復(fù)
深入理解預(yù)訓(xùn)練與微調(diào)，為什么需要預(yù)訓(xùn)練，什么是微調(diào)？

AI探索時(shí)代 ? 4394瀏覽 ? 0回復(fù)
參數(shù)高效微調(diào)-Prefix Tuning、Adapter Tuning、LoRA

大模型自然語(yǔ)言處理 ? 3875瀏覽 ? 0回復(fù)
使用Unsloth微調(diào)與運(yùn)行Gemma 3，速度提升1.6倍，VRAM使用減少60%

sbf_2000 ? 3462瀏覽 ? 0回復(fù)
強(qiáng)化微調(diào)來襲！如何讓AI真正“聽懂”人類需求

Halo咯咯 ? 931瀏覽 ? 0回復(fù)

輕薄滴假象

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

DeepSeek一口氣開源3個(gè)項(xiàng)目，還有梁文鋒親自參與，昨晚API大降價(jià) 2025-02-27 12:40:06發(fā)布
全球首個(gè)AI CUDA工程師來了！將PyTorch原生實(shí)現(xiàn)提速10-100倍 2025-02-21 13:20:31發(fā)布

熱門推薦

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實(shí)測(cè)：真·超DS！ 1回復(fù)

AI Agents開源工具棧全解析~ 0回復(fù)

效果&成本雙突破！快手提出端到端生成式推薦系統(tǒng)OneRec！ 0回復(fù)

我把DeepSeek微調(diào)參數(shù)扒光了，顯存和性能優(yōu)化的秘密都在這 0回復(fù)

上一篇：騰訊PCG自研高性能大語(yǔ)言模型推理引擎「一念LLM」正式開源

下一篇： Bengio等人新作：注意力可被視為RNN，新模型媲美Transformer，但超級(jí)省內(nèi)存

社區(qū)精華內(nèi)容

目錄

<meter id="vk9ka"><sup id="vk9ka"><dd id="vk9ka"></dd></sup></meter>

<var id="vk9ka"><fieldset id="vk9ka"><dd id="vk9ka"></dd></fieldset></var>

<tr id="vk9ka"></tr>

<abbr id="vk9ka"></abbr>