偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

“Transformer挑戰(zhàn)者”Mamba,用Macbook也能跑了!GitHub半天斬獲500+星

人工智能
Mamba是一種新的大模型架構(gòu),在語言任務(wù)上的表現(xiàn)可以與兩倍規(guī)模的Transformer一決雌雄。但官方給出的只有模型文件,需要一定專業(yè)知識才能部署使用,而且要Linux+N卡才能運行。

“Transformer的挑戰(zhàn)者”Mamba,用MacBook也能跑了!

有大佬在GitHub上共享了一份筆記,讓人們可以用最簡單的方式運行Mamba。

這份共享中,算上說明書一共只有三個文件,而且發(fā)布不到一天,就斬獲了500+星標(biāo)。

圖片圖片

Mamba是一種新的大模型架構(gòu),在語言任務(wù)上的表現(xiàn)可以與兩倍規(guī)模的Transformer一決雌雄。

但官方給出的只有模型文件,需要一定專業(yè)知識才能部署使用,而且要Linux+N卡才能運行。

圖片圖片

有了這份筆記,Mamba的運行步驟大大簡化,而且也不再要求N卡,M系列的MacBook也能跑了。

從事相關(guān)專業(yè)的網(wǎng)友看了表示,這種簡單化的模型實在是太棒了,希望自己的工作也能朝著這個方向進展。

圖片圖片

原版Mamba的作者Tri Dao和Albert Gu也轉(zhuǎn)發(fā)了這份筆記,并對它的簡潔性和易讀性給予了肯定。

圖片圖片

那么,這份筆記該如何使用呢?

兩個文件即可運行

首先,打開一個能運行PyTorch筆記的工具,比如Jupyter、VSCode,或者在線的谷歌Colab等。

然后下載作者的筆記和Python腳本,用Colab的話也可以使用GitHub導(dǎo)入功能。

如果在本地運行,需要把兩個文件放到同一個目錄;如果用Colab,則需要在連接成功后把model.py上傳。

如果不上傳,會出現(xiàn)“找不到‘model’”的報錯如果不上傳,會出現(xiàn)“找不到‘model’”的報錯

之后是安裝所需的依賴環(huán)境,Colab需要手動安裝的是einops,其他工具可以根據(jù)報錯信息判斷缺少的依賴。

!pip install 需要安裝的依賴名稱

圖片圖片

解決好依賴問題后,就可以點擊筆記第一組中的運行按鈕了,這里可以對模型規(guī)模進行選擇,默認370M。

圖片圖片

接下來是初始化,直接點擊運行按鈕即可。

這里也可以對輸出token的數(shù)量進行調(diào)節(jié),默認是50。

圖片圖片

接著,筆記中給出了一些實例,我們也可以修改單引號之間的prompt內(nèi)容(換行用\n表示),然后點擊運行。

不過需要注意的是,這里的prompt和我們平時用ChatGPT等bot型應(yīng)用的方式有所區(qū)別。

圖片圖片

這里可以借用一下Hugging Face中Llama 2的系統(tǒng)提示詞:

Below are a series of dialogues between various people and an AI assistant. The AI tries to be helpful, polite, honest, sophisticated, emotionally aware, and humble-but-knowledgeable. The assistant is happy to help with almost anything, and will do its best to understand exactly what is needed. It also tries to avoid giving false or misleading information, and it caveats when it isn’t entirely sure about the right answer. That said, the assistant is practical and really does its best, and doesn’t let caution get too much in the way of being useful.User: 想問的問題Assistant:

圖片圖片

性能上,在默認的規(guī)模和輸出長度(370M,50token)下,輸入Once Upon a time,在純CPU版Colab中需用時約1分鐘,在TPU上的用時則約為30秒,內(nèi)存消耗在3到4GB之間。

圖片圖片

在M1芯片的Mac上,以相同設(shè)置處理同樣的內(nèi)容,則需花費1分半左右。

圖片圖片

不過作者也解釋道,出于易讀性的考慮,去掉了原版Mamba中的一些加速指令。

圖片圖片

參考鏈接:https://news.ycombinator.com/item?id=38708730

責(zé)任編輯:武曉燕 來源: 量子位
相關(guān)推薦

2025-07-10 08:55:00

模型AI論文

2024-04-26 16:44:50

2011-02-23 09:35:58

Mozilla火狐瀏覽器

2024-08-13 12:49:29

2015-02-02 11:31:33

聯(lián)想摩托羅拉

2015-04-27 15:05:28

2011-11-07 09:02:52

諾基亞Windows Pho

2013-03-25 12:37:56

2013Android競爭對手

2024-08-19 13:21:14

2018-07-23 13:48:47

京東云

2023-02-20 15:26:52

游戲技術(shù)

2013-08-30 09:06:17

公有云AWSIBM

2018-10-31 09:43:22

2012-03-29 09:13:52

Windows Pho挑戰(zhàn)賽

2023-12-05 13:38:11

架構(gòu)模型

2020-12-09 14:28:09

PON網(wǎng)絡(luò)通信服務(wù)

2012-04-16 13:21:00

2020-05-13 15:52:18

編碼競賽網(wǎng)站代碼

2016-08-18 00:44:38

Python編程語言

2010-05-14 15:29:00

至強7500服務(wù)器評測
點贊
收藏

51CTO技術(shù)棧公眾號