偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<u id="kgml4"><menu id="kgml4"></menu></u>

<blockquote id="kgml4"><p id="kgml4"></p></blockquote>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

DeepSeek-R1持續(xù)震撼硅谷：躋身競技榜前三，創(chuàng)始人梁文鋒采訪被“拿放大鏡”看

作者：量子位 2025-01-26 08:00:00

人工智能新聞

剛剛，DeepSeek-R1躋身大模型競技榜前三。

“神秘東方力量”DeepSeek給硅谷帶來的影響，還在不斷泛起漣漪——

剛剛，DeepSeek-R1躋身大模型競技榜前三。

以開源、便宜20倍的“身價”與ChatGPT-4o（2024.11.20）并列。

在復(fù)雜提示詞/風(fēng)格控制榜單上，R1位列第一。

目前結(jié)果來看，它在各個維度上都保持領(lǐng)先。

在衡量模型編程開發(fā)能力的WebDev分榜上，R1位列第二，與閉源的Claude 3.5 Sonnet相差不到40分。

網(wǎng)友實測體驗表示，確實如此，R1在30場battle中只輸了4、5次。

另一邊，硅谷對DeepSeek的好奇不減。

畢竟，它可是一個“副業(yè)”。

創(chuàng)始人梁文鋒的中文采訪更是被翻譯成英文，“拿著放大鏡”逐字認(rèn)真閱讀。

他提出的觀點也被總結(jié)成箴言，在互聯(lián)網(wǎng)上流傳。

真正的差距不是1年或2年，而在于是原創(chuàng)還是模仿。

圖靈獎得主LeCun也為DeepSeek做出中肯評價：

它代表了開源的力量。
這意味著，開源模型正在超越專有模型。

值得一提的是，同為開源領(lǐng)域代表的Meta剛剛公布了2025年在AI領(lǐng)域的布局計劃：650億美元，投算力、投人才。

有爆料稱，Meta內(nèi)部已經(jīng)因為DeepSeek感到恐慌。

“他們讓OpenAI一次又一次看清自己”

所以，在硅谷視角里，他們更關(guān)心DeepSeek的哪些信息？

最首要的莫過于，DeepSeek如何賺錢。

挖到的信息有點出乎意料，或許DeepSeek還沒想賺錢的事。

控股DeepSeek的是幻方量化，他們有一批頂級科學(xué)家，有充裕的算力資源，DeepSeek其實是一個“副產(chǎn)物”。
在2023年末我就聽說他們在做DeepSeek。即使在當(dāng)時的中國，還沒有人把他們當(dāng)回事。

其次，為何DeepSeek能成功。梁文鋒在2023年5月2024年7月接受暗涌的兩次采訪，也被老外扒出來了。

他們最關(guān)心的五個方面分別是：

1、創(chuàng)新第一性原則：與其他致力于快速商業(yè)化的中國AI公司不同，DeepSeek專注于基礎(chǔ)的AGI研究和創(chuàng)新。他們認(rèn)為，中國必須從全球人工智能發(fā)展的“搭便車者”轉(zhuǎn)變?yōu)椤柏暙I者”。梁文鋒說，創(chuàng)新不完全是商業(yè)驅(qū)動的，還需要好奇心和創(chuàng)造欲。

2、革命性架構(gòu)：DeepSeek V2中采用的新型MLA（多頭潛在注意力機制）架構(gòu)，把顯存占用降到了過去最常用的MHA架構(gòu)的5%-13%，實現(xiàn)了成本大幅降低。它的推理成本僅為Llama 370B的1/7、GPT-4 Turbo的1/70。

這并不是為了挑起一場價格戰(zhàn)——他們只是在“成本上稍微有點利潤”來定價。這種創(chuàng)新架構(gòu)繼續(xù)應(yīng)用于V3和R1模型中。

3、獨特的公司文化和人才戰(zhàn)略：DeepSeek保持著一個完全自下而上的組織結(jié)構(gòu)，為研究人員提供無限的計算資源，優(yōu)先看創(chuàng)造熱情而不是證書。他們的突破性創(chuàng)新來自年輕的本土人才——中國本土的應(yīng)屆畢業(yè)生和年輕技術(shù)人才，而非海外招聘。

4、致力于開源：盡管行業(yè)開始趨向于閉源模型（OpenAI和Mistral），DeepSeek仍致力于開源，并認(rèn)為開源對于建立一個強大的技術(shù)生態(tài)系統(tǒng)至關(guān)重要。梁文鋒認(rèn)為，在顛覆性技術(shù)面前，閉源形成的護城河是短暫的。

他們的真正價值在于建立一個具備創(chuàng)新能力的組織。

5、底層計算挑戰(zhàn)：盡管擁有足夠的資金和技術(shù)，DeepSeek也面臨來自底層計算的挑戰(zhàn)和壓力。目前公司還沒有新的融資計劃。梁文鋒認(rèn)為，面臨的主要制約因素不是資金，而是高端算力的使用權(quán)，這些芯片對于訓(xùn)練先進AI模型至關(guān)重要。

除此之外，采訪中的諸多細(xì)節(jié)也被網(wǎng)友認(rèn)真品味。

原文中，梁文鋒被問道：怎么看待做量化同時做大量基礎(chǔ)研發(fā)，不燒錢嗎？

他回答：一件激動人心的事，或許不能單純用錢衡量。就像家里買鋼琴，一來買得起，二來是因為有一群急于在上面彈奏樂曲的人。

海外網(wǎng)友感慨：

這幫人是一群有點理想化的“技術(shù)狂”，他們堅信自己能搞出通用人工智能（AGI），而且他們確實有這個資源和天賦。我真是太喜歡他們了！

此外也避免不了一些對比：

梁文鋒展現(xiàn)出一種完全不同的心態(tài)，他們的成功當(dāng)之無愧，我也很期待看到他們一次又一次讓“OpenAI”認(rèn)清自己。

當(dāng)然放眼AI領(lǐng)域的整體發(fā)展，能夠看到DeepSeek，對于所有人而言或許都是興奮的。

盡管我忍不住覺得他們有點天真，畢竟在商業(yè)化上他們有點“自斷后路”。但看到一個團隊堅持理想并取得成功，確實讓人覺得很欣慰。

隨著R1的驚艷亮相，DeepSeek正在兌現(xiàn)自己所說的一切。拓寬技術(shù)邊界、堅持開源、專注于技術(shù)開發(fā)……

那么，DeepSeek是如何走到現(xiàn)在的呢？

用AI做量化，再回到AI

梁文鋒本碩均就讀于浙江大學(xué)信息與電子工程學(xué)專業(yè)。

2008年，梁文鋒畢業(yè)，開始帶領(lǐng)團隊使用機器學(xué)習(xí)等技術(shù)探索全自動量化交易。

當(dāng)時量化在國內(nèi)還是個新鮮概念，能否賺錢是個未知數(shù)。2010年滬深300股指期貨推出，量化投資迎來春天。據(jù)公開信息顯示，梁文鋒團隊正是乘上這股東風(fēng)，很快自營資金超過5億元。

與此同時，深度學(xué)習(xí)浪潮的齒輪開始轉(zhuǎn)動，人工智能率先在硅谷爆發(fā)。

2015年，梁文鋒與校友共同創(chuàng)立幻方量化。僅僅1年后，他們就推出了旗下第一個AI模型，第一份由深度學(xué)習(xí)生成的交易倉位上線執(zhí)行，使用GPU進行計算。

2017年，幻方量化宣稱實現(xiàn)投資策略全面AI化。

2018年，幻方量化確立AI為公司的主要發(fā)展方向。

AI加持下，幻方量化旗下基金回報率遠(yuǎn)超同期滬深300指數(shù)。2019年，資金管理規(guī)模突破百億元。

2019年，梁文鋒在當(dāng)年的金牛獎頒獎儀式上，發(fā)表主題演講《一名程序員眼里中國量化投資的未來》，這是他少見的公開演講。

演講全文的確充滿“程序員視角”：

量化公司是沒有基金經(jīng)理的，基金經(jīng)理就是一堆服務(wù)器。人來做投資決策的時候，它是一種藝術(shù)，要憑感覺。程序來決策的時候，它是一種科學(xué)，它有最優(yōu)解。

也是這一年，幻方量化開始大規(guī)模布局AI算力，搭建起“螢火一號”集群。2021年，“螢火二號”落成。這樣的算力基建，成為如今DeepSeek快速奔跑的底層支撐。

2021年，幻方量化成為國內(nèi)首家突破千億規(guī)模的的量化私募大廠，被稱為國內(nèi)量化私募“四大天王”之一。

值得一提的是，在幻方量化的官網(wǎng)上，AI基礎(chǔ)科學(xué)研究始終占據(jù)重要位置，包括在大模型浪潮前。

幻方量化曾表示，多年以來，該公司堅持把營收的大部分投入人工智能領(lǐng)域，建設(shè)領(lǐng)先的AI硬件基礎(chǔ)設(shè)施，進行大規(guī)模的研究，探索人類未知的奧秘。

我們相信幾乎所有的創(chuàng)新都是從大膽嘗試和點滴積累中孕育而來。

2023年，幻方量化將下場做大模型的獨立新組織命名為深度求索，并強調(diào)將專注于做真正人類級別的人工智能。

目標(biāo)不是復(fù)刻ChatGPT，而是研究和揭秘AGI的更多未知信息。

DeepSeek的故事也就開始于這一刻。

一個80后程序員在攪動中國量化市場后，完成資金積累，組建起年輕蓬勃的團隊，似乎又回到了他原本的起點、回到AI，但產(chǎn)生的能量正在全球掀起駭浪。

One More Thing

值得一提的是，幻方量化還長期向慈善機構(gòu)捐贈，官網(wǎng)披露公司員工“一只平凡的小豬”個人捐助 1.38 億元，支持 15 家慈善機構(gòu)的 23 個公益項目，在全國范圍內(nèi)幫助弱勢群體，促進社會的公平和發(fā)展。

爆料消息稱，這個員工就是梁文鋒本人。

責(zé)任編輯：張燕妮來源：量子位

模型 AI 數(shù)據(jù)

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<cite id="weeaa"></cite>

<style id="weeaa"><table id="weeaa"></table></style>