偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

DeepSeek-V3.2背后的國(guó)產(chǎn)算子編程語言TileLang是什么?如何保持性能領(lǐng)先的同時(shí)減少6倍代碼量?

人工智能
TileLang作為一款新興的AI算子編程語言,憑借其創(chuàng)新的Tile級(jí)抽象、多層級(jí)編程范式和強(qiáng)大的自動(dòng)調(diào)度能力,為AI算子開發(fā)提供了兼具高生產(chǎn)力和高性能的解決方案。

引言

9月29日傍晚,DeepSeek-V3.2-Exp模型正式發(fā)布并開源。該模型引入了稀疏Attention架構(gòu),旨在降低計(jì)算資源消耗并提升模型推理效率,并且已成功在華為云平臺(tái)完成適配,支持高達(dá)160K的長(zhǎng)序列上下文。這一進(jìn)展無疑對(duì)底層算子的性能和開發(fā)效率提出了更高的要求。

當(dāng)我們探討支撐此類前沿大模型高效運(yùn)行與快速迭代的底層動(dòng)力時(shí),視線必然會(huì)從模型架構(gòu)本身,轉(zhuǎn)向其賴以發(fā)展的基礎(chǔ)工具鏈。

在不久前華為全聯(lián)接大會(huì)的開發(fā)者日上,由北京大學(xué)計(jì)算機(jī)學(xué)院楊智團(tuán)隊(duì)主導(dǎo)開發(fā)的開源AI算子編程語言——TileLang展示了其如何將高級(jí)數(shù)據(jù)流描述自動(dòng)轉(zhuǎn)換為高效的底層代碼(如AscendC),并成功將FlashAttention算子的代碼量從500多行精簡(jiǎn)至80行,同時(shí)保持了與官方版本持平的性能。這標(biāo)志著一個(gè)新的趨勢(shì):在AI模型競(jìng)爭(zhēng)日益激烈的背景下,像TileLang這樣能夠顯著提升開發(fā)效率的下一代編程工具,正從幕后走向臺(tái)前,成為加速AI創(chuàng)新的重要引擎。

也得益于其高效性和國(guó)產(chǎn)性,DeepSeek 團(tuán)隊(duì)在開發(fā) V3.2-Exp 時(shí)就采用了 TileLang 進(jìn)行快速原型開發(fā),以支持更深入的探索。

今天我們就來扒一扒 TileLang 的核心技術(shù)與設(shè)計(jì)理念、其背后的技術(shù)團(tuán)隊(duì)與項(xiàng)目發(fā)展,以及這項(xiàng)技術(shù)對(duì)國(guó)產(chǎn)開源生態(tài)的影響。

TileLang 開源倉(cāng)庫(kù):https://github.com/tile-ai/tilelang

1 什么是TileLang?概述與起源

在AI技術(shù)飛速發(fā)展的今天,深度學(xué)習(xí)模型的復(fù)雜度和規(guī)模呈指數(shù)級(jí)增長(zhǎng),這對(duì)底層計(jì)算效率提出了前所未有的挑戰(zhàn)。AI算子作為構(gòu)成深度學(xué)習(xí)模型的基本計(jì)算單元,其性能直接影響整個(gè)模型的訓(xùn)練和推理效率。然而,傳統(tǒng)的算子開發(fā)方法存在諸多瓶頸:CUDA編程門檻高、Triton等現(xiàn)有DSL(領(lǐng)域特定語言)在自定義高性能kernel方面靈活性不足,TVM/Tensor IR的調(diào)度代碼復(fù)雜且難以維護(hù)。正是在這樣的背景下,一款名為TileLang的創(chuàng)新性AI算子編程語言應(yīng)運(yùn)而生。

TileLang是由北京大學(xué)計(jì)算機(jī)學(xué)院楊智副教授團(tuán)隊(duì)主導(dǎo)開發(fā)的一款開源AI算子編程語言,其核心價(jià)值在于能夠?qū)⒏呒?jí)別的數(shù)據(jù)流描述,自動(dòng)轉(zhuǎn)換并優(yōu)化為高效的底層代碼(如CUDA或AscendC)。通過獨(dú)特的Tile級(jí)抽象和自動(dòng)調(diào)度能力,開發(fā)者可以用更簡(jiǎn)潔的代碼表達(dá)復(fù)雜計(jì)算,同時(shí)獲得接近手寫算子的高性能,顯著提升了AI算子的開發(fā)效率。

TileLang的設(shè)計(jì)目標(biāo)

TileLang的設(shè)計(jì)目標(biāo)主要體現(xiàn)在三個(gè)方面:

  • 降低開發(fā)門檻:通過高層次的抽象接口,使不熟悉硬件細(xì)節(jié)的算法工程師也能高效開發(fā)高性能算子。
  • 保持性能競(jìng)爭(zhēng)力:生成的代碼性能與手寫優(yōu)化代碼相媲美,在多種常見算子上的測(cè)試表明,其性能可達(dá)業(yè)界領(lǐng)先水平的95%以上。
  • 支持多硬件后端:當(dāng)前版本已支持GPU(CUDA)和昇騰(AscendC)等主流AI加速硬件,為國(guó)產(chǎn)算力平臺(tái)提供優(yōu)質(zhì)開發(fā)體驗(yàn)。

為何命名為"TileLang"?

"Tile"一詞在高性能計(jì)算中指計(jì)算分塊,這是優(yōu)化內(nèi)存層次結(jié)構(gòu)利用的關(guān)鍵技術(shù)。無論是CPU的緩存系統(tǒng),還是GPU的共享內(nèi)存/寄存器層次,合理的Tiling策略都是實(shí)現(xiàn)高性能計(jì)算的必要條件。TileLang將這一概念提升為語言的核心抽象,使開發(fā)者能夠自然表達(dá)計(jì)算分塊策略,而編譯器則能智能地進(jìn)行優(yōu)化。

表:TileLang與現(xiàn)有AI算子開發(fā)方式對(duì)比

特性

傳統(tǒng)CUDA編程

Triton

TVM/Tensor IR

TileLang

學(xué)習(xí)曲線

陡峭

中等

中等

平緩

代碼量

中等

性能控制

精細(xì)

部分控制

依賴調(diào)度編寫

自動(dòng)優(yōu)化+專家調(diào)控

可維護(hù)性

中等

跨硬件支持

僅NVIDIA GPU

主要NVIDIA GPU

多后端

多后端(包括國(guó)產(chǎn)硬件)

2 TileLang的核心技術(shù)與設(shè)計(jì)理念

2.1 Tile級(jí)抽象:貫穿始終的核心思想

TileLang的核心技術(shù)優(yōu)勢(shì)源于其統(tǒng)一的Tile級(jí)抽象。在高性能計(jì)算中,Tiling(分塊)是優(yōu)化數(shù)據(jù)局部性、提升緩存利用率的關(guān)鍵技術(shù)。TileLang將這一概念從簡(jiǎn)單的循環(huán)分塊提升為一級(jí)語言抽象,使開發(fā)者能夠以數(shù)據(jù)流為中心描述計(jì)算,而不必過多關(guān)注硬件細(xì)節(jié)。

與傳統(tǒng)DSL相比,TileLang的創(chuàng)新之處在于將調(diào)度空間(包括線程Binding、Layout、Tensorize和Pipeline)與數(shù)據(jù)流解耦,并將其封裝為一組可自定義的注解和原語。這一設(shè)計(jì)使得用戶能夠?qū)W⒂趉ernel的數(shù)據(jù)流本身,而將大多數(shù)優(yōu)化工作交由編譯器完成。在實(shí)際應(yīng)用中,這種抽象顯著降低了代碼復(fù)雜度——如將FlashAttention算子的實(shí)現(xiàn)從500多行減少至80行,同時(shí)保持了與官方版本持平的性能。

2.2 自動(dòng)調(diào)度與推理機(jī)制

TileLang的編譯器集成了先進(jìn)的自動(dòng)推理機(jī)制,能夠在多個(gè)層面優(yōu)化算子的性能表現(xiàn):

  • 布局推理(Layout Inference):TileLang引入了一套完整的布局推理系統(tǒng),用于描述數(shù)據(jù)在內(nèi)存中的組織和映射方式。這一系統(tǒng)包括嚴(yán)格布局推理(針對(duì)矩陣乘等有強(qiáng)布局約束的算子)和通用布局推理(用于推導(dǎo)相連表達(dá)式的布局),使得編譯器能夠自動(dòng)確定最優(yōu)的內(nèi)存布局。

圖片圖片

  • 并行度推理:通過T.Parallel等原語,編譯器能夠自動(dòng)推導(dǎo)出適合目標(biāo)硬件的并行策略,包括線程綁定、向量化優(yōu)化等。例如,給定kernel上下文128個(gè)線程,將Copy操作用T.Parallel包裝后,編譯器能夠自動(dòng)推導(dǎo)出高性能形式,最終Codegen成優(yōu)化的CUDA代碼。
  • 內(nèi)存層次優(yōu)化:TileLang允許開發(fā)者精確控制數(shù)據(jù)在內(nèi)存層次結(jié)構(gòu)中的流動(dòng),例如將數(shù)據(jù)緩存到寄存器進(jìn)行反量化后再寫入共享內(nèi)存,或是直接寫回共享內(nèi)存。這種靈活性使得專家開發(fā)者能夠針對(duì)特定硬件特性進(jìn)行深度優(yōu)化。

2.3 多層級(jí)編程范式

為滿足不同背景開發(fā)者的需求,TileLang創(chuàng)新性地設(shè)計(jì)了多層級(jí)編程范式:

# Level 1: 專家級(jí)編程 - 直接控制硬件細(xì)節(jié)
@tilelang
def kernel_expert_level(A: [128, 128], B: [128, 128]):
    # 直接指定線程配置和內(nèi)存層次
    for i in range(128):
        for j in range(128):
            # 精確控制計(jì)算和內(nèi)存訪問
            ...

# Level 2: 開發(fā)者級(jí)編程 - 使用Tile級(jí)抽象
@tilelang
def kernel_developer_level(A: [128, 128], B: [128, 128]):
    # 使用Tile原語描述計(jì)算
    T.copy(A, B)
    T.reduce(A, B)
    ...

# Level 3: 初學(xué)者級(jí)編程 - 高級(jí)表達(dá)式
@tilelang
def kernel_beginner_level(A: [128, 128], B: [128, 128]):
    # 直接描述數(shù)學(xué)表達(dá)式
    C = A @ B
    ...

這種分層設(shè)計(jì)使得TileLang既能滿足硬件專家對(duì)性能極致的追求,又能讓算法研究人員快速實(shí)現(xiàn)其想法,大大擴(kuò)展了語言的適用場(chǎng)景。

表:TileLang的多層級(jí)編程范式支持

編程級(jí)別

目標(biāo)用戶

技術(shù)要求

代碼復(fù)雜度

性能控制度

Level 1

硬件專家、資深CUDA程序員

精通硬件架構(gòu)、內(nèi)存層次

精細(xì)控制

Level 2

AI算子開發(fā)者、研究生

了解Tile概念、基礎(chǔ)并行計(jì)算

平衡控制與效率

Level 3

算法工程師、初學(xué)者

熟悉數(shù)學(xué)表達(dá)式和Python

自動(dòng)優(yōu)化

3 技術(shù)團(tuán)隊(duì)與項(xiàng)目發(fā)展

3.1 北大楊智團(tuán)隊(duì):深耕AI系統(tǒng)研究

TileLang的背后是北京大學(xué)計(jì)算機(jī)學(xué)院楊智副教授領(lǐng)銜的科研團(tuán)隊(duì)。楊智老師是北京大學(xué)計(jì)算機(jī)學(xué)院的副研究員、博士生導(dǎo)師,擁有國(guó)家高層次青年人才稱號(hào),在深度學(xué)習(xí)模型的分布式并行、計(jì)算優(yōu)化、算法和系統(tǒng)設(shè)計(jì)方面有著深厚積累。

該團(tuán)隊(duì)的研究特色鮮明,采用自頂向下的系統(tǒng)性研究方法,培養(yǎng)學(xué)生構(gòu)建從上層算法應(yīng)用到底層數(shù)據(jù)處理和計(jì)算系統(tǒng)的全方位能力。團(tuán)隊(duì)長(zhǎng)期與阿里、微軟研究院等產(chǎn)業(yè)界領(lǐng)先團(tuán)隊(duì)保持密切合作研究與聯(lián)合培養(yǎng),使研究生能夠接觸實(shí)際需求、數(shù)據(jù)和系統(tǒng),有效提高科研和實(shí)際能力。這種產(chǎn)學(xué)研深度融合的模式,為TileLang的研發(fā)提供了堅(jiān)實(shí)支撐。

3.2 項(xiàng)目發(fā)展歷程與成果

TileLang項(xiàng)目雖然相對(duì)年輕,但已經(jīng)取得了一系列令人矚目的成果:

  • 開源表現(xiàn)亮眼:TileLang在GitHub上開源僅兩個(gè)月即斬獲797星,吸引了280多位開發(fā)者加入社區(qū),顯示了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。
  • 技術(shù)生態(tài)合作:項(xiàng)目與SGLang等知名開源項(xiàng)目建立了技術(shù)生態(tài)合作,逐步構(gòu)建起自己的技術(shù)影響力圈。
  • 行業(yè)認(rèn)可:在2025年9月的華為全聯(lián)接大會(huì)開發(fā)者日上,TileLang作為代表性創(chuàng)新成果亮相,團(tuán)隊(duì)核心成員董宇騏現(xiàn)場(chǎng)展示了TileLang在FlashAttention算子開發(fā)中的顯著優(yōu)勢(shì)——代碼量從500+行減少至80行,同時(shí)保持性能持平。

TileLang的性能表現(xiàn)已在多個(gè)關(guān)鍵kernel上得到驗(yàn)證,包括FlashAttention、Linear Attention等復(fù)雜算子。評(píng)估結(jié)果表明,TileLang在這些kernel上可實(shí)現(xiàn)業(yè)界領(lǐng)先的性能,充分展示了其統(tǒng)一的Block-Thread編程范式和透明的調(diào)度能力。

H100 上的 Flash Attention 性能H100 上的 Flash Attention 性能

圖片圖片

H100 上的 MLA 性能H100 上的 MLA 性能

4 開源生態(tài)與社區(qū)建設(shè)

4.1 開源進(jìn)展與社區(qū)活躍度

TileLang遵循開源開放的原則,自2025年1月在GitHub上開源以來,迅速引起了AI編譯器與算子開發(fā)社區(qū)的廣泛關(guān)注。在短短兩個(gè)月內(nèi),該項(xiàng)目即獲得了797個(gè)星標(biāo),吸引了280多位開發(fā)者加入社區(qū),形成了活躍的討論和技術(shù)交流氛圍。這種快速的社區(qū)成長(zhǎng),反映了市場(chǎng)對(duì)更高效AI算子開發(fā)工具的迫切需求。

目前已有將近 1800 star目前已有將近 1800 star

項(xiàng)目的技術(shù)生態(tài)建設(shè)也取得了初步成效,與SGLang等知名開源項(xiàng)目建立了技術(shù)生態(tài)合作,擴(kuò)大了其技術(shù)影響力。這種合作不僅有助于TileLang在更廣泛的場(chǎng)景中得到應(yīng)用,也促進(jìn)了項(xiàng)目自身的持續(xù)改進(jìn)和完善。

4.2 產(chǎn)學(xué)研融合的創(chuàng)新模式

TileLang的發(fā)展模式體現(xiàn)了產(chǎn)學(xué)研深度融合的先進(jìn)理念。作為北京大學(xué)計(jì)算機(jī)學(xué)院的科研項(xiàng)目,它既保持了學(xué)術(shù)研究的前瞻性和創(chuàng)新性,又緊密對(duì)接產(chǎn)業(yè)界的實(shí)際需求。團(tuán)隊(duì)與阿里、微軟研究院的合作關(guān)系,確保了研究方向與產(chǎn)業(yè)需求的同頻共振。

在2025年9月的華為全聯(lián)接大會(huì)上,TileLang作為鯤鵬昇騰生態(tài)的創(chuàng)新成果亮相,顯示了其與國(guó)產(chǎn)硬件平臺(tái)的深度整合。TileLang已經(jīng)能夠?qū)⒏呒?jí)別的數(shù)據(jù)流描述自動(dòng)轉(zhuǎn)換并優(yōu)化為高效的AscendC代碼(華為昇騰的編程語言),這為國(guó)產(chǎn)AI算力平臺(tái)提供了更友好的開發(fā)體驗(yàn)。

4.3 開發(fā)者培養(yǎng)與社區(qū)賦能

TileLang團(tuán)隊(duì)高度重視開發(fā)者生態(tài)建設(shè),通過多種方式降低學(xué)習(xí)門檻、促進(jìn)知識(shí)共享:

  • 完善文檔與示例:開發(fā)團(tuán)隊(duì)對(duì)項(xiàng)目文檔進(jìn)行了全面升級(jí),提供了從基礎(chǔ)語法到高級(jí)特性的豐富示例代碼,幫助開發(fā)者快速上手。
  • 性能基準(zhǔn)測(cè)試:文檔中新增了性能基準(zhǔn)測(cè)試部分,展示TileLang在不同硬件平臺(tái)上的表現(xiàn),為開發(fā)者評(píng)估和優(yōu)化提供參考。
  • 預(yù)構(gòu)建二進(jìn)制包:項(xiàng)目提供了CUDA加速的預(yù)構(gòu)建二進(jìn)制包,主要針對(duì)Ubuntu 20.04系統(tǒng)和Python 3.10環(huán)境,極大地簡(jiǎn)化了TileLang在支持CUDA的GPU環(huán)境中的部署過程。

5 TileLang對(duì)國(guó)產(chǎn)開源生態(tài)的影響與啟示

5.1 從"可用"到"好用":提升國(guó)產(chǎn)硬件開發(fā)體驗(yàn)

隨著中美科技競(jìng)爭(zhēng)加劇,發(fā)展自主可控的AI算力已成為國(guó)家戰(zhàn)略需求。然而,國(guó)產(chǎn)AI芯片(如華為昇騰、寒武紀(jì)等)不僅需要硬件層面的競(jìng)爭(zhēng)力,更需要完善的軟件生態(tài)支撐。TileLang通過與鯤鵬昇騰生態(tài)的深度整合,為國(guó)產(chǎn)AI芯片提供了"好用"的開發(fā)工具,顯著降低了開發(fā)者的學(xué)習(xí)成本和使用門檻。

在華為全聯(lián)接大會(huì)2025的開發(fā)者日上,TileLang展示了其將高級(jí)數(shù)據(jù)流描述自動(dòng)轉(zhuǎn)換為高效AscendC代碼的能力,這對(duì)于提升國(guó)產(chǎn)AI芯片的開發(fā)者體驗(yàn)具有重要意義。傳統(tǒng)上,為昇騰平臺(tái)開發(fā)高性能算子需要深入掌握AscendC編程,而TileLang允許開發(fā)者使用更高級(jí)的Python-like語法描述計(jì)算,自動(dòng)生成優(yōu)化后的底層代碼,大大提高了開發(fā)效率。

5.2 國(guó)產(chǎn)開源的三階段演進(jìn)模型

TileLang的發(fā)展軌跡印證了國(guó)產(chǎn)開源軟件從"跟隨"到"引領(lǐng)"的演進(jìn)路徑。參考陳哥在技術(shù)博客中提出的觀點(diǎn),國(guó)產(chǎn)化替代對(duì)開源軟件的應(yīng)用分為三個(gè)階段:封裝換皮階段、融會(huì)貫通階段和創(chuàng)新迭代階段。

TileLang已經(jīng)超越了簡(jiǎn)單的"封裝換皮",進(jìn)入了"融會(huì)貫通"并向著"創(chuàng)新迭代"階段邁進(jìn)。它并非對(duì)現(xiàn)有DSL的簡(jiǎn)單包裝,而是基于對(duì)AI算子開發(fā)痛點(diǎn)的深度理解,提出了創(chuàng)新的Tile級(jí)抽象和自動(dòng)調(diào)度機(jī)制。這種基于開源而不困于開源的創(chuàng)新范式,正是國(guó)產(chǎn)開源軟件走向成熟的關(guān)鍵標(biāo)志。

5.3 構(gòu)建自主可控的技術(shù)體系

TileLang的發(fā)展體現(xiàn)了在基礎(chǔ)軟件領(lǐng)域構(gòu)建自主可控技術(shù)體系的重要性。正如華為任正非所言:"不要重復(fù)發(fā)明輪子,要站在巨人的肩膀上創(chuàng)新。"TileLang沒有完全從頭開始設(shè)計(jì)編程語言,而是選擇Python作為宿主語言,借鑒了現(xiàn)代DSL設(shè)計(jì)的優(yōu)秀理念,同時(shí)針對(duì)AI算子開發(fā)的特定場(chǎng)景進(jìn)行了創(chuàng)新性探索。

這種策略平衡了技術(shù)自主性與發(fā)展效率之間的關(guān)系——既避免了完全從零開始的高成本,又確保了核心技術(shù)的可控性和創(chuàng)新性。在AI編譯器這一關(guān)鍵基礎(chǔ)軟件領(lǐng)域,這種發(fā)展模式具有重要的參考價(jià)值。

5.4 開源生態(tài)與商業(yè)化共贏

TileLang堅(jiān)持開源開放的技術(shù)路線,通過社區(qū)協(xié)作推動(dòng)項(xiàng)目發(fā)展。這種模式有利于形成廣泛的技術(shù)共識(shí)和生態(tài)支持,避免重復(fù)造輪子,集中有限資源攻克關(guān)鍵技術(shù)難點(diǎn)。正如禪道項(xiàng)目管理軟件所展示的,開源、開放與共享不僅能夠加速技術(shù)迭代效率、降低技術(shù)準(zhǔn)入門檻,其透明性特征更有助于建立可信的技術(shù)體系。

對(duì)于TileLang這類基礎(chǔ)軟件而言,開源不僅是開發(fā)模式,更是技術(shù)推廣和生態(tài)建設(shè)的有效途徑。通過吸引學(xué)術(shù)界和工業(yè)界的開發(fā)者共同參與,TileLang有望更快地成熟完善,形成良性循環(huán)的開源生態(tài)。

6 總結(jié)與展望

TileLang作為一款新興的AI算子編程語言,憑借其創(chuàng)新的Tile級(jí)抽象、多層級(jí)編程范式和強(qiáng)大的自動(dòng)調(diào)度能力,為AI算子開發(fā)提供了兼具高生產(chǎn)力和高性能的解決方案。它的出現(xiàn)恰逢其時(shí),既滿足了日益復(fù)雜的AI模型對(duì)高效算子的需求,又為國(guó)產(chǎn)AI芯片的軟件生態(tài)建設(shè)提供了有力支撐。

從技術(shù)層面看,TileLang的核心優(yōu)勢(shì)在于將調(diào)度優(yōu)化與計(jì)算描述分離,使開發(fā)者能專注于數(shù)據(jù)流本身,而將性能優(yōu)化交由編譯器處理。這種設(shè)計(jì)哲學(xué)使得TileLang在保持代碼簡(jiǎn)潔性的同時(shí),不犧牲性能競(jìng)爭(zhēng)力,實(shí)現(xiàn)了開發(fā)效率與運(yùn)行效率的較好平衡。

從生態(tài)影響看,TileLang代表了國(guó)產(chǎn)基礎(chǔ)軟件從"使用開源"到貢獻(xiàn)開源再到引領(lǐng)開源"的發(fā)展路徑。它立足于對(duì)AI算子開發(fā)痛點(diǎn)的深度洞察,提出了創(chuàng)新性的解決方案,并與國(guó)產(chǎn)硬件平臺(tái)深度整合,為構(gòu)建自主可控的AI技術(shù)生態(tài)提供了重要支撐。

展望未來,TileLang仍面臨一系列挑戰(zhàn)與機(jī)遇。在技術(shù)層面,需要持續(xù)擴(kuò)展對(duì)更多硬件后端的支持,優(yōu)化自動(dòng)調(diào)度算法的效果,增強(qiáng)語言的表達(dá)能力和調(diào)試體驗(yàn)。在生態(tài)層面,需要吸引更多開發(fā)者參與貢獻(xiàn),拓展工業(yè)應(yīng)用場(chǎng)景,建立可持續(xù)發(fā)展的開源社區(qū)模式。

TileLang的發(fā)展歷程啟示我們,在基礎(chǔ)軟件領(lǐng)域,國(guó)產(chǎn)化替代并非簡(jiǎn)單的"封裝換皮",而是需要深度理解和消化開源技術(shù),結(jié)合具體應(yīng)用場(chǎng)景進(jìn)行創(chuàng)新迭代,最終形成具有自主核心競(jìng)爭(zhēng)力的技術(shù)體系。只有這樣,才能在"黑土地"上種出自己的莊稼,構(gòu)建健康繁榮的技術(shù)生態(tài)。

隨著AI技術(shù)的不斷演進(jìn),對(duì)高效算子的需求將愈發(fā)迫切。TileLang這類創(chuàng)新性開發(fā)工具的價(jià)值將進(jìn)一步凸顯,有望成為AI開發(fā)棧中不可或缺的一環(huán),為AI技術(shù)的普及和深化提供底層支撐。

TileLang 開源倉(cāng)庫(kù):https://github.com/tile-ai/tilelang

責(zé)任編輯:武曉燕 來源: 機(jī)智流
相關(guān)推薦

2025-09-30 09:05:06

2025-07-08 09:05:00

2021-11-09 23:15:20

編程語言本質(zhì)

2020-08-02 19:55:46

Python編程語言技術(shù)

2024-09-02 14:37:50

2012-05-16 13:11:28

編程語言開發(fā)語言Java

2022-09-09 09:33:14

支付寶代碼性能

2022-08-17 17:57:37

GoGo語言

2015-04-14 11:50:10

Info倉(cāng)庫(kù)管理

2012-09-11 11:08:23

Github系統(tǒng)

2021-09-03 08:21:20

前端代碼模塊

2021-11-22 11:30:37

JavaScript代碼瀏覽器

2023-08-30 10:20:34

編程語言Python

2021-06-22 10:16:39

Java工具庫(kù)代碼

2011-04-21 10:47:29

Webjavascript

2022-08-26 09:51:49

索引簽名編程語言

2022-06-23 09:00:00

JavaScriptHTML應(yīng)用程序

2021-02-23 10:19:46

編程技能開發(fā)

2025-09-29 23:26:35

DeepSeekDSAAPI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)