<progress id="xfvzp"><form id="xfvzp"></form></progress>

    <p id="xfvzp"></p>

    
    

    <span id="xfvzp"></span>
    <output id="xfvzp"></output>

    公司動態

    原標題:
    英特爾AI芯片Gaudi 3登場,狠挖英偉達墻腳

    轉載:
    https://www.163.com/dy/article/IVFVAFQM05118O92.html

    英偉達如今在 AI 芯片市場的地位無可爭議,直線上漲的數據中心收入和市值就是最好的佐證。但王權沒有永恒,英偉達并非不可撼動。

    在英偉達發布最新一代 BlackWell GPU 的三周后,4 月 9 日晚,英特爾在 Vision 2024 大會上發布了一系列關于芯片的大消息。

    會上,英特爾發布了面向數據中心的第六代至強處理器,也提前展示了面向下一代 AI PC 的 Lunar Lake 處理器。不過縱觀整場大會,英特爾花費最多篇幅也最重視的,可能還是最新一代的 AI 芯片:

    英特爾 Gaudi 3。

    超越英偉達 H100:Gaudi 3 性能更強、成本更低

    Gaudi 3 最直接的升級體現在性能和成本方面。

    相比英偉達 H100,Gaudi 3 的人工智能推理性能平均提高 50%,能效平均提高 40%;鶞蕼y試中,Gaudi 3 可以在 Llama2-7B、Llama2-13B 模型中將訓練時間縮短到英偉達 H100 的一半,同時推理吞吐量也比后者平均高出了 50%。

    可以說,Gaudi 3 至少在 Llama2 等關鍵大模型中擊敗了基于英偉達 Hopper 架構的 H100 GPU,這也是目前市售產品中技術最先進的 AI 芯片。

    而 Gaudi 3 還有另一個極其重要的升級——比 H100 低得多的成本,按照英特爾的原話是:

    (Gaudi 3 的)成本僅為英偉達 H100 的一小部分。
    也怪不得 Gaudi 3 剛剛發布,英特爾就宣布 Naver(韓國互聯網巨頭)、博世、IBM、Ola 等一大批公司成為英特爾 Gaudi 加速器的客戶和合作伙伴。而最早在今年第二季度,英特爾就將向戴爾、惠普以及超微等 OEM 廠商率先供貨,第三季度正式上市。

    耐人尋味的是,英特爾往年在 Vision 大會上基本不會發布新的芯片,今年卻一反常態發布了六代至強處理器和 Gaudi 3 AI 芯片兩款重磅產品。

    考慮到英特爾 CEO 帕特·基辛格(Pat Gesinger)去年底就炮轟過英偉達的 CUDA 生態「既淺又窄」,似乎除了軟件生態上的對抗,英特爾也在加快硬件上的追趕。

    不過,Gaudi 3 真的有機會挑戰英偉達的 GPU 霸權嗎?

    要知道,相比英偉達兩年前基于 Hopper GPU 架構的 H100,上個月基于 BlackWell GPU 架構發布的 B100 又進行了一輪大幅的升級,包括馬斯克也不禁感慨,「目前沒有什么比英偉達 GPU 更好的 AI 芯片了!

    Gaudi 3 硬件追上英偉達了嗎?

    不同于 BlackWell 采用了最新的臺積電 3nm 工藝,Gaudi 3 基于臺積電 5nm 工藝打造,同時張量核心從 24 個升級到了 32 個。

    相比上一代的 Gaudi 2,Gaudi 3 在 FP8 性能、BF16 性能、網絡帶寬、內存帶寬都得到了全面的提升,其中 FP8 吞吐量更是高達 1835 TFLOPS:

    基本翻了一番。

    比較奇怪的是,搭載 128GB 內存的 Gaudi 3 沒有采用最新的 HBM3(高帶寬內存),而是采用了稍微有點過時的 HBM2e。

    除了更低的傳輸帶寬,HBM2e 的單顆容量也只有 16GB,相比之下 HBM3 的傳輸帶寬得到了大幅提升,單顆容量也能達到 24GB,甚至是 32GB。

    此外,Gaudi 3 采用了英偉達 BlackWell 類似的雙芯片設計,同時封裝了兩個相同的芯片,并通過高帶寬鏈路進行連接。每個 Gaudi 3 芯片都具有 48MB 板載 SRAM,整個芯片提供 96MB SRAM,總帶寬為 12.8TB/秒。

    I/O 方面,英特爾并沒有放棄以太網路線,在 Gaudi 3 上將以太網端口的速率從 100GB/s 升級到了 200GB/s,再考慮到雙芯片的設計和每個芯片 24 個以太網端口,每一張 Gaudi 3 的以太網 I/O 總帶寬高達 8.4TB/s。

    總的來說,英特爾在 Gaudi 3 的升級上并不激進,甚至可以說有些保守,包括成本要低得多的 5nm 工藝和 HBM2e 內存,都說明了這一點。雖然相比上一代 Gaudi 2 已經有了明顯的進步,在部分大模型上超越 H100,但顯然很難與英偉達最新的 B100 相抗衡。

    但英特爾的決策未必錯了。

    一方面,考慮到英偉達在 AI 加速計算方面的技術和生態領先優勢,英特爾就算不惜一切代價進行追趕,很可能也難以追平,同時高昂的芯片成本,還會導致英特爾直接錯失正在快速增長的 AI 芯片市場。

    另一方面,在成本優勢明顯的前提下,英特爾只要能做到超越英偉達 H100 的表現,自然能夠吸引足夠的客戶進行采購。

    更何況就連英偉達自己也預計,「下一代產品(B100)將出現供應緊張」。面對「想買不能買」的窘境,很多客戶自然而然也會轉向其他可替代的 AI 芯片。

    這其中,就有屬于 Gaudi 3 的機會。

    硬件、軟件生態齊頭并進,英特爾能否扛起大旗?

    「整個行業都希望能干掉 CUDA,包括 Google、OpenAI 等公司都在想方設法讓人工智能訓練更加開放。我們認為 CUDA 的護城河既淺又窄!够粮裾f。

    在前不久雷科技的報道中,我們就解析了全球科技巨頭組建 UXL 統一加速基金會對抗英偉達 CUDA 的動作。

    簡單來說,巨頭們基于英特爾 oneAPI 技術,正在開發一套開源軟件平臺來替代英偉達 CUDA 平臺,允許人工智能開發者在任何 AI 芯片上運行他們的代碼,也包括英偉達 GPU,核心是解除芯片硬件與軟件開發平臺之間的強綁定關系,打破英偉達 GPU 在開發生態上的霸權。

    正如高通人工智能和機器學習主管 Vinesh Sukumar 所言:「我們實際上是在向開發者展示如何從英偉達平臺遷移出來!

    軟件的推倒、硬件的追趕,英特爾顯然明白英偉達的成功既來源于軟件,也來源于硬件,只有齊頭并進才能真正追趕上英偉達的腳步,甚至干掉 CUDA,干掉英偉達的護城河。

    但英特爾能不能扛起「打倒英偉達」的大旗,奪回數據中心市場的領先地位?關鍵可能取決于兩點:

    一是英特爾能不能在一眾英偉達挑戰者中脫穎而出,包括 AMD 以及一眾全球 AI 芯片公司都不會錯過英偉達 GPU「供不應求」的機會;

    二是按照英特爾的路線圖,在合并 GPU 和 AI 芯片兩條產品線之后,代號「Falcon Shores」的下一代 GPU,能不能展現出超越英偉達最新一代 GPU 的潛力。

    過去一年多,AI 掀起了一場不言而喻的革命,但不管 AI 將如何改變我們的生活,芯片算力依然是底層的驅動力。

    但英偉達生生占據了 AI 芯片市場的 80%,這顯然并不尋常,不過人們最不滿的關鍵其實還是:英偉達無法滿足所有人。在這個前提下,不管是英特爾、AMD 還是國產 AI 芯片廠商,其實都還有機會。

    換言之,英特爾 Gaudi 3 面對的還是一塊「廣闊天地」,自然「大有可為」。

     文章來源于網絡,如有侵權,請聯系凱熙電子evapa_cn#126.com刪除!(請將#換成@)

     

    銷售一 銷售一
    銷售二 銷售二
    銷售三 銷售三
    銷售四 銷售四
    技術一 技術一
    技術二 技術二
     025-84682050
    南京凱熙電子科技有限公司
    免费黄色一级片,**一级毛片,一级毛片电影院全集,私人毛片

    <progress id="xfvzp"><form id="xfvzp"></form></progress>

      <p id="xfvzp"></p>

      
      

      <span id="xfvzp"></span>
      <output id="xfvzp"></output>