前段期間,AMD在舊金山舒適發布了一系列全新的居品凱發·k8國際app官網,包括新一代的AI PC處理器、EPYC處理器、GPU加速卡等多款重磅居品。算作為數未幾的友商,AMD對這一波新品托福厚望,發布會還挑升邀請了OpenAI、微軟等巨頭的大佬來站臺,關聯詞市集對其居品卻不看好,其股價也應聲下落。難談AMD挑戰英偉達的瞎想,還沒初始就限制了?
AMD為何追不上英偉達?
AMD算作刻下惟逐一個有才氣在GPU加速卡規模向英偉達發起挑戰的廠商,其實很難說他們是失敗者,畢竟除英偉達以外,其余廠商加起來亦然不如AMD能打的。從AMD這次發布的一系列新品來看,其正在加速追逐英偉達的次第,以最新的InstinctMI325X為例,其推感性能以至比英偉達剛發貨的H200還高20%以上。
不外強盛的推感性能是靠寬綽于H200的顯存所換來的,MI325X領有多達256GB的HBM3E內存,這是刻下各人性能最強的內存,連帶著內存帶寬也從5.3TB/s升級到6TB/s,成為AMD進一步拉升MI325X推感性能的一環。

圖源:AMD
而在AI運算性能上,MI325X并莫得比MI300X提高些許,FP16精度下算力為1.3PFlops,算作對比,英偉達H200的FP16算力為1.979PFlops,差距仍然十分赫然,更何況英偉達還提供具有相通算力性能的H100。
固然在算力上有著赫然的差距,但是MI325X的功耗卻并不低,憑據AMD袒露的音塵,其單顆中樞的功耗高達1000W,與英偉達H200基本抓平。在往常的一年里,大多數企業皆將資源參加到了AI模子的考試中,因此需要多數的算力資源相沿,在部署空間有限的情況下,英偉達的H100赫然是最佳的遴薦。
更何況H100是英偉達在2022年3月份發布的GPU加速卡,從中也不丟臉出在芯片算力層面,英偉達與AMD的技藝差距仍然十分赫然。況兼,英偉達在前段期間發布了H100的繼任者B200,算力和推理才氣皆得到了顯赫的提高,其中FP16精度下的運算性能徑直飆升到5PFlops,是H100的2.5倍,是MI325X的3.8倍。

圖源:英偉達
3.8倍的算力差距依然不是價錢或者功耗不錯彌補的差距了,即使你不錯通過部署4臺MI325X就業器來取得比好意思1臺B200就業器的算力,但是也會面對更多的保養、調試和Debug周折。更何況,在多數情況下,瞎想中心的里面空間皆是有限的,如安在有限的空間里塞入更多的算力,時常是企業磋商得更多的問題。
是以,AMD在往常的半年期間里,即使發布了更具性價比的MI300X,也依然無法撼動英偉達的地位,以至不需要去商議生態等問題,只是一個算力限制和效果差距就依然讓AMD難以抗擊。
不外AMD的AI業務照舊得到了不少的訂單,原因主如果英偉達的產能無法得志系數需求,外溢的訂單轉而被AMD攝取,此外如等企業,也在通過采購AMD GPU的花式來裁減對英偉達的依賴。
只是情況如你所見,微軟、OpenAI、谷歌等企業最新最大的AI算力集群,仍然皆是將英偉達的H200列為首選。而AMD的MI300X等GPU,則主要被部署到其他數據中心,算作云霄算力支抓進行儲備。
如果企業們仍然以AI算力為基準去樹立數據中心,那么AMD想要降服英偉達,只可禱告遺跡發生,讓他們打造出一款算力效果越過B200的芯片。不外,事情并非莫得更動,跟著AI大模子的考試限制達到一定高度,企業也慢慢將眼光投向了誆騙層面,而這即是AMD的契機了。
在AI落地端發力,AMD能否換談超車?
無論是微軟照舊OpenAI,系數的AI廠商其實皆在念念考一個問題:AI就業擴充,或者說:奈何讓AI就業被更多的東談主使用?
想要解決這個問題,來源需要處置AI本錢,以OpenAI為例,其在2024年預測將靠近50億好意思元的賠本,其中除了新建數據中心所需要參加的資金外,其余大多是保養和運營現存算力中心的本錢,而ChatGPT高達19.99好意思元/月的高檔訂閱會員,依然讓多數用戶“搖頭”,不少東談主皆但愿OpenAI不錯裁減資費,那么就能夠取得更多的客戶。
真話說,關于OpenAI而言,19.99好意思元的價錢其實并不行確保其盈利,如果用戶將其用于考試我方的大模子或是其他用途,那么試驗上的算力本錢會大大超出OpenAI向你收取的訂閱用度,這亦然為何前段期間他們一霎初始加鼎力度封禁部分違紀使用的賬戶,恰是因為本錢的激增正在進一步裁減OpenAI的利潤。
固然好多時候咱們皆將GPU加速卡的AI算力看作是一個舉座,但是在試驗的誆騙中,用于預考試的算力性能與用于推理的算力性能,其實并不行徑直等同。其中,推感性能主要決定的是在已加載的AI模子下,GPU能夠提供的運算性能,在功耗固定的情況下,推理算力越強,GPU在踐諾AI任務時的本錢就越低。
換言之,如果企業想裁減AI就業的本錢,讓AI不錯被誆騙到更平凡的規模,那么推理效果高的GPU即是必選項。那么AMD MI325X的定位就很赫然了:為企業提供更低本錢的AI算力,相沿AI誆騙落地。
真話說這個賽談英偉達不是莫得防范到,本年才初始委用的H200即是為了解決推理本錢發布的居品,其中樞固然仍是H100,但是卻領有141GB顯存(H100為80GB),同期也對顯存帶寬進行了升級,進一步強化推感性能。

圖源:英偉達
但是這還不夠,跟著AI誆騙的限制擴大,AI就業對算力的需求也在呈現爆發式的增長,而H200的供應卻難以得志需求,這時候MI325X的上風就體現出來了,不僅領有高達256GB的顯存,況兼價錢比H200更低,供應也比H200富足。
是以,你不錯看到微軟、OpenAI等企業為AMD站臺,不單是是為了裁減英偉達對他們的掌控力,相通亦然為了不錯提前買到更多的MI325X,并將其算作普及AI就業的重要。
至少,在英偉達的B200批量出貨前,MI325X皆會是數據中心的優選,至于B200發布后奈何搪塞,也就只可見招拆招了。畢竟從刻下的情況來看,AMD不大可能在2025年前誕生出性能接近B200的GPU,此前國外媒體推論,最將近到2026年,AMD才可能領有接近B200性能的GPU,屆時英偉達的B200乃至GB200(2*B200構成的單個GPU)皆依然批量發貨,AMD也將靠近與本年紀首雷同的難過場景。
只可說AMD照舊有契機的,即使無法撼動英偉達的最初地位,也不錯搶下不少的市集份額。AI依然初始全面融入咱們的生涯,無論你承不承認,好多規模皆依然與AI產生了關系,跟著AI的進一步普及,也將更多地參與到民生經濟中,為了保管AI社會的運轉將需要浩瀚的算力,遠非刻下的數據中心不錯得志的。
是以,AMD還有期間,而英偉達也需要對我方的這個競爭敵手參加更多的關懷,畢竟AMD與英特爾的市集爭奪戰即是一個很好的前車之鑒,英偉達稍有懈怠冒昧就會被AMD格外也說不定。