< 返回新聞公共列表

算力租賃行業(yè)的需求從何而來？

發(fā)布時(shí)間：2024-08-23 15:40:32

近年來，人工智能領(lǐng)域的迅猛發(fā)展引發(fā)了全球范圍內(nèi)的巨大關(guān)注。尤其是在2023年，以ChatGPT為代表的大型語言模型應(yīng)用展現(xiàn)出非凡的潛力，推動了人工智能技術(shù)的商業(yè)化進(jìn)程。隨著越來越多的大模型創(chuàng)業(yè)公司涌現(xiàn)，全球?qū)Υ竽Ｐ涂蒲械臒崆槌掷m(xù)高漲。

這一趨勢不僅加速了大模型的研究與開發(fā)，也引發(fā)了對AI算力需求的井噴式增長。在這一背景下，算力租賃業(yè)務(wù)作為一種新興行業(yè)，迅速崛起，成為滿足AI模型開發(fā)和推理需求的關(guān)鍵解決方案。

1. 算力需求井噴

自ChatGPT等大型語言模型震撼世界以來，人工智能的商業(yè)化落地預(yù)期不斷升高，全球范圍內(nèi)涌現(xiàn)了大批大模型創(chuàng)業(yè)公司。隨著大模型的訓(xùn)練、微調(diào)、推理需求急劇增加，AI算力需求迎來了前所未有的井噴式增長。AI應(yīng)用在不同開發(fā)階段對算力的需求也各不相同。在開發(fā)周期中，大量的訓(xùn)練側(cè)算力是必需的；而當(dāng)模型開發(fā)完成并上線后，推理算力則成為主要需求。目前，AI應(yīng)用開發(fā)如火如荼，訓(xùn)練模型所需的算力需求尤為迫切；而在不久的將來，隨著AI應(yīng)用的大規(guī)模落地，推理側(cè)算力的需求將更加旺盛。

以訓(xùn)練算力為例，根據(jù)英偉達(dá)與斯坦福大學(xué)合作的研究，GPT-3模型假設(shè)使用1024張A100顯卡（約600P）進(jìn)行訓(xùn)練，端到端訓(xùn)練時(shí)間大約為34天。然而，隨著模型參數(shù)量的增加，所需的GPU數(shù)量呈非線性增長。以GPT-3到GPT-4的迭代為例，參數(shù)規(guī)模增大10倍，對應(yīng)的訓(xùn)練計(jì)算量增加至少60倍。根據(jù)SemiAnalysis的報(bào)道，GPT-4的參數(shù)量達(dá)到了1.8萬億，并使用了更大的訓(xùn)練集，訓(xùn)練過程中所需的A100顯卡數(shù)量達(dá)到萬張量級。

2. 云計(jì)算廠商為何無法完全承接需求？

盡管AI算力需求異常旺盛，傳統(tǒng)云計(jì)算廠商卻未能完全承接這些需求。這主要源于模型訓(xùn)練時(shí)需要大量GPU同時(shí)對同一模型進(jìn)行計(jì)算，不僅要求峰值運(yùn)算能力，還要求GPU之間的高效連接。傳統(tǒng)的GPU集群在單個(gè)服務(wù)器節(jié)點(diǎn)內(nèi)可以使用大帶寬連接，但在服務(wù)器之間仍然采用傳統(tǒng)架構(gòu)，無法進(jìn)行高效的多節(jié)點(diǎn)并行訓(xùn)練。對于大多數(shù)業(yè)務(wù)級大模型來說，單節(jié)點(diǎn)（最多8GPU）無法滿足訓(xùn)練需求。而高性能集群則通過在節(jié)點(diǎn)間大量使用高帶寬光模塊進(jìn)行互聯(lián)，大幅提升了多節(jié)點(diǎn)訓(xùn)練時(shí)的GPU利用率。

傳統(tǒng)云計(jì)算廠商提供的服務(wù)主要關(guān)注單節(jié)點(diǎn)的可用性與可靠性，但缺乏節(jié)點(diǎn)間超高帶寬互聯(lián)的基礎(chǔ)設(shè)施，因此無法滿足大模型訓(xùn)練客戶的需求。要滿足客戶的訓(xùn)練需求，必須規(guī)劃建設(shè)新的集群，而現(xiàn)有基礎(chǔ)設(shè)施無法重復(fù)利用。此外，高性能集群主要適用于模型訓(xùn)練，用于普通互聯(lián)網(wǎng)業(yè)務(wù)則成本過高，因此在高性能集群業(yè)務(wù)方面，云計(jì)算廠商并無優(yōu)勢。因此，當(dāng)算力需求爆發(fā)時(shí)，云計(jì)算廠商無法完全承接，給了其他算力租賃公司介入的機(jī)會。

3. 為何不自建算力中心？

雖然在服務(wù)器采購成本與租金成本之間進(jìn)行比較時(shí)，算力租賃似乎不具備明顯優(yōu)勢，但考慮到算力的彈性需求、硬件采購、調(diào)試、維護(hù)成本以及工程師研發(fā)時(shí)間成本，自建算力中心的模式對大多數(shù)大模型研發(fā)廠商而言并不適合。除了一些算力資源復(fù)用率較高的互聯(lián)網(wǎng)大廠外，算力租賃已成為大多數(shù)大模型研發(fā)廠商的最佳選擇。

除了大模型廠商外，還有許多有訓(xùn)練和推理需求的客戶，他們更加需要算力租賃供應(yīng)方的存在。尤其在推理側(cè)，需求更為旺盛。例如，GPT-3大約需要1024張A100訓(xùn)練34天，而據(jù)相關(guān)機(jī)構(gòu)的測算，ChatGPT的推理大約需要7000張A100算力卡持續(xù)運(yùn)行來支持。

4. 算力租賃業(yè)務(wù)的增速與規(guī)模

正是在這種需求背景下，算力租賃業(yè)務(wù)應(yīng)運(yùn)而生，并迅速發(fā)展成為一個(gè)兼具確定性與成長性的新興行業(yè)。根據(jù)部分機(jī)構(gòu)數(shù)據(jù)顯示，受AI影響，從2022年到2026年，中國區(qū)人工智能算力規(guī)模的年復(fù)合增長率預(yù)計(jì)將達(dá)到52.3%。這不僅展示了算力租賃業(yè)務(wù)的潛力，也預(yù)示著未來將有更多企業(yè)涌入這一市場，推動整個(gè)行業(yè)進(jìn)一步發(fā)展。

注：國內(nèi)人工智能行業(yè)應(yīng)用滲透度及提升百分點(diǎn)（來源：東方證券）

在人工智能技術(shù)飛速發(fā)展的時(shí)代，算力需求的井噴式增長為算力租賃行業(yè)帶來了巨大的機(jī)遇。傳統(tǒng)云計(jì)算廠商難以滿足大模型研發(fā)和推理的需求，使得高性能集群和算力租賃成為了新的解決方案。未來，隨著AI應(yīng)用的廣泛落地和推理需求的激增，算力租賃業(yè)務(wù)將繼續(xù)保持強(qiáng)勁的增長勢頭，并在全球范圍內(nèi)扮演越來越重要的角色。