AI伺服器燒燙燙!散熱模組產業有望趁勢雞犬升天?

散熱模組

前言

隨著2024 Computex的落幕,「AI串聯,共創未來」的展會主題成功把AI時代推向新高度,像是Nvidia推出的資料中心GB200 NVL72就扮演著會場中最閃耀的星。其不管是效能還是工藝技術接令人驚嘆。受惠於AI的蓬勃發展,AI訓練中心,也就是包含推論伺服器和訓練伺服器的需求都將激增不止。根據資策會產業情報研究所(MIC)調查,2023年AI伺服器產值已達全球伺服器過半的總產值,而臺灣伺服器產業出貨原本即占全球伺服器出貨八成以上,其中AI伺服器的生產組裝代工更已占全球九成,可見台灣在AI伺服器中扮演舉足輕重的角色。MIC預估,2024年全球AI伺服器出貨量為194.2萬台,且將一路成長至2027年320.6萬台,2022-2027年間年複合成長率(CAGR)為24.7%。

全球AI伺服器出貨預測(資料來源:MIC、TrendForce、TEJ整理)

但更高速的運算意味著會產生更多熱能,因此需要散熱模組去協助熱能排放,避免晶片過熱導致效能不穩定甚至影響其壽命。本文將帶領讀者一起認識散熱模組業的發展。

延伸閱讀:庫存去化東風起?!高速傳輸IC設計產業走過庫存高峰醞釀嶄新商機?

認識散熱模組

「散熱模組」顧名思義就是要幫助機器散熱的模組,由許多散熱元件所組成,依照其不同的解決方案會使用各自不同的元件。在PC時代散熱就十分重要,他能確保機器維持穩定進而發揮其最佳功效。在邁入AI的大時代,伺服器的功耗越來越高,意味著需要更多不同的散熱模組解決方案才能完成其目標。以下將介紹3大散熱模組的解決方案:

  1. 氣冷式方案 (Air Cooling)

主要由導熱墊片(Thermal Interface Material;TIM)、均溫板(Vapor Chamber;VC)或熱導管先將熱導出,再由散熱鰭片(Heat Sink)和風扇與空氣對流進行散熱。目前氣冷領域最先進的技術是3D VC,即原本傳統熱板的變化形態,將熱板結合熱管成為一個立體的圓柱體,內部不論是氣體、還是液體都可自由移動,來做為熱傳導。氣冷式方案的優點是成本低廉,但是其常需搭配冷氣及風扇自主轉動都十分耗電。

  1. 水冷式方案 (Liquid Cooling)

又稱液冷式直接液冷(Direct Liquid Cooling; DLC)、直達晶片液冷(Direct-to-Chip; D2C)等等。其散熱原理跟氣冷相似,只是把介質從空氣換成水冷液。搭配水冷板(Cold Plate)、冷卻水分配裝置(CDU)、冷卻水歧管(CDM)及冷卻器和風扇背門或是背門式熱交換器(Rear Door Heat Exchanger,RDHx)來達成水冷液降溫。目前雖建置成本較高,但隨著GB200 NVL72的採用,加上其較氣冷省電更容易符合法規,慢慢成為散熱顯學。值得注意的是,水冷比氣冷的風扇來的更多,以確保散熱效果。

水冷式又能分為「液對氣」及「液對液」:

  • 液對氣(Liquid to air):將熱交換器安裝在伺服器的機櫃內,把熱能排放到空氣中,使液冷式伺服器能直接部署在氣冷式的資料中心使用。
  • 液對液(Liquid to Liquid):將水冷液傳送到伺服器機房的液體冷卻管線,透過固定設施的冷卻管路與散熱機制統一排熱。解熱能力比液對氣方案更勝一籌,但必須在機房設計時就要預留液體冷卻管線,因此無法透過氣冷的機房改建
  1. 浸沒式冷卻方案 (Immersion Cooling)

亦即將電子元件整個浸泡在不導電的液體中,像是幫伺服器洗泡泡浴。原理是讓熱源直接接觸到冷卻液或礦物油,能更快速地降溫,提升資料中心的能源效率。可分為單相式與雙相式兩種:

  • 單相式:把吸熱過的冷卻液抽出,直接透過熱交換器排熱
  • 雙相式:透過氣體蒸發與凝結的自然循環來做散熱

在同樣的標準下,浸沒式的耗電量是三者之中最低,但其目前在技術上仍有諸多挑戰,比方浸泡的冷卻液跟各零件的化學反應需要3~5年長期檢測,且未來每一世代材質可能推陳出新,伺服器業者必須跟時間賽跑,不斷測試新材質的兼容性。

各散熱方式的適用功率範圍(資料來源:TEJ整理)
想看更多內容?快來【登入會員】,享受更多閱讀文章的權限喔!
返回總覽頁
Processing...