Революцията на течното охлаждане на Nvidia за AI сървър
Консумацията на енергия от авангардни AI чипове непрекъснато се увеличава, което се превърна в катализатор за следващото поколение DGX AI сървъри за преминаване към течно охлаждане. Текущият TDP (топлинна проектна мощност) на водещия графичен процесор H100 на Nvidia е 700 W, което е надхвърлило границата на традиционното въздушно охлаждане. Очаква се Nvidia да пусне Blackwell architecture B100 GPU с TDP от приблизително 1000W по-късно тази година и течното охлаждане определено ще е необходимо по това време.

За високопроизводителни изчислителни системи течното охлаждане има няколко ключови предимства пред въздушното:
Отличната ефективност на топлопредаване позволява на компонентите с по-висок TDP да бъдат напълно охладени
Поради намаленото търсене на високоскоростни вентилатори, работата е по-тиха
Дизайнът на системата е по-плътен, а обемистите радиатори и вентилатори заемат по-малко място
Потенциал за улавяне и повторно използване на отпадна топлина в топлообменници течност-течност

Използвайки течно охлаждане, Nvidia може да продължи да надхвърля ограниченията на производителността на AI ускорителите, без да бъде ограничена от охладителната система. Тъй като сложността на обучителното натоварване с изкуствен интелект продължава да се увеличава и съответното потребление на хардуерна енергия се увеличава, това е от решаващо значение. DGX AI сървърът на Nvidia пакетира множество графични процесори в оптимизирана система за работни натоварвания на AI, която бързо беше приета от големи предприятия. Големите доставчици на облачни услуги като Google Cloud, Meta и Microsoft са разположили DGX системи в своите центрове за данни. През последните години, тъй като все повече и повече организации се стремят да използват трансформиращата сила на изкуствения интелект, приемането на системите за изкуствен интелект Nvidia DGX нарасна експоненциално.

Системата Nvidia DGX може да използва усъвършенствани конструкции за охлаждане с потапяне, които използват диелектрични течности. Директното охлаждане на чипове изпомпва диелектрични течности директно върху GPU чипове и други термични компоненти, без необходимост от студени плочи, постигайки по-директен пренос на топлина. Той може да поддържа много високи нива на TDP (500W+) на един чип, постигайки по-плътни системи.

Тъй като изкуственият интелект продължава да се развива с удивителна скорост, поддържаната хардуерна инфраструктура трябва да се развива синхронно. Течното охлаждане е ключова позволяваща технология, която ще позволи на ускорителите да достигнат безпрецедентни нива на производителност. Тази трансформация не е без предизвикателства. Тъй като центровете за данни изискват трансформация на инфраструктурата за течно охлаждане и разработването на нови програми за поддръжка, ползите от енергийната ефективност, плътността и производителността са значителни и не могат да бъдат пренебрегнати.






