Cabaran Penyejukan Pelayan AI: Pertempuran Antara Suhu dan Prestasi
Pelayan AI, dengan keupayaan pengkomputeran selari yang tinggi dan nod pengkomputeran yang padat, menjana haba yang ketara dalam ruang terkurung. Ini mengakibatkan penggunaan kuasa yang tinggi. Di bawah beban berat, haba yang dihasilkan oleh pelayan bergelut untuk hilang dengan berkesan, membawa kepada penurunan prestasi perkakasan atau kerosakan perkakasan. Oleh itu, penyejukan yang cekap adalah salah satu cabaran utama yang dihadapi oleh pelayan AI.
Penyelesaian Penyejukan Tradisional: Cabaran dengan Cip AI Berkuasa Tinggi
Pelayan tradisionalpenyelesaian penyejukanadalah serupa dengan yang digunakan dalam pengkomputeran umum, dengan tumpuan utama untuk menyejukkan cip yang menggunakan kuasa tinggi. Biasanya, haba dipindahkan dari cip melalui paip haba dan penyebar haba ke sink haba berbilang sirip, dan kemudian secara aktif dihamburkan oleh kipas.
Walau bagaimanapun, penyelesaian penyejukan udara ini telah terbukti tidak mencukupi untuk pelayan AI moden. Sebabnya terletak pada fakta bahawa penggunaan kuasa cip AI berprestasi tinggi meningkat dengan ketara dengan kuasa pengkomputeran.
Apakah Had PenyejukanPenyejukan Udara?
Laporan penyelidikan mencadangkan bahawa had penyejukan bagipenyejukan udaraadalah sekitar 250W dalam ruang pelayan 2U, dengan keupayaan penyejukan antara 400W hingga 600W dalam ruang 4U.
Untuk konteks, "U" ialah ukuran piawai yang ditakrifkan oleh Electronic Industries Alliance (EIA). Satu "U" bersamaan dengan ketinggian 4.445 cm (1.75 inci), dengan rak pelayan standard biasanya berukuran 42U tinggi. Walau bagaimanapun, jumlah bilangan pelayan 1U yang boleh disimpan oleh rak biasanya dihadkan oleh kekangan penyejukan.
Contohnya, apabila menggunakan cip NVIDIA H100, rak 4U diperlukan apabila menggunakan modul penyejukan udara.
Penyelesaian Penyejukan: Penyejukan Cecair dan Penyejukan Rendaman
Untuk menangani cabaran penyejukan ini, penyejukan cecair dan penyejukan rendaman telah muncul sebagai dua penyelesaian utama, terutamanya dalam persekitaran berketumpatan tinggi di mana kuasa setiap rak melebihi 30 kW. Pada ketika ini, isu tempat liputan menjadi lebih menonjol, memerlukan strategi penyejukan lanjutan, seperti penyejukan cecair. Apabila ketumpatan kuasa mencapai 60 kW hingga 80 kW setiap rak, penyejukan cecair tahap cip langsung menjadi semakin biasa.
Penyejukan Cecair: Cekap dan Berkesan untuk Beban Kerja AI Berketumpatan Tinggi
Penyejukan cecair berfungsi dengan mengedarkan cecair penyejuk (seperti air, 3M Novec, atau Fluorinert) melalui plat sejuk yang menghubungi terus komponen seperti CPU atau GPU. Haba diserap oleh cecair penyejuk dan kemudian dipindahkan melalui penukar haba atau radiator ke udara sekeliling. Cecair yang disejukkan kemudiannya diedarkan semula, memastikan penyejukan berterusan.
Berbanding dengan penyejukan udara tradisional, penyejukan cecair menawarkan kecekapan yang jauh lebih tinggi, menjadikannya amat berkesan untuk menguruskan beban kerja AI. Memandangkan cecair penyejuk jauh lebih cekap dalam menghilangkan haba daripada udara (beribu-ribu kali per unit isipadu), sistem penyejukan cecair sering digunakan untuk mengendalikan haba besar yang dijana dalam ruang terkurung. Cecair menyerap haba daripada perkakasan dalaman dan mengangkutnya ke medium luaran, seperti udara, untuk dissipation.
Dalam persekitaran berketumpatan kuasa tinggi, sistem penyejukan cecair cemerlang. Walau bagaimanapun, adalah penting untuk ambil perhatian bahawa walaupun penyejukan cecair biasanya menyasarkan CPU atau GPU, sistem mungkin masih menghasilkan haba berlebihan yang memerlukan penyaman udara tambahan untuk menyejukkan komponen lain di dalam bilik.
Penyejukan Rendaman: Pendekatan Revolusi untuk Penyejukan
Penyejukan rendaman melibatkan merendam komponen elektronik dalam cecair penyejuk bukan konduktif, seperti 3M Novec atau Fluorinert. Cecair penyejuk menyerap haba yang dihasilkan oleh komponen, yang kemudiannya dipindahkan melalui peredaran ke penukar haba dan disejukkan sebelum diedarkan semula.
Penyejukan rendaman telah mendapat perhatian yang ketara dalam pusat data pengkomputeran berprestasi tinggi (HPC) kerana keupayaannya untuk menyokong ketumpatan kuasa yang lebih tinggi dan keberkesanan penggunaan kuasa (PUE) yang lebih rendah. Salah satu kelebihan utama penyejukan rendaman ialah keupayaannya untuk menyejukkan bukan sahaja CPU tetapi juga komponen lain seperti papan litar bercetak (PCB) atau papan induk, yang biasanya mencabar untuk menyejukkan dengan kaedah tradisional.
Kesimpulan: Mencari Penyelesaian Penyejukan yang Tepat untuk Pelayan AI
Apabila pelayan AI terus menolak sempadan kuasa pengkomputeran, udara tradisionalpenyelesaian penyejukanberjuang untuk memenuhi permintaan penyejukan. Penyejukan cecair dan penyejukan rendaman menawarkan alternatif yang menjanjikan, memberikan kecekapan penyejukan yang lebih tinggi dan menyokong keperluan kuasa yang semakin meningkat bagi beban kerja AI moden. Walau bagaimanapun, setiap penyelesaian mempunyai pertukaran dan kes penggunaan khusus, dengan penyejukan cecair sesuai untuk persekitaran berketumpatan tinggi dan penyejukan rendaman sesuai untuk keperluan penyejukan yang lebih komprehensif. Akhirnya, memilih penyelesaian penyejukan yang betul adalah penting untuk mengekalkan prestasi pelayan AI dan kebolehpercayaan dalam menghadapi permintaan kuasa yang semakin meningkat.