Tantangan Pendinginan Server AI: Pertarungan Antara Suhu dan Performa
Server AI, dengan kemampuan komputasi paralel yang tinggi dan simpul komputasi yang padat, menghasilkan panas yang signifikan dalam ruang yang terbatas. Hal ini mengakibatkan konsumsi daya yang tinggi. Di bawah beban berat, panas yang dihasilkan oleh server sulit untuk dihilangkan secara efektif, yang menyebabkan kinerja perangkat keras berkurang atau bahkan kerusakan perangkat keras. Oleh karena itu, pendinginan yang efisien merupakan salah satu tantangan utama yang dihadapi oleh server AI.
Solusi Pendinginan Tradisional: Tantangan dengan Chip AI Berdaya Tinggi
Server tradisionalsolusi pendinginanmirip dengan yang digunakan dalam komputasi umum, dengan fokus utama pada pendinginan chip yang mengonsumsi daya tinggi. Biasanya, panas dipindahkan dari chip melalui pipa panas dan penyebar panas ke heat sink multi-sirip, lalu secara aktif dihilangkan oleh kipas.
Namun, solusi pendingin udara ini terbukti tidak memadai untuk server AI modern. Alasannya terletak pada fakta bahwa konsumsi daya chip AI berkinerja tinggi meningkat secara signifikan seiring dengan daya komputasi.
Apa Batas PendinginanPendinginan Udara....
Laporan penelitian menunjukkan bahwa batas pendinginanpendingin udarasekitar 250W dalam ruang server 2U, dengan kemampuan pendinginan berkisar antara 400W hingga 600W dalam ruang 4U.
Sebagai konteks, "U" adalah ukuran standar yang ditetapkan oleh Electronic Industries Alliance (EIA). Satu "U" setara dengan tinggi 4,445 cm (1,75 inci), dengan rak server standar biasanya berukuran tinggi 42U. Namun, jumlah total server 1U yang dapat ditampung rak biasanya dibatasi oleh kendala pendinginan.
Misalnya, saat menggunakan chip NVIDIA H100, rak 4U diperlukan saat menggunakan modul pendingin udara.
Solusi Pendinginan: Pendinginan Cair dan Pendinginan Imersi
Untuk mengatasi tantangan pendinginan ini, pendinginan cair dan pendinginan imersi muncul sebagai dua solusi utama, terutama di lingkungan dengan kepadatan tinggi di mana daya per rak melebihi 30 kW. Pada titik ini, masalah titik panas menjadi lebih menonjol, yang membutuhkan strategi pendinginan tingkat lanjut, seperti pendinginan cair. Ketika kepadatan daya mencapai 60 kW hingga 80 kW per rak, pendinginan cair langsung pada tingkat chip menjadi semakin umum.
Pendinginan Cair: Efisien dan Efektif untuk Beban Kerja AI Berdensitas Tinggi
Pendinginan cair bekerja dengan mengalirkan cairan pendingin (seperti air, 3M Novec, atau Fluorinert) melalui pelat dingin yang bersentuhan langsung dengan komponen seperti CPU atau GPU. Panas diserap oleh cairan pendingin lalu dipindahkan melalui penukar panas atau radiator ke udara di sekitarnya. Cairan yang didinginkan kemudian disirkulasikan kembali, sehingga pendinginan terus-menerus dapat dilakukan.
Dibandingkan dengan pendinginan udara tradisional, pendinginan cair menawarkan efisiensi yang jauh lebih tinggi, sehingga sangat efektif untuk mengelola beban kerja AI. Karena cairan pendingin jauh lebih efisien dalam menghilangkan panas daripada udara (ribuan kali per satuan volume), sistem pendinginan cair sering digunakan untuk menangani panas besar yang dihasilkan di ruang terbatas. Cairan menyerap panas dari perangkat keras internal dan menyalurkannya ke media eksternal, seperti udara, untuk dihilangkan.
Sistem pendingin cair sangat cocok untuk lingkungan dengan kepadatan daya tinggi. Namun, penting untuk dicatat bahwa meskipun pendingin cair biasanya menargetkan CPU atau GPU, sistem tersebut mungkin masih menghasilkan panas berlebih yang memerlukan pendingin udara tambahan untuk mendinginkan komponen lain di dalam ruangan.
Pendinginan Imersi: Pendekatan Revolusioner terhadap Pendinginan
Pendinginan imersi melibatkan pencelupan komponen elektronik dalam cairan pendingin nonkonduktif, seperti 3M Novec atau Fluorinert. Cairan pendingin menyerap panas yang dihasilkan oleh komponen, yang kemudian dipindahkan melalui sirkulasi ke penukar panas dan didinginkan sebelum disirkulasikan kembali.
Pendinginan imersi telah menarik perhatian signifikan di pusat data komputasi performa tinggi (HPC) karena kemampuannya untuk mendukung kepadatan daya yang lebih tinggi dan efektivitas penggunaan daya yang lebih rendah (PUE). Salah satu keuntungan utama pendinginan imersi adalah kemampuannya untuk mendinginkan tidak hanya CPU tetapi juga komponen lain seperti papan sirkuit cetak (PCB) atau motherboard, yang biasanya sulit didinginkan dengan metode tradisional.
Kesimpulan: Menemukan Solusi Pendinginan yang Tepat untuk Server AI
Ketika server AI terus mendorong batas-batas daya komputasi, udara tradisionalsolusi pendinginanberjuang untuk memenuhi tuntutan pendinginan. Pendinginan cair dan pendinginan imersi menawarkan alternatif yang menjanjikan, memberikan efisiensi pendinginan yang lebih tinggi dan mendukung kebutuhan daya yang terus meningkat dari beban kerja AI modern. Namun, setiap solusi memiliki kelebihan dan kasus penggunaan tertentu, dengan pendinginan cair yang ideal untuk lingkungan dengan kepadatan tinggi dan pendinginan imersi yang cocok untuk kebutuhan pendinginan yang lebih komprehensif. Pada akhirnya, memilih solusi pendinginan yang tepat sangat penting untuk menjaga kinerja dan keandalan server AI dalam menghadapi meningkatnya tuntutan daya.