Leave Your Message
فئات الأخبار
الأخبار المميزة

تحديات تبريد خوادم الذكاء الاصطناعي: معركة بين درجة الحرارة والأداء

2025-02-10

تُولّد خوادم الذكاء الاصطناعي، بفضل قدراتها العالية على الحوسبة المتوازية وكثافة عقد الحوسبة، حرارةً عاليةً في مساحةٍ ضيقة. وهذا يُؤدي إلى استهلاكٍ عالٍ للطاقة. تحت الحمل الثقيل، يصعب تبديد الحرارة الناتجة عن الخادم بفعالية، مما يؤدي إلى انخفاض أداء الأجهزة أو حتى تلفها. لذلك، يُعدّ التبريد الفعّال أحد التحديات الرئيسية التي تواجه خوادم الذكاء الاصطناعي.

dferg1.jpg

حلول التبريد التقليدية: التحديات مع شرائح الذكاء الاصطناعي عالية الطاقة

الخادم التقليديحلول التبريدتُشبه هذه المُستخدمة في الحوسبة العامة، مع التركيز الأساسي على تبريد الرقائق عالية الاستهلاك للطاقة. عادةً، تُنقل الحرارة من الرقائق عبر أنابيب حرارية ومُشتتات حرارية إلى مشتتات حرارية متعددة الزعانف، ثم تُبدد بنشاط بواسطة المراوح.

ومع ذلك، فقد ثبت أن حل التبريد الهوائي هذا غير مناسب لخوادم الذكاء الاصطناعي الحديثة. ويكمن السبب في أن استهلاك الطاقة في شرائح الذكاء الاصطناعي عالية الأداء يزداد بشكل ملحوظ مع زيادة قوة الحوسبة.

dferg2.jpg

ما هو حد التبريد لـتبريد الهواء؟

تشير تقارير الأبحاث إلى أن حد التبريدتبريد الهواءتبلغ قوتها حوالي 250 واط في مساحة خادم 2U، مع قدرات تبريد تتراوح من 400 واط إلى 600 واط في مساحة 4U.

للتوضيح، "U" هو قياس موحد حددته رابطة الصناعات الإلكترونية (EIA). يعادل ارتفاع "U" واحد 4.445 سم (1.75 بوصة)، ويبلغ ارتفاع رف الخادم القياسي عادةً 42U. إلا أن العدد الإجمالي لخوادم 1U التي يمكن للرف استيعابها عادةً ما يكون محدودًا بسبب قيود التبريد.

على سبيل المثال، عند استخدام شرائح NVIDIA H100، يكون الرف 4U ضروريًا عند استخدام وحدة تبريد الهواء.

حلول التبريد: التبريد السائل والتبريد بالغمر

لمواجهة تحديات التبريد هذه، برز التبريد السائل والتبريد بالغمر كحلين رائدين، خاصةً في البيئات عالية الكثافة حيث تتجاوز الطاقة لكل رف 30 كيلوواط. في هذه المرحلة، تتفاقم مشاكل النقاط الساخنة، مما يتطلب استراتيجيات تبريد متطورة، مثل التبريد السائل. عندما تصل كثافة الطاقة إلى 60 إلى 80 كيلوواط لكل رف، يصبح التبريد السائل المباشر على مستوى الشريحة أكثر شيوعًا.

التبريد السائل: فعال وكفء لأحمال عمل الذكاء الاصطناعي عالية الكثافة

يعمل التبريد السائل عن طريق تدوير سائل تبريد (مثل الماء، أو 3M Novec، أو Fluorinert) عبر صفيحة باردة تتصل مباشرةً بمكونات مثل وحدات المعالجة المركزية (CPU) أو وحدات معالجة الرسومات (GPU). يمتص سائل التبريد الحرارة، ثم تنتقل عبر مبادل حراري أو مشعاع إلى الهواء المحيط. ثم يُعاد تدوير السائل المبرد، مما يضمن التبريد المستمر.

مقارنةً بالتبريد الهوائي التقليدي، يوفر التبريد السائل كفاءة أعلى بكثير، مما يجعله فعالاً بشكل خاص في إدارة أحمال عمل الذكاء الاصطناعي. ولأن سائل التبريد السائل أكثر كفاءة في تبديد الحرارة من الهواء (بآلاف المرات لكل وحدة حجم)، تُستخدم أنظمة التبريد السائل غالبًا للتعامل مع الحرارة الهائلة المتولدة في الأماكن الضيقة. يمتص السائل الحرارة من الأجهزة الداخلية وينقلها إلى أوساط خارجية، مثل الهواء، لتبديدها.

في البيئات عالية الطاقة، تتفوق أنظمة التبريد السائل. مع ذلك، تجدر الإشارة إلى أنه على الرغم من أن التبريد السائل يستهدف عادةً وحدات المعالجة المركزية (CPU) أو وحدات معالجة الرسومات (GPU)، إلا أن النظام قد يُولّد حرارة زائدة تتطلب تكييف هواء إضافي لتبريد مكونات أخرى في الغرفة.

التبريد بالغمر: نهج ثوري للتبريد

يتضمن التبريد بالغمر غمر المكونات الإلكترونية في سائل تبريد غير موصل، مثل 3M Novec أو Fluorinert. يمتص سائل التبريد الحرارة الناتجة عن المكونات، ثم تُنقل عبر الدورة إلى مبادل حراري، حيث تُبرّد قبل إعادة تدويرها.

اكتسب التبريد بالغمر اهتمامًا كبيرًا في مراكز بيانات الحوسبة عالية الأداء (HPC) نظرًا لقدرته على دعم كثافات طاقة أعلى وكفاءة استخدام طاقة أقل (PUE). ومن أهم مزايا التبريد بالغمر قدرته على تبريد ليس فقط وحدات المعالجة المركزية (CPU)، بل أيضًا مكونات أخرى مثل لوحات الدوائر المطبوعة (PCBs) أو اللوحات الأم، والتي عادةً ما يصعب تبريدها بالطرق التقليدية.

الاستنتاج: إيجاد حل التبريد المناسب لخوادم الذكاء الاصطناعي

مع استمرار خوادم الذكاء الاصطناعي في دفع حدود قوة الحوسبة، أصبحت أنظمة الحوسبة الجوية التقليديةحلول التبريدنواجه صعوبة في تلبية متطلبات التبريد. يوفر التبريد السائل والتبريد بالغمر بدائل واعدة، إذ يوفران كفاءة تبريد أعلى ويدعمان احتياجات الطاقة المتزايدة لأحمال عمل الذكاء الاصطناعي الحديثة. ومع ذلك، لكل حل مزاياه وحالات استخدام محددة، حيث يُعد التبريد السائل مثاليًا للبيئات عالية الكثافة، بينما يُعد التبريد بالغمر مناسبًا لاحتياجات التبريد الأكثر شمولًا. في النهاية، يُعد اختيار حل التبريد المناسب أمرًا بالغ الأهمية للحفاظ على أداء خادم الذكاء الاصطناعي وموثوقيته في مواجهة متطلبات الطاقة المتزايدة.