Automazione Plus

Raffreddamento a immersione: ridefinizione degli standard di affidabilitàERT

On site network security

I carichi di lavoro dei data center continuano ad aumentare a causa dell’aumento dell’AI e dell’HPC – High Performance Computing e, a loro volta, i metodi tradizionali di raffreddamento ad aria stanno raggiungendo i loro limiti pratici. Con l’aumento dei carichi termici e l’espansione dei requisiti di densità, gli operatori dei data center cercano di trovare nuovi modi per gestire il calore. In tal senso, il raffreddamento a immersione si è rivelato una strada promettente. Tuttavia, questo cambiamento espone lacune significative nel modo in cui l’industria definisce e verifica l’affidabilità dei componenti.

Gli standard sviluppati per contesti di raffreddamento ad aria non sono mai stati intesi come in grado di prevedere il comportamento dei materiali quando fossero stati completamente immersi in fluidi dielettrici. Date le nuove esigenze di progettazione architettonica e prestazioni, fattori chiave come i modelli di invecchiamento, le modalità di guasto e persino le ipotesi di base sulla durata dei componenti richiedono un ripensamento. Questa evoluzione sta rimodellando il modo in cui gli operatori dei data center valutano l’affidabilità dei componenti. Gli standard inizialmente originati per supportare i sistemi raffreddati ad aria hanno svolto il loro scopo. Ma devono evolversi per affrontare le nuove sfide presentate dagli ambienti di immersione.
Mentre gli standard di raffreddamento ad aria hanno guidato a lungo la pianificazione dei sistemi, il raffreddamento a immersione introduce una serie diversa di meccanismi di invecchiamento e sfide sui materiali. Per tenere il passo, ingegneri e gruppi industriali come l’Open Compute Project – OCP stanno lavorando insieme per costruire framework di test basati su condizioni di immersione del mondo reale. Questo cambiamento introduce sfide di progettazione e affidabilità distinte tra sistemi raffreddati ad aria e a immersione.

In che modo il raffreddamento a immersione ridefinisce le sfide di progettazione del sistema

Il raffreddamento per immersione elimina i vincoli del flusso d’aria, ma richiede un ripensamento fondamentale dell’infrastruttura, della selezione dei materiali e della progettazione del sistema. I tradizionali sistemi raffreddati ad aria, che si basano su ventole e dissipatori di calore, affrontano sfide crescenti nella gestione dei componenti Thermal Design Powers – TDP che ora superano regolarmente i 300 W e superano persino la soglia critica di 400 W in molte GPU di nuova generazione e acceleratori di intelligenza artificiale. Al di sopra di questo punto, il flusso d’aria è spesso insufficiente per mantenere temperature di funzionamento sicure.
Per colmare il divario, molti operatori di data center si sono inizialmente rivolti al raffreddamento a piastra fredda, che migliora il trasferimento termico facendo circolare il liquido direttamente ai componenti più caldi. Tuttavia, sebbene questo approccio affronti meglio le densità di chip più elevate rispetto a quanto è possibile con il raffreddamento ad aria, le soluzioni a piastra fredda introducono un ampio collettore, una complessa integrazione dello scambiatore di calore a livello di rack e ulteriori punti di guasto meccanico, incluso il rischio di perdite da tubi e connessioni.

Mentre i carichi di calcolo continuano a salire, l’immersione totale, sia monofase che bifase, sta emergendo come il passo successivo per superare i limiti strutturali e termici dei sistemi ad aria e a piastra fredda. Immergendo completamente i server in fluidi dielettrici, il raffreddamento a immersione elimina completamente le limitazioni del flusso d’aria. Il potenziale risparmio energetico, spesso quantificato come fino al 30% rispetto ai tradizionali dispiegamenti raffreddati ad aria, dipende da diversi fattori. Questi possono includere la tecnologia di immersione specifica utilizzata, l’efficacia dell’uso di energia (PUE) del sistema di raffreddamento dell’aria di base, le condizioni climatiche e la natura del carico IT, offrendo un aumento potenzialmente significativo dell’efficienza energetica in condizioni ottimali. Tuttavia, la realizzazione di questi guadagni richiede più che il solo retrofitting dell’hardware esistente.

Le sfide poste dal retrofitting per il raffreddamento a immersione

I retrofit dei brownfield spesso affrontano gravi ostacoli. Molti data center precedenti utilizzano pavimentazioni sopraelevate che non sono progettate per supportare il peso e la densità dei serbatoi utilizzati per l’immersione. L’aggiornamento di questi siti richiede spesso un costoso rinforzo strutturale e l’aggiunta di sistemi necessari per l’immersione, come scambiatori di calore, linee di fluidi e percorsi di manutenzione. Date queste sfide strutturali e infrastrutturali, la maggior parte delle nuove costruzioni a immersione vengono implementate in ambienti AI factory appositamente costruiti, in cui il supporto del pavimento, l’infrastruttura di raffreddamento e i layout spaziali sono progettati specificamente per le architetture a immersione. Nelle costruzioni greenfield, il raffreddamento a immersione consente di ottenere densità di rack più elevate e un migliore controllo termico, ma solo quando l’infrastruttura è appositamente costruita per sistemi sommersi.

I limiti degli standard basati sull’aria

Il raffreddamento a immersione offre evidenti vantaggi termici, ma espone anche i limiti dei tradizionali quadri di affidabilità. La maggior parte degli standard esistenti è stata realizzata per modellare l’invecchiamento dei materiali in condizioni atmosferiche in cui l’ossidazione, e non le interazioni chimiche, era il principale fattore di guasto. All’interno dei fluidi dielettrici, l’ossidazione rallenta drasticamente. Al suo posto, il degrado chimico termico, compresa la potenziale idrolisi, il rigonfiamento del materiale e gli additivi che si infiltrano gradualmente nel fluido, emerge come rischio dominante. Nel corso del tempo, questi cambiamenti chimici possono indebolire le proprietà meccaniche e compromettere l’affidabilità a lungo termine. I metodi di test come l’invecchiamento a gas a flusso misto, originariamente progettati per simulare la corrosione aerodispersa attraverso l’esposizione a gas reattivi come il biossido di zolfo e il biossido di azoto, non sono più in linea con i reali meccanismi di guasto, non si allineano più con i meccanismi di guasto reali in gioco negli ambienti fluidi.