De bouw van AI-datacenters dwingt datacenterontwikkelaars tot een andere manier van specificeren, inkopen en beoordelen. Waar een traditioneel datacenter vaak nog met relatief bekende ontwerpprincipes uit de voeten kan, stelt AI-infrastructuur veel zwaardere eisen aan koeling, stroomvoorziening, schaalbaarheid en beschikbaarheid. Vooral de combinatie van hoge vermogens per rack, snel wisselende belastingen en nieuwe koeltechnieken maakt de selectie van technologie en leveranciers een kritische fase in elk AI-project.
Dat blijkt uit het rapport ‘Technical Vendor Requirements and Evaluation’ van Uptime Institute. De organisatie waarschuwt dat verkeerde keuzes in deze vroege fase grote gevolgen kunnen hebben voor de levensduur, prestaties en uitbreidbaarheid van een datacenter. AI-faciliteiten moeten vaak snel worden gebouwd, maar snelheid mag volgens de onderzoekers niet ten koste gaan van kwaliteit, veerkracht of aansluiting op de bedrijfsdoelen.
Meer dan ‘zware’ datacenters
De kern van het probleem is dat AI-datacenters niet simpelweg gewone datacenters met zwaardere racks zijn. De IT-belasting is anders, de warmteproductie is anders en ook het gedrag van de stroomvraag wijkt sterk af van conventionele workloads. Zeker bij grote AI-trainingsclusters kan de vermogensvraag veel sterker en vaker fluctueren dan bij traditionele CPU-omgevingen, aldus Uptime. Dat heeft uiteraard gevolgen voor de elektrische infrastructuur, de keuze van UPS-systemen, distributie, bekabeling en de manier waarop redundantie wordt ingericht.
Ook aan de koelzijde veranderen de uitgangspunten snel. Luchtkoeling blijft belangrijk, maar is bij de hoogste rackvermogens niet langer voldoende. Uptime ziet 40 tot 60 kW per rack grofweg als de bovengrens voor systemen die uitsluitend met lucht kunnen worden gekoeld, al hangt de precieze grens af van onder meer de economische afweging, de bestaande infrastructuur en de verwachte toekomstige belasting. Tegelijkertijd schuift die grens in de markt wel op. Uit enquêtes blijkt volgens Uptime dat veel partijen luchtkoeling zo lang mogelijk willen blijven gebruiken en dat vroege GPU-gebaseerde AI-systemen zelfs racks van 40 kW nog volledig met lucht koelden.
Direct-to-chip
Bij de nieuwste generatie AI-hardware is die discussie echter grotendeels voorbij. Racks met GPU’s kunnen inmiddels vermogens bereiken van 130 kW. Op dat niveau is vloeistofkoeling noodzakelijk. Volgens Uptime ligt direct-to-chip liquid cooling, kortweg DLC, in de meeste gevallen het meest voor de hand. Daarbij wordt koelvloeistof via cold plates direct langs de warmste componenten geleid, zoals GPU’s. Het voordeel is dat deze techniek relatief goed past binnen het bekende rackmodel van datacenters. Dat maakt toepassing in nieuwe datacenters mogelijk, maar onder voorwaarden ook retrofit in bestaande ruimtes.
DLC vervangt luchtkoeling overigens niet volledig, stelt Uptime. In een high-density rack blijven componenten aanwezig die conventionele luchtkoeling nodig hebben, zoals netwerkkaarten, opslag en aanvullende processors. Bij een rack van 130 kW kan meer dan 100 kW via directe vloeistofkoeling worden afgevoerd, terwijl nog altijd meer dan 30 kW aan luchtkoeling nodig is. Sommige high-density faciliteiten specificeren volgens Uptime zelfs combinaties tot 125 kW DLC en 60 kW luchtkoeling per rack. Voor ontwerpers en installateurs betekent dit dat hybride koelconcepten eerder regel dan uitzondering worden.
Immersion cooling
Immersion cooling, waarbij IT-apparatuur in een diëlektrische vloeistof wordt ondergedompeld, blijft volgens het rapport vooral relevant voor specifieke situaties. De techniek kan interessant zijn bij structureel zeer hoge vermogensdichtheden, en wordt in bepaalde HPC-omgevingen al langer toegepast. Toch vraagt immersion cooling om een grotere breuk met de huidige datacenterpraktijk. De tanks zijn zwaar, vragen soms om versterkte vloeren en laten zich minder flexibel combineren met conventionele racks. Ook onderhoudsprocedures veranderen ingrijpend.
Naast koeling wordt stroomvoorziening een bepalende factor. In veel regio’s zetten high-density datacenters lokale netten onder druk. Wachttijden voor aansluitvermogen kunnen projecten vertragen, waardoor sommige grote faciliteiten kijken naar eigen primaire stroomopwekking op locatie, bijvoorbeeld met gasturbines. Dat is echter kapitaalintensief en brengt nieuwe technische en operationele uitdagingen met zich mee.
Hogere spanningen nodig?
Daar komt bij dat AI-datacenters mogelijk met hogere spanningen moeten gaan werken dan conventionele faciliteiten, om de kosten en omvang van kabels en busbars beheersbaar te houden. Uptime noemt onder meer distributie op 800 volt DC als optie, maar wijst erop dat geschikte apparatuur duurder en lastiger verkrijgbaar kan zijn. Ook hier geldt dat keuzes niet alleen moeten passen bij de eerste fase van het project, maar ook bij latere uitbreidingen en mogelijke herbestemming van installaties. Een generator die aanvankelijk als primaire stroombron wordt gebruikt, kan later bijvoorbeeld dienstdoen als noodstroomvoorziening zodra een netaansluiting beschikbaar komt.
Het rapport benadrukt daarom het belang van een gestructureerd RFP- en aanbestedingsproces. Specificaties moeten niet alleen de technische eisen bevatten, maar ook eisen rond levertijden, uitbreidbaarheid, hergebruik, prestaties onder piekbelasting en de consequenties wanneer leveranciers afspraken niet nakomen. Vooral levertijden zijn een gevoelig punt, omdat lange wachttijden voor cruciale apparatuur inmiddels gebruikelijk zijn.
Selectieproces
Uptime adviseert om per type kritische component, zoals UPS-systemen, generatoren en koelunits, meerdere leveranciers te beoordelen. Een eerste selectie kan plaatsvinden op basis van technologie, beschikbaarheid en geografische ondersteuning. Daarna moeten biedingen worden beoordeeld met een vaste template die aansluit op de projectdoelen en het ontwerp. Dat moet voorkomen dat beslissingen te veel worden gestuurd door losse productspecificaties of commerciële beloften.
Voor datacenterontwikkelaars, consultants, installateurs en technische dienstverleners ligt hier een belangrijke les. AI-infrastructuur vraagt niet alleen om zwaardere installaties, maar vooral om een scherpere koppeling tussen businessdoelen, technische ontwerpkeuzes en leveranciersstrategie. Wie nu kiest voor een koel- of stroomarchitectuur die over enkele jaren niet meer meegroeit, loopt het risico vroegtijdig opnieuw te moeten investeren.
De ontwikkeling van AI-datacenters wordt daarmee ook een test voor de volwassenheid van de hele datacenterketen. Ontwerp, inkoop, bouw en operatie kunnen minder dan voorheen als losse fasen worden behandeld. De technische keuzes die in de aanbesteding worden gemaakt, bepalen in hoge mate of een AI-datacenter straks flexibel genoeg is voor nieuwe GPU-generaties, hogere vermogensdichtheden en veranderende bedrijfsmodellen. Snel bouwen blijft belangrijk, maar bij AI-infrastructuur wordt vooral duidelijk dat snelheid zonder goede specificaties een duur risico kan worden.

0 Reacties