NVIDIA’s nieuwe Blackwell AI-chips, ontworpen voor geavanceerde toepassingen zoals AI-chatbots, ondervinden momenteel oververhittingsproblemen in serveromgevingen. Deze problemen treden op wanneer meerdere chips worden geïntegreerd in server racks die tot 72 eenheden bevatten.
Dat melden meerdere media. Als reactie hierop heeft NVIDIA zijn leveranciers gevraagd om de ontwerpen van deze racks meerdere keren aan te passen om de oververhitting aan te pakken. Het bedrijf werkt nauw samen met een aantal cloud service providers om deze problemen op te lossen.
De oververhittingsproblemen hebben geleid tot bezorgdheid bij afnemers over mogelijke vertragingen bij het opzetten van nieuwe datacenters. NVIDIA heeft echter benadrukt dat dergelijke engineeringaanpassingen gebruikelijk zijn en dat het bedrijf actief samenwerkt met partners om de problemen op te lossen.
Om de warmteafvoer in datacenters te verbeteren, onderzoekt NVIDIA innovatieve koelingsmethoden voor zijn nieuwe GB200-server racks, die zijn uitgerust met de geavanceerde Blackwell-chips. Deze servers zullen voornamelijk gebruikmaken van vloeistofkoeling, waarbij vloeistof door leidingen wordt gecirculeerd en mogelijk hele computers in niet-geleidende vloeistoffen worden ondergedompeld om warmte effectief af te voeren. Deze benadering kan het energieverbruik voor koeling aanzienlijk verminderen.
Hoewel vloeistofkoeling aanzienlijke voordelen biedt, brengt het ook uitdagingen met zich mee, zoals hogere initiële kosten en de complexiteit van het systeem, waaronder het risico op lekkages en een tekort aan gespecialiseerde onderdelen. Ondanks deze uitdagingen zijn bedrijven zoals Super Micro begonnen met de implementatie van vloeistofkoeling, met aanzienlijke uitrol in de afgelopen maanden. NVIDIA werkt samen met verschillende bedrijven aan koelingsoplossingen en onderzoekt toekomstgerichte technologieën, waaronder onderdompelingskoeling, hoewel deze momenteel worden geconfronteerd met kosten- en onderhoudsuitdagingen.
0 reacties