13 maart 2025
0 Reactie(s)

13 maart 2025

Arista introduceert intelligente innovaties voor AI-netwerken

Arista Networks intro­du­ceert geavan­ceerde mogelijk­heden om de perfor­mance en effici­ëntie van AI-clusters te maxima­li­seren. Cluster Load Balan­cing (CLB) in Arista EOS maxima­li­seert de perfor­mance van AI-workloads met consis­tente lage latency network flows, terwijl Arista Cloud­Vi­sion Universal Network Obser­va­bi­lity (CV UNO) nu AI-taakge­richte obser­vatie biedt voor betere oplos­sing en snelle inferentie van problemen. Dat zorgt voor betrouw­baar­heid bij het op grote schaal verwerken van AI-taken.

Slimme AI-netwerken mogelijk maken 

De Arista EOS Smart AI Suite is ontworpen voor robuust­heid en bescher­ming van de AI-kwali­teit. Het geeft AI-clusters een innovatie genaamd Cluster Load Balan­cing: een nieuwe op Ethernet gebaseerde oplos­sing voor AI-load balan­cing, op basis van ‘RDMA queue pairs’, die een hoog bandbreed­te­ge­bruik tussen spines en leaves mogelijk maakt. 

AI-clusters hebben meestal kleine hoeveel­heden flows met grote bandbreedte. Basis­me­thoden voor load balan­cing zijn vaak ineffi­ciënt voor AI-workloads, wat resul­teert in een ongelijke verkeers­ver­de­ling en verhoogde tail-latency. CLB pakt dit aan door RDMA-bewuste flow place­ment te gebruiken, om uniforme hoge presta­ties voor alle flows te garan­deren en tegelij­ker­tijd de tail-latency te reduceren. CLB hanteert een globale aanpak en optima­li­seert de verkeers­stroom in beide richtingen, leaf-to-spine en spine-to-leaf, wat zorgt voor een evenwichtig gebruik van resources en een consis­tente lage latentie.

“Nu Oracle zijn AI-infra­struc­tuur blijft uitbreiden met behulp van Arista-switches, zien we een behoefte aan geavan­ceerde load balan­cing-technieken om flowcon­flicten te voorkomen en de doorvoer in ML-netwerken te verhogen”, aldus Jag Brar, vice presi­dent en Distin­guished Engineer, Oracle Cloud Infra­struc­ture. “De Cluster Load Balan­cing-functi­o­na­li­teit van Arista helpt daarbij.”

Holistische AI-observatie

CV UNO, het AI-gestuurde 3600 Network Obser­va­bi­lity-platform aange­stuurd door Arista AVA, levert end-to-end AI-job visibi­lity door netwerk‑, systeem- en AI-taakdata te verenigen binnen het Arista Network Data Lake (NetDL). EOS NetDL Streamer, een realtime frame­work voor teleme­trie, streamt continu gedetail­leerde netwerk­data van Arista-switches naar NetDL. In tegen­stel­ling tot tradi­ti­o­nele SNMP-polling, die afhan­ke­lijk is van perio­dieke query’s en kritieke updates kan missen, biedt EOS NetDL Streamer lage latentie, hoge frequentie, event­ge­stuurde inzichten in netwerk­pres­ta­ties, wat cruciaal is voor het optima­li­seren van AI-training en inferentie-infrastructuur. 

Ontworpen voor AI-accele­ra­tor­clus­ters, versnelt het de impact­ana­lyse, lokali­seert het problemen nauwkeurig en zorgt het voor een snelle oplos­sing, waardoor de tijden om taken te voltooien tot een minimum worden beperkt. Enkele van de belang­rijkste voordelen zijn:

  • AI Job Monito­ring – Geeft een uitge­breid overzicht van belang­rijke AI-job statis­tieken, inclu­sief job voltooi­ings­tijden, congestie-indica­toren (ECN-gemar­keerde packets, PFC-pauze­frames, packet­drops) en buffer-/link­ge­bruik voor realtime-inzichten.
  • Deep-Dive Analy­tics – Ontdekt kritieke taakspe­ci­fieke inzichten door netwerk­ap­pa­raten, server-NIC’s (bijv. PFC-out-of-sync-gebeur­te­nissen, RDMA-fouten, PCIe-fatale fouten) en bijbe­ho­rende flows te analy­seren, en geeft perfor­man­ce­knel­punten nauwkeurig aan.
  • Flow Visua­li­za­tion – Benut de kracht van CV-topolo­gie­map­ping om realtime, intuï­tief inzicht te krijgen in AI-job flows met micro­se­conde-granu­la­ri­teit, wat de inferentie en oplos­sing van problemen versnelt.
  • Proac­tieve oplos­sing – Detec­teert anoma­lieën vroeg­tijdig en corre­leert netwerk- en compu­ter­pres­ta­ties binnen NetDL, wat zorgt voor ononder­broken, zeer effici­ënte uitvoe­ring van AI-workloads.

Arista AI Centers aangestuurd door AVA

Arista’s Ether­link AI-platforms zijn op standaarden gebaseerde Ethernet-systemen met een zeer hoge perfor­mance, voor volgende generatie AI-netwerken. Ether­link biedt 800G/​400G modulaire en gedis­tri­bu­eerde platforms, die toekomst­ge­richt  compa­tibel zijn met Ultra Ethernet Consor­tium (UEC), en is schaal­baar van kleine AI-clusters tot enorme imple­men­ta­ties met ruim 100.000 accelerators. 

Arista beschikt over de AI Analyzer, aange­stuurd door Arista AVA, die hoge-resolutie verkeers­data levert met inter­vallen van 100 micro­se­conden. Hiermee kunnen netwerk­be­heer­ders nauwkeurig de perfor­mance optima­li­seren, snel problemen oplossen en welover­wogen beslis­singen nemen voor AI-gestuurde netwerken. Arista AVA voedt ook een externe EOS AI Agent, die teleme­trie streamt van SuperNIC’s of servers naar NetDL, wat zorgt voor naadloze netwerk­be­wa­king, debug­ging en QoS-consis­tentie over de gehele stack.

Beschikbaarheid

  • CLB
    • Vanaf nu beschik­baar op de platforms 7260X3, 7280R3, 7500R3 en 7800R3.
    • Onder­steu­ning op de platforms 7060X6 en 7060X5 staat gepland voor Q2 2025
    • Onder­steu­ning voor 7800R4 staat gepland voor 2H 2025
  • CV UNO is vanaf nu beschik­baar. De obser­va­tie­ver­be­te­ringen voor AI worden nog door klanten getest, waarna de brede beschik­baar­heid gepland staat voor Q2 2025

Lees hier meer over de onder­steu­ning in de markt voor deze introductie.

Registreer u hier voor een webinar op 10 april 2025 om meer te weten te komen over de EOS Smart AI-suite en lees de blog van Praful Bhaidasna, direc­teur Product Manage­ment bij Arista.

Redactie@DCpedia

Redactie@DCpedia

0 Reactie(s)

4 weergaven

0 Reactie(s)

0 reacties

Een reactie versturen

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Reacties gesloten

De reactiemogelijkheid is verlopen. (14 dagen)

Nieuwsbrief

Pin It on Pinterest

Share This