L’intelligenza artificiale è ostacolata dalla carenza di chip potenti
La schiacciante domanda di intelligenza artificiale ha anche rivelato i limiti della catena di fornitura globale di potenti chip utilizzati per sviluppare e mettere in campo modelli di intelligenza artificiale.
Il continuo chip crunch ha colpito aziende grandi e piccole, comprese alcune delle piattaforme leader del settore dell’intelligenza artificiale, e secondo gli analisti del settore potrebbe non migliorare in modo significativo per almeno un anno o più.
L’ultimo segnale di una carenza potenzialmente estesa di chip AI è arrivato di recente nel rapporto annuale di Microsoft. Il rapporto identifica, per la prima volta, la disponibilità di unità di elaborazione grafica (GPU) come un possibile fattore di rischio per gli investitori.
Le GPU sono un tipo di hardware fondamentale che aiuta a eseguire gli innumerevoli calcoli coinvolti nell'addestramento e nell'implementazione di algoritmi di intelligenza artificiale.
"Continuiamo a identificare e valutare opportunità per espandere le sedi dei nostri data center e aumentare la capacità dei nostri server per soddisfare le esigenze in evoluzione dei nostri clienti, in particolare data la crescente domanda di servizi di intelligenza artificiale", ha scritto Microsoft. "I nostri data center dipendono dalla disponibilità di terreno consentito ed edificabile, energia prevedibile, forniture di rete e server, comprese unità di elaborazione grafica ("GPU") e altri componenti."
Il cenno di Microsoft alle GPU evidenzia come l’accesso alla potenza di calcolo costituisca un collo di bottiglia critico per l’intelligenza artificiale. La questione colpisce direttamente le aziende che stanno costruendo strumenti e prodotti di intelligenza artificiale e indirettamente colpisce le aziende e gli utenti finali che sperano di applicare la tecnologia per i propri scopi.
Il CEO di OpenAI Sam Altman, testimoniando davanti al Senato degli Stati Uniti a maggio, ha suggerito che lo strumento chatbot dell'azienda stava faticando a tenere il passo con il numero di richieste che gli utenti gli avevano rivolto.
"Siamo così a corto di GPU che meno persone utilizzano lo strumento, meglio è", ha affermato Altman. Un portavoce di OpenAI ha successivamente dichiarato alla CNN che la società si impegna a garantire una capacità sufficiente per gli utenti.
Il problema potrebbe ricordare la carenza di elettronica di consumo popolare durante l’era della pandemia, che ha visto gli appassionati di giochi pagare prezzi sostanzialmente gonfiati per console di gioco e schede grafiche per PC. All’epoca, i ritardi nella produzione, la mancanza di manodopera, le interruzioni delle spedizioni globali e la persistente domanda competitiva da parte dei minatori di criptovaluta contribuirono alla scarsa offerta di GPU, stimolando un’industria artigianale di tecnologia di tracciamento degli affari per aiutare i consumatori comuni a trovare ciò di cui avevano bisogno.
Ma l’attuale carenza è di natura molto diversa, affermano gli esperti del settore. Invece di un’interruzione delle forniture di GPU orientate al consumatore, la carenza in corso riflette l’improvvisa ed esplosiva domanda di GPU di fascia ultra alta destinate a lavori avanzati come la formazione e l’uso di modelli di intelligenza artificiale.
La produzione di queste GPU è al massimo della sua capacità, ma l’impennata della domanda ha sopraffatto le poche fonti di approvvigionamento esistenti.
C'è un "enorme suono di risucchio" proveniente dalle aziende che rappresentano la domanda senza rivali di intelligenza artificiale, ha affermato Raj Joshi, vicepresidente senior di Moody's Investors Service che segue l'industria dei chip.
"Nessuno avrebbe potuto prevedere la velocità o l'entità dell'aumento di questa domanda", ha detto Joshi. “Non credo che il settore fosse pronto per questo tipo di aumento della domanda”.
Un’azienda in particolare trarrà enormi benefici dall’impennata dell’intelligenza artificiale: Nvidia, il produttore di chip da trilioni di dollari che secondo le stime del settore controlla l’84% del mercato delle GPU discrete. In una nota di ricerca pubblicata a maggio, Joshi ha stimato che Nvidia avrebbe registrato una crescita dei ricavi “senza precedenti” nei prossimi trimestri, con i ricavi derivanti dal business dei data center che supererebbero quelli dei rivali Intel e AMD messi insieme.
Nella sua dichiarazione sugli utili di maggio, Nvidia ha affermato di aver “procurato un’offerta sostanzialmente più elevata per la seconda metà dell’anno” per soddisfare la crescente domanda di chip AI. Martedì la società ha rifiutato di commentare, citando il suo ultimo periodo di calma pre-utili.