Tesla svela il suo nuovo supercomputer per allenare l’intelligenza artificiale
Tesla ha svelato il suo nuovo supercomputer, il quinto più potente al mondo, predecessore del Dojo. L’obiettivo è quello di usare la massima potenza di calcolo per addestrare le reti neurali che alimentano l’Autopilot e la prossima intelligenza artificiale per la guida autonoma.
D’altronde, non è una novità che la compagnia abbia bisogno di computer sempre più performanti. All’interno delle sue auto, infatti, ne ha necessità per eseguire il suo software di guida autonoma. All’esterno, invece, per allenare il suo software di guida autonoma alimentato da reti neurali.
Il CEO Elon Musk ha più volte parlato del progetto Dojo nello scorso passato, un supercomputer su cui Tesla ha lavorato duramente negli ultimi anni. Musk ha lasciato intendere che il nuovo hardware essere pronto per la fine di quest’anno.
Tuttavia, l’azienda ha sviluppato anche altri supercomputer oltre a Dojo, e ora Andrej Karpathy, a capo dell’AI di Tesla, ha svelato l’ultimo durante una presentazione alla 2021 Conference on Computer Vision and Pattern Recognition. Queste sono le sue specifiche:
- 720 nodi di 8x A100 80GB. (5760 GPU totali)
- 1,8 EFLOPS (720 nodi * 312 TFLOPS-FP16-A100 * 8 gpu/nodi)
- 10 PB di storage NVME “hot tier” a 1,6 TBps
- 640 Tbps di capacità di commutazione totale
Le dichiarazioni del manager di Tesla
“Abbiamo una rete con architettura a rete neurale e abbiamo un set di dati, un set di dati da 1,5 petabyte che richiede un’enorme quantità di calcolo. Quindi volevo dare una spina a questo folle supercomputer che stiamo costruendo e utilizzando ora. Per noi, la computer vision è il pane e il burro di ciò che facciamo e ciò che abilita Autopilot – ha dichiarato Karpathy – E perché questo funzioni davvero bene, abbiamo bisogno di padroneggiare i dati della flotta, di addestrare enormi reti neurali e di sperimentare molto. Quindi abbiamo investito molto nel calcolo. In questo caso, abbiamo un cluster che abbiamo costruito con 720 nodi di 8x A100 della versione da 80GB. Quindi questo è un enorme supercomputer. In realtà penso che in termini di flop, sia all’incirca il supercomputer numero 5 al mondo“.
L’ingegnere di Tesla non ha voluto approfondire il progetto Dojo, ma ha detto che sarà un supercomputer ancora migliore ottimizzato per l’allenamento delle reti neurali rispetto all’attuale cluster di Tesla.