Centres de données, partie I : La prochaine décennie sera celle de l’accélération et l’intelligence artificielle générative
Par : Matthew D. Ramsay, Ethan Potasnick, Sean O'Loughlin, George Kuhle, Krish Sankar, Joshua Buchalter, Michael Elias, John Blackledge, Derrick Wood, Steven Chin, Eddy Orabi, Robert Mertens, Lannie Trieu, Sam Reiff
juin 19, 2024 - 2 minutes 30 secondesLe point de vue de TD Cowen
Les changements de paradigmes simultanés provoqués par l’intelligence artificielle (IA) générative et de l’informatique accélérée entraînent des changements fondamentaux au sein des centres de données au chapitre du traitement central, des accélérateurs, du réseautage, de la mémoire et du stockage et de l’énergie. Dans ce rapport, nous présentons les changements et leur incidence sur les principales sociétés de l’écosystème (en particulier celles des semi-conducteurs) à mesure que le secteur y réagira.
Notre thèse
Le changement de paradigme pour passer à l’informatique accélérée et à l’intelligence artificielle générative entraînera et permettra de profonds changements architecturaux, en particulier à l’échelle des centres de données. Bien des choses ont été écrites sur l’IA, mais nous adoptons une approche plus détaillée en analysant ces changements de paradigme et en suivant l’incidence sur l’architecture des centres de données pour ce qui est du calcul, de la mémoire, du réseautage et de la puissance. Comme la loi de Moore a perdu du terrain, le besoin d’un délestage plus important des tâches vers des accélérateurs matériels sur mesure adaptés à la charge de travail (dont font partie les accélérateurs d’IA) a augmenté. Cette tendance devrait se poursuivre et s’accélérer, l’hétérogénéité du matériel et les accélérateurs étroitement liés favorisant l’efficacité et des avantages liés au coût total de possession.
De même, l’essor de l’IA générative a entraîné une explosion de la demande de matériel d’accélération de l’IA, tant pour la formation de modèles de plus en plus grands que pour l’exécution à l’échelle d’une inférence au niveau de la production de grands modèles de langue, l’inférence nécessitant elle-même une accélération (pour la première fois). À notre avis, la tendance haussière devrait profiter à de nombreux acteurs, mais les vrais gagnants seront les sociétés qui peuvent offrir (ou permettre) des systèmes entièrement optimisés, du silicium aux serveurs en passant par les logiciels. De plus, nous croyons que ces tendances sont probablement plus durables que de nombreux investisseurs ne le croient et qu’elles pourraient entraîner une croissance supérieure à la tendance pendant la période de prévision (et probablement au-delà).
Qu’est-ce qui est exclusif
Dans ce rapport, nous élaborons un cadre ascendant propre à chaque société pour les dépenses en silicium des centres de données jusqu’en 2030 dans l’ensemble des centres de traitement, unités de traitement graphique, unités de traitement du tenseur et circuits intégrés spécifiques à une application (y compris les unités et les estimations du prix de vente moyen). De plus, nous examinons en profondeur les principales tendances sectorielles, notamment l’infrastructure logicielle de faible niveau, l’architecture de réseau et la gestion de l’électricité.
Répercussions financières et sur les modèles du secteur
Dans l’ensemble, nous prévoyons une croissance annuelle d’au moins 15 % pour les semi-conducteurs des centres de données de 2024 à 2030, avec, sans surprise, une croissance de l’accélération et du réseautage plus rapide que celle de l’ensemble du marché. Nous incluons également des prévisions par domaine pour l’unité de traitement central (y compris les processeurs ARM), les accélérateurs d’IA (unités de traitement du tenseur et autres) et les dépenses liées au réseau (y compris le marché des unités de traitement des cartes et des données du réseau intelligent).
Ce qu’il faut surveiller
Investissement continu dans les capacités d’IA générative, les logiciels et la pénétration du marché; tendances et commentaires relatifs aux dépenses en immobilisations des centres de données d’entreprise à grande échelle (hyperscale) et souveraines; répercussions des infrastructures physiques des centres de données sur la production d’électricité, le refroidissement et l’efficacité; durabilité de la demande dans tous les secteurs verticaux de dépenses des centres de données.
Les clients inscrits peuvent lire le rapport complet, The Next Datacenter Decade, Driven By Acceleration & GenAI - Ahead Of The Curve, sur le portail Une seule TD