L'essor de l'IA ne montre aucun signe de faiblesse, mais à quel coût en matière de développement durable ?

Ian Parnell 01 nov. 2023 7 minutes de lecture
Étudiez la question de l'IA et du développement durable, en portant une attention particulière à l'impact environnemental de l'entraînement de grands modèles linguistiques et au rôle de l'IA dans les efforts de développement durable.
« Remember, remember the 5th of November » (« Souvenez-vous, souvenez-vous du 5 novembre »)
 
Ayant grandi au Royaume-Uni, la période de l'année qui arrive m'évoque ce vers extrait d'un célèbre poème pour enfants illustrant la tentative d'attaque terroriste de Guy Fawkes à Londres il y a plusieurs siècles. Permettez-moi de reprendre ce vers et de suggérer « Souvenez-vous du 30 novembre ». Je vous pardonnerais d'avoir levé un sourcil interrogateur, mais je vous demanderais de me suivre encore le temps d'un paragraphe ou deux…
 
Le 30 novembre 1487, le premier décret allemand sur la pureté de la bière (Reinheitsgebot) est promulgué à Munich par Albert IV, duc de Bavière. Il impose que la bière soit brassée à partir de seulement trois ingrédients : de l'eau, du malt et du houblon.
 
Le premier match de football international a également lieu un 30 novembre, en 1872 à Glasgow. Il se termine par un match nul 0-0 entre l'Écosse et l'Angleterre.
 
En 1928, la légende australienne du cricket Sir Donald Bradman fait ses débuts peu prometteurs dans le cricket, en marquant 18-1 contre l'Angleterre lors du premier test-match des Ashes à Brisbane, ce qui lui vaut d'être écarté pour le match suivant. Sa moyenne de batte atteindra par la suite 99,84 en moyenne au cours de sa carrière, soit 80 test-matchs, un exploit qui n'est pas prêt d'être égalé. 
 
Au-delà de ma grande passion pour la bière, le football et le cricket, vous vous demandez peut-être quel est le rapport avec le sujet traité, à savoir l'IA et le développement durable.
 
Revenons au 30 novembre 2022, lorsque Open AI a lancé ChatGPT dans le monde entier. Guy Fawkes en personne aurait été fier de la détonation mondiale que nous avons pu constater depuis et de l'impact considérable sur la vie quotidienne de nombreuses personnes.
 
Le développement durable constitue un autre sujet qui a rapidement pris de l'importance ces dernières années. Avec autant de sources d'informations différentes à portée de main aujourd'hui, certaines plus fiables que d'autres, il n'est pas rare que je me réfère à la jeunesse innocente pour avoir une vision objective du monde. Il n'y a pas si longtemps, rappeler à mes propres enfants d'éteindre toutes les lumières et tous les appareils électriques inutilisés faisait partie de mon rituel quotidien. Toutefois, les rôles sont désormais bel et bien inversés, car ces deux mêmes enfants me rappellent constamment que je jette mes déchets dans le mauvais bac de recyclage ! Lorsque nous recyclons, nous utilisons moins d'énergie pour produire et transporter de nouvelles marchandises, ce qui réduit les émissions de dioxyde de carbone. Comme mes enfants le remarquent régulièrement, chaque fois que nous pensons à réutiliser, réparer ou recycler, nous jouons notre propre rôle, aussi modeste soit-il, dans la préservation de notre planète !
 
 
Dès lors, que pouvons-nous faire d'autre pour réduire notre empreinte carbone ?
 
De nos jours, la plupart des entreprises adoptent des politiques de développement durable et profitent de la vaste gamme d'outils, de ressources et de cadres de travail désormais disponibles pour les aider à mesurer et à générer des rapports sur leurs initiatives ESG. En outre, un nombre croissant d'entreprises publient du contenu relatif à leurs initiatives de développement durable en vue d'améliorer la transparence et la compréhension de leurs organisations et d'améliorer la perception de leurs marques. La célèbre entreprise technologique Apple a récemment réalisé une vidéo détaillée afin d'informer le monde sur ses progrès concernant ses objectifs environnementaux. Le jour même de sa publication, la vidéo a généré plus de 500 000 vues sur « X », la plateforme anciennement connue sous le nom de Twitter.
 
Le passage aux énergies renouvelables et la réduction de la consommation constituent la première étape essentielle pour réduire les émissions de carbone. Toutefois, pour que cette stratégie soit efficace, vous devez d'abord identifier votre consommation actuelle, définir des objectifs et mesurer votre progression. Voyez cela un peu comme un régime alimentaire… Si vous ne connaissez pas votre poids de départ ou le nombre de calories que vous consommez chaque jour, vous ne parviendrez probablement pas à atteindre vos objectifs.
 
Lors de l'Ethical Business Summit récemment organisé par l'ATC (Association of Translation Companies), le mantra « Progress, not perfection » (Visez le progrès, et non la perfection), tiré d'un discours d'ouverture de Dallas Consulting, m'a interpellé. La recherche de la perfection se soldera sans doute par un échec, mais une accumulation de petits objectifs et de réussites fera au final une grande différence. 
 
Migrer des plateformes logicielles vers le cloud public, en faisant appel à des fournisseurs responsables ayant pour objectif la neutralité carbone, peut avoir un impact significatif. Les fournisseurs de cloud sont intrinsèquement plus efficaces. Après tout, leur rentabilité dépend directement de leur efficacité. Il est donc dans l'intérêt d'un fournisseur de cloud d'investir dans une technologie de pointe et de mettre en œuvre une surveillance pour s'assurer que le matériel est utilisé efficacement afin d'optimiser les capacités. Les statistiques tendent à démontrer que 20 % des serveurs rack ne sont pas entièrement exploités, ou pire encore, qu'ils ne sont pas exploités du tout. Dans la mesure où il implique une externalisation des dépenses, le paysage du cloud est constamment passé au crible par les équipes chargées des achats, mais les serveurs autohébergés et gérés ont tendance à passer inaperçus.
 
 
Comment l'IA s'intègre-t-elle dans votre initiative de développement durable ?
 
Dire que l'IA a décollé ces derniers temps serait l'euphémisme de l'année. Le potentiel de l'IA ne connaît aucune limite et les avantages sont déjà perçus et utilisés par de nombreux utilisateurs. Toutefois, cette technologie présente un coût caché que nous devons prendre en compte en matière de développement durable et qui n'est pas évident à première vue.
 
L'entraînement de grands modèles linguistiques nécessite une puissance de calcul considérable. Par exemple, l'entraînement de GPT-3 aurait généré près de 500 tonnes d'émissions de dioxyde de carbone. Concrètement, cela équivaut à parcourir plus de 2 millions de kilomètres avec un véhicule de tourisme à essence ou à recharger 67 millions de smartphones.
 
L'intégration de l'IA et des grands modèles linguistiques dans les moteurs de recherche les plus populaires fait actuellement l'objet de débats. D'après les estimations, l'ajout de l'IA générative nécessitera une puissance de calcul 4 à 5 fois supérieure pour chaque recherche. Actuellement, ChatGPT compte environ 13 millions d'utilisateurs par jour, tandis qu'un moteur de recherche classique traite 500 millions de recherches par jour !
 
Nous devons également prendre en compte le matériel nécessaire pour générer des modèles d'IA. Les modèles d'IA générative les plus connus sont généralement traités par des fournisseurs « hyperscale » qui nécessitent des milliers de serveurs équipés de processeurs graphiques. Ces derniers ont également pris une nouvelle forme depuis le minage de cryptomonnaie et l'apprentissage automatique, la demande ayant dépassé la capacité de production pendant un certain temps. Les processeurs graphiques sont parfaitement adaptés à l'apprentissage automatique, car ils peuvent gérer d'énormes ensembles de données et utiliser des algorithmes complexes plus efficacement et en parallèle. Il existe toutefois une contrepartie concernant l'énergie nécessaire pour alimenter les processeurs graphiques.
 
Les centres de données représentent actuellement environ 1 à 3 % des émissions de gaz à effet de serre dans le monde entier, mais les estimations indiquent qu'ils ne seront pas en mesure de faire face à la demande croissante d'IA générative du fait de l'intégration de cette dernière aux moteurs de recherche les plus répandus.
 
Nous commençons à constater un changement d'état d'esprit et une évolution croissante de la dynamique lorsqu'il s'agit de créer de nouveaux centres de données. Par exemple, lors du Ethical Business Summit de l'ATC, Christos Ellinides, directeur général de la traduction à la Commission européenne, a déclaré que neuf centres de données sont en cours de configuration pour héberger des supercalculateurs en Europe et qu'ils fonctionneront principalement grâce à l'énergie verte. À titre d'illustration, un centre de données construit au Luxembourg utilise 100 % d'énergie verte, produite à partir de déchets ligneux, pour refroidir et alimenter le supercalculateur.
 
 
Pourquoi l'IA utilise-t-elle autant de puissance de traitement ? 
 
La formation initiale d'un modèle d'IA générative est la partie la plus intensive d'un processus. L'entraînement d'un seul grand modèle linguistique consomme autant d'énergie et génère la même empreinte carbone qu'un vol commercial transatlantique. Une fois entraînés, ces modèles nécessitent moins d'énergie pour répondre aux invites des utilisateurs, mais le nombre de sessions d'invites ne cesse d'augmenter.
 
Nous assistons également à une forte augmentation du nombre de variantes Open Source de grands modèles linguistiques, car les entreprises s'évertuent à devenir leaders dans ce domaine. L'Open Source regorge d'innovations : il offre un choix de modèles qu'il rend accessibles à un public plus large. Cependant, du point de vue du développement durable, cela se traduit par un plus grand nombre d'entreprises qui cherchent à créer ou à affiner leurs propres modèles, ce qui conduit à une augmentation de la demande énergétique. La nature décentralisée de cette tendance implique que cette responsabilité ne repose pas seulement entre les mains de quelques entreprises. Toutes les actions et initiatives visant à réduire l'empreinte carbone doivent donc être mises à la disposition d'un plus grand nombre d'organisations.
 
De nombreuses recherches sont en cours pour comprendre la meilleure approche à adopter lors de la définition d'une stratégie de grands modèles linguistiques. Nous commençons à nous poser les questions suivantes : quelle serait la taille optimale ? Est-il préférable de construire à partir d'un grand modèle linguistique ou d'utiliser un modèle commercial ? Je constate beaucoup de similitudes avec ce que le secteur des langues a connu lorsque les mémoires de traduction ont vu le jour il y a quelques années, les professionnels du secteur cherchant alors à perfectionner leur stratégie de mémoire de traduction. L'apparition des grands modèles linguistiques relance ce débat, car nous pouvons commencer à exploiter le potentiel de l'IA générative pour compléter, former et améliorer les ressources de traduction traditionnelles, telles que les mémoires de traduction, la terminologie et la traduction automatique.
 
 
Que peuvent faire les entreprises technologiques d'IA pour améliorer la situation ?
 
Des recherches sont en cours pour comprendre comment réduire la puissance de calcul nécessaire pour travailler sur de nouvelles données. Cependant, il est déjà évident que peaufiner ou dispenser une formation spécialisée à un grand modèle linguistique existant coûte moins cher que d'en créer un de toutes pièces.
 
Il existe également un point de vue divergent à prendre en compte, selon lequel les questions ESG occuperaient désormais une place trop importante. Cela se traduirait par certains excès au sein des organisations, où les pratiques ESG sont adoptées comme un signe de vertus, parfois au détriment de l'orientation commerciale et des avancées technologiques. 
 
Il est donc essentiel de trouver le bon équilibre entre valeur et précision. Si l'on mesure le coût d'amélioration de la précision d'un modèle de 1 à 2 % en tonnes de gaz à effet de serre, nous devons nous demander si cela justifie les gains réalisés. Dans certains domaines et pour certains flux de contenu, il est essentiel de s'efforcer d'obtenir une précision supplémentaire de 1 à 2 %, mais dans d'autres cas, les avantages peuvent être minimes.
 
 
Qu'en est-il des professionnels de la localisation ? Que peuvent-ils faire ?
 
Choisir le bon fournisseur constitue la première étape du processus. De nombreux centres de données se sont engagés à réduire les émissions de carbone, mais nous devons les obliger à rendre des comptes dans ce domaine. Trados Enterprise dépend d'AWS en matière d'hébergement. AWS vise un fonctionnement alimenté à 100 % en énergie renouvelable d'ici 2030, un objectif qu'il est actuellement en passe d'atteindre d'ici 2025. L'entreprise aspire également à atteindre le net zéro en matière d'émissions de carbone d'ici 2040.
 
Travailler avec des fournisseurs responsables peut aussi vous aider à atteindre vos propres objectifs de réduction des émissions de carbone. Il est donc essentiel d'inclure cet élément dans vos critères de sélection. Si le passage au cloud public n'est pas envisageable, songez à un centre de données responsable plutôt qu'à des serveurs autogérés.
 
L'IA est en train de changer le monde dans lequel nous vivons, et je ne cherche pas à décourager quiconque de prendre part à cette expérience. Cependant, nous pouvons tous veiller à utiliser l'IA de manière responsable et garder à l'esprit les implications environnementales de nos choix.
 
Tirez parti de l'innovation de l'IA tout en vous assurant qu'elle apporte une réelle valeur ajoutée. Le marché est saturé de fonctionnalités d'IA qui prétendent toutes être la meilleure solution. Il s'agit d'un effet indésirable et inévitable lorsqu'une technologie se développe à une vitesse aussi rapide que celle observée avec l'IA. Lorsque vous évaluez une nouvelle fonctionnalité, posez-vous les questions suivantes : 
  • Cela m'aidera-t-il à réaliser des économies ?
  • Cela contribuera-t-il à améliorer la qualité ?
  • Cela permettra-t-il de gagner en efficacité ?
Si la réponse à toutes ces questions est « non », alors cette fonctionnalité peut très certainement être ignorée, car elle partira sûrement en fumée le 5 novembre prochain.
Ian Parnell
Rédaction

Ian Parnell

Responsable produits senior

Ian Parnell est responsable produits senior au sein du groupe RWS. En 2005, Ian a rejoint SDL en tant que responsable du support technique pour son tout nouveau système de gestion des projets de traduction (TMS). Depuis, il a occupé différents postes, tous centrés sur les technologies de gestion des projets de traduction.


Fort de près de vingt ans d'expérience dans le secteur de la localisation, Ian travaille en étroite collaboration avec certaines des plus grandes entreprises du monde dans un large éventail de secteurs. Pendant son temps libre, Ian aime se promener en famille dans le Peak District, jouer au golf et soutenir son club de football local, Sheffield Wednesday.

Tous les articles de Ian Parnell