GTC-Amazon Web Services (AWS), société d’Amazon et l’israélien Nvidia viennent d’annoncer une collaboration en plusieurs parties visant à construire l’infrastructure d’intelligence artificielle (IA) à la demande la plus évolutive au monde, optimisée pour la formation de grands modèles de langage (LLM) de plus en plus complexes et pour le développement d’applications d’IA génératives.
« AWS et NVIDIA collaborent depuis plus de 12 ans pour fournir des solutions GPU à la demande, économiques et à grande échelle pour diverses applications telles que l’IA/ML, le graphisme, les jeux et le HPC « , a déclaré Adam Selipsky, CEO d’AWS. « AWS a une expérience inégalée dans la fourniture d’instances basées sur le GPU qui ont repoussé les limites de l’évolutivité avec chaque génération successive, de nombreux clients faisant évoluer les charges de travail d’apprentissage machine vers plus de 10 000 GPU aujourd’hui « .
« L’informatique accélérée et l’IA sont arrivées, et juste à temps. Le calcul accéléré permet d’accélérer les fonctions par étapes tout en réduisant les coûts et la puissance, car les entreprises s’efforcent de faire plus avec moins. L’IA générative a incité les entreprises à réimaginer leurs produits et leurs modèles commerciaux et à être le perturbateur et non le perturbé « , a déclaré Jensen Huang, fondateur et CEO de NVIDIA. » AWS est un partenaire de longue date et a été le premier fournisseur de services cloud à proposer les GPU NVIDIA. Nous sommes ravis d’associer notre expertise, notre échelle et notre portée pour aider les clients à exploiter l’informatique accélérée et l’IA générative pour saisir les énormes opportunités qui s’offrent à eux. »
Aujourd’hui, plus de 450 millions de personnes dans le monde utilisent Pinterest comme plateforme d’inspiration visuelle pour acheter des produits personnalisés à leur goût, trouver des idées à faire hors ligne et découvrir les créateurs les plus inspirants.
« Nous utilisons largement le deep learning à travers notre plateforme pour des cas d’utilisation tels que l’étiquetage et la catégorisation des milliards de photos qui sont téléchargées sur notre plateforme, et la recherche visuelle qui offre à nos utilisateurs la possibilité de passer de l’inspiration à l’action », a déclaré David Chaiken, architecte en chef chez Pinterest.
Les équipes d’ingénieurs de NVIDIA et d’AWS, expertes en thermique, électricité et mécanique, ont collaboré pour concevoir des serveurs capables d’exploiter les GPU pour fournir de l’IA à grande échelle, en mettant l’accent sur l’efficacité énergétique dans l’infrastructure d’AWS. Les GPU sont généralement 20 fois plus économes en énergie que les CPU pour certaines charges de travail d’IA, et le H100 est jusqu’à 300 fois plus efficace que les CPU pour les LLM.
En s’appuyant sur le travail d’AWS et de NVIDIA axé sur l’optimisation des serveurs, les sociétés ont commencé à collaborer sur les futures conceptions de serveurs pour augmenter l’efficacité de la mise à l’échelle avec les conceptions de systèmes de la génération suivante, les technologies de refroidissement et l’évolutivité du réseau.
Source : IndiaNews & Israël Valley (traduction et résumé)