Nvidia, ya líder del mercado en proporcionar procesadores de alta gama para el uso de AI generativa, lanzará un chip aún más potente a medida que la demanda para ejecutar modelos AI grandes continúa.
La compañía anunció la disponibilidad del superchip GH200, que Nvidia afirmó puede manejar "las cargas de trabajo generativas de AI más complejas, que abarcan grandes modelos de lenguaje, sistemas de recomendación y bases de datos vectoriales".
El GH200 tendrá la misma GPU que el H100, actualmente la oferta de AI más potente y popular de Nvidia, pero triplicará la capacidad de memoria. La compañía dijo que los sistemas que funcionan con GH200 comenzarán en el segundo trimestre de 2024.
Nvidia no reveló el precio del GH200; la línea H100 se vende actualmente por aproximadamente $40,000.
Los modelos de AI complejos requieren GPUs potentes para que el sistema pueda realizar los cálculos necesarios para generar texto o una foto de un caballo en el estilo de Banksy. Ejecutar estos modelos requiere una gran cantidad de capacidad de procesamiento, e incluso con los chips H100 de Nvidia, algunos tienen que "dividir" los modelos entre otras GPUs solo para ejecutarlos.
Nvidia tiene casi un monopolio en las GPUs de AI generativas. Los proveedores de servicios en la nube como AWS, Azure y Google utilizan todas las GPUs de núcleo tensorial H100 de Nvidia y agregan servicios para ayudar a los clientes a poner en marcha proyectos que utilizan grandes modelos de lenguaje para diferenciarse.
Microsoft y Nvidia también se han asociado para construir supercomputadoras, a pesar de que Microsoft en sí mismo supuestamente busca fabricar chips de AI.
Nvidia también enfrenta competencia de AMD, que desea aumentar la producción de su propia GPU de AI en el cuarto trimestre de este año.