Cerebras Systems, fabricante del chip más grande del mundo, anunció que su sistema CS-2 ahora es compatible con PyTorch y TensorFlow, lo que permite a los investigadores entrenar modelos con miles de millones de parámetros de manera rápida y sencilla.

El CS-2 de la compañía es el sistema de inteligencia artificial más rápido del mundo y funciona con su procesador Wafer-Scale Engine 2 (WSE-2). Con el lanzamiento de la versión 1.2 de Cerebras Software Platform (CSoft), el CS-2 ahora es compatible con marcos de aprendizaje automático adicionales que brindarán a los desarrolladores aún más opciones en lo que respecta a los tipos de modelos que desean ejecutar.

Emad Barsoum, director sénior de AI Framework en Cerebras Systems, explicó en un comunicado de prensa cómo CSoft ahora permite a los desarrolladores expresar modelos escritos en TensorFlow o PyTorch, diciendo:

«Desde el principio, nuestro objetivo era respaldar sin problemas el marco de aprendizaje automático en el que nuestros clientes querían escribir. Nuestros clientes escriben en TensorFlow y en PyTorch, y nuestra pila de software, CSoft, hace posible expresar rápida y fácilmente sus modelos en el marco de su elección. Al hacerlo, nuestros clientes tienen acceso a los 850,000 núcleos optimizados para IA y 40 gigabytes de memoria en chip del Cerebras CS-2».

Escalado de grandes modelos de lenguaje

CSoft versión 1.2 ahora permite a los desarrolladores escribir sus modelos en los marcos de código abierto de PyTorch o TensorFlow y ejecutarlos en Cerebras CS-2 sin ninguna modificación. Al mismo tiempo, un modelo de IA escrito para una GPU o una CPU puede ejecutarse en CSoft en el CS-2 sin ningún cambio.

Con el poder combinado de CS-2 y CSoft, los desarrolladores pueden escalar desde modelos pequeños como BERT hasta modelos existentes más grandes como GPT-3.

El entrenamiento de modelos grandes con una GPU es difícil y requiere mucho tiempo, mientras que el entrenamiento desde cero en nuevos conjuntos de datos a menudo lleva semanas y decenas de megavatios de potencia en grandes clústeres de equipos heredados. Además, a medida que aumenta el tamaño del clúster, la potencia, el costo y la complejidad aumentan exponencialmente.

Cerebras Systems construyó el CS-2 para enfrentar estos desafíos, y su sistema de inteligencia artificial puede configurar incluso los modelos más grandes en solo minutos. Dado que los desarrolladores pasan menos tiempo instalando, configurando y entrenando sus modelos con el CS-2, pueden explorar más ideas en incluso menos tiempo.

Share This