OpenAI da el salto al silicio: por dentro de 'Jalapeño', su primer chip personalizado
OpenAI y Broadcom presentaron Jalapeño, un ASIC solo de inferencia creado en nueve meses. Qué está confirmado y qué sigue siendo promesa del
Lo que OpenAI anunció realmente
OpenAI tiene su propio chip. El 24 de junio, la compañía y Broadcom presentaron Jalapeño, descrito como el primer procesador personalizado de OpenAI: un circuito integrado de aplicación específica (ASIC) diseñado a medida para ejecutar modelos de IA, no para entrenarlos. Tras más de un año de informaciones sobre que OpenAI trabajaba con Broadcom en silicio (los rumores circulaban ya en febrero de 2025, y la alianza se anunció formalmente en octubre de 2025), el primer producto concreto tiene ahora un nombre y una misión declarada.
El enfoque de ambas empresas es deliberado. Jalapeño no es un acelerador de entrenamiento reconvertido ni un procesador de IA de propósito general. Es un chip de inferencia: el tipo de silicio que sirve a escala las respuestas de un modelo ya terminado a los usuarios, millones de veces. Esa es la carga de trabajo que en realidad domina la factura de cómputo diaria de OpenAI, y es la que la compañía intenta ahora trasladar en parte a sus propias instalaciones.
Esto importa por una razón que va más allá del lanzamiento de un producto: es OpenAI bajando por la pila tecnológica. La compañía ya construye modelos de frontera, lanza productos para consumidores y desarrolladores, y se compromete con una enorme capacidad de centros de datos. Diseñar el chip que sustenta todo eso es el siguiente peldaño lógico, aunque costoso.
Un chip hecho para una sola tarea
El argumento a favor de Jalapeño se apoya en la especialización. OpenAI afirma que la arquitectura se moldeó a partir de su propio conocimiento de cómo se comportan los grandes modelos de lenguaje (LLM) en producción, y se orientó a los cuellos de botella prácticos de la inferencia a escala: el costoso movimiento de datos, el equilibrio entre cómputo y memoria, y la eficiencia de las redes. La cobertura de SiliconANGLE señala que el diseño "reduce el movimiento de datos" entre la lógica y la memoria externa al chip, e integra la tecnología de redes Tomahawk de Broadcom, el tejido conectivo que permite que miles de chips actúen como una sola máquina.
Aquí también hay una historia de hardware y software. OpenAI presenta a Jalapeño como lo bastante flexible para ejecutar cualquier LLM, no solo los suyos, y TechCrunch informa que la compañía apunta explícitamente a cargas de trabajo "desatendidas": destacó la inferencia en tiempo real de modelos de programación, el tráfico sensible a la latencia de autocompletado y agentes que se ha disparado a medida que los asistentes de programación se han convertido en un caso de uso estrella.
Según SiliconANGLE, OpenAI está construyendo racks de servidores personalizados para el chip con el fabricante de equipos para centros de datos Celestia, y posiciona a Jalapeño como "el primer paso de una plataforma de cómputo de varias generaciones". En otras palabras, esto no es un proyecto científico aislado; es la jugada de apertura de una hoja de ruta.
Nueve meses, con IA ayudando a diseñar IA
La afirmación más llamativa del anuncio tiene que ver con la velocidad. OpenAI dice que Jalapeño pasó del diseño inicial al tape-out de fabricación en aproximadamente nueve meses, lo que califica como posiblemente el ciclo de desarrollo más rápido jamás logrado para un semiconductor avanzado de alto rendimiento. El tape-out —el momento en que un diseño terminado se entrega a la fábrica— suele medirse en años para un chip tan ambicioso, así que el plazo, de ser exacto, es genuinamente agresivo.
Parte de la explicación es recursiva: OpenAI dice que usó sus propios modelos para acelerar partes del proceso de diseño y optimización. Es una narrativa pulcra —IA ayudando a construir los chips que ejecutan IA— y resulta plausible dado cuánto del diseño moderno de chips es búsqueda, verificación y generación de código. Pero también es exactamente el tipo de afirmación difícil de verificar de forma independiente, y OpenAI no ha detallado qué pasos se automatizaron ni cuánto tiempo se ahorró en realidad.
La cuestión de Nvidia
La lógica estratégica es sencilla y no es exclusiva de OpenAI. Toda la industria depende de las GPU de Nvidia, que son escasas, consumen mucha energía y son caras. Construir un chip ajustado a una tarea más estrecha —la inferencia— es la manera de recuperar margen y suministro. Google lo ha hecho durante años con sus TPU; Amazon tiene sus líneas Inferentia y Trainium. Que OpenAI se sume a ese club es menos una sorpresa que un hito.
Y algo crucial: esto es diversificación, no divorcio. TechCrunch señala que el trabajo más pesado de preentrenamiento "probablemente" seguirá ejecutándose en hardware de Nvidia en el futuro previsible. Jalapeño apunta al lado del servicio, donde la economía del rendimiento por vatio se acumula más rápido porque los chips funcionan de forma constante. Incluso una ventaja modesta de eficiencia en inferencia, multiplicada por toda una flota, puede mover dinero real, y es precisamente por eso que OpenAI, Google y Amazon van todos tras ella.
Conviene mantener honestas las cuentas de la dependencia: un chip de inferencia personalizado alivia un tipo de dependencia de Nvidia, mientras el apetito de entrenamiento de OpenAI —y sus compromisos de cómputo más amplios— sigue creciendo. El titular de "reducir la dependencia de Nvidia" es cierto de un modo específico y acotado.
La promesa frente a lo confirmado
Aquí es donde la cautela editorial se gana el sueldo, porque el anuncio abunda en intenciones y escasea en cifras.
La afirmación central de rendimiento es que las pruebas iniciales muestran un "rendimiento por vatio significativamente mejor que el estado del arte actual". Léase con atención. Es por vatio, no rendimiento bruto; proviene de "pruebas iniciales", no de producción desplegada; y la referencia del "estado del arte" nunca se nombra. No hay un benchmark publicado, ni una tabla comparativa, ni verificación de terceros. Es una afirmación del fabricante sobre un chip que, según las propias empresas, aún no está desplegado.
Otros datos concretos simplemente están ausentes de las fuentes aquí revisadas. La cobertura describe a Jalapeño como un ASIC grande, del tamaño de una retícula, pero no se revelaron el nodo de proceso, la fundición, la configuración de memoria ni la escala de despliegue. El superlativo del "ciclo de ASIC más rápido de la historia" es la propia caracterización de OpenAI, no un récord confirmado de forma independiente. Y el plazo es un objetivo: SiliconANGLE informa que el despliegue inicial está previsto para finales de 2026, lo que significa que, a día de hoy, Jalapeño es un diseño probado y una intención declarada, no silicio funcionando en un centro de datos en vivo.
Nada de esto vacía el anuncio. Un primer chip personalizado con un socio creíble y una hoja de ruta de varias generaciones es un movimiento sustancial. Pero la distancia entre "construimos un chip con grandes cifras de eficiencia iniciales" y "estamos sirviendo tráfico de producción más barato que con Nvidia" es exactamente la distancia que los próximos seis meses cerrarán o pondrán al descubierto.
En resumen
A Jalapeño conviene leerlo como una declaración de intenciones respaldada por ingeniería real. OpenAI ha pasado de comprar cómputo a diseñar el silicio que sirve sus modelos: una jugada de integración vertical que refleja lo que Google y Amazon ya hacen, y que apunta a la carga de trabajo (la inferencia, especialmente para agentes de programación sensibles a la latencia) donde la economía aprieta más fuerte.
Lo confirmado es significativo: un ASIC de inferencia codesarrollado, un camino al tape-out inusualmente rápido de nueve meses, la tecnología de redes de Broadcom, racks personalizados y un objetivo de despliegue para finales de 2026. Lo no confirmado es todo aquello que permitiría a un observador externo juzgarlo: benchmarks independientes, la referencia de comparación, los detalles de fabricación y el coste real por token en producción. El titular del rendimiento por vatio es una afirmación del fabricante a partir de pruebas iniciales, y debería tratarse como tal hasta que los chips estén realmente sirviendo tráfico.
Por ahora, el veredicto honesto es que OpenAI ha dado un paso serio hacia la propiedad de su pila de inferencia, y que la prueba no llegará en un comunicado de prensa, sino en lo que sea que Jalapeño haga una vez que esté realmente desplegado.
