Los chips ASIC propios ganan terreno en IA y apuntan al 28% del mercado en 2026

21 de mayo de 2026

Hasta hace unos años, construir un chip de inteligencia artificial propio era una apuesta reservada a Google y a algún otro gigante con recursos casi ilimitados. Hoy es una prioridad estratégica para la mayoría de los grandes actores del sector. Según estimaciones del mercado, los servidores de IA basados en chips ASIC —circuitos diseñados para una tarea específica, en este caso operaciones de IA— alcanzarían el 27,8% de los envíos totales de servidores de IA en 2026, el nivel más alto desde 2023, con un crecimiento interanual de 44,6% en los envíos de estos chips personalizados. Detrás de ese número hay una lógica concreta: a escala masiva, un chip propio puede reducir entre 50% y 67% el costo por token frente a una GPU de propósito general.

Por qué la inferencia cambió el cálculo

El impulso no viene del entrenamiento de modelos —la fase intensiva que todavía depende en gran medida de GPUs— sino de la inferencia, es decir, el proceso de responder consultas en tiempo real. A medida que los productos de IA escalan a decenas o cientos de millones de usuarios activos, el costo de cada respuesta se vuelve el principal factor de rentabilidad. Diseñar un ASIC orientado a inferencia puede costar entre 10 millones y más de 100 millones de dólares, pero para una empresa que consume cómputo a escala de hyperscaler, ese gasto se recupera con relativa rapidez si el chip es eficiente. La lógica es similar a la que llevó a los grandes bancos a construir su propia infraestructura de redes hace décadas: a cierta escala, dejar de depender de proveedores externos y diseñar la herramienta para el uso propio termina siendo más barato.

Otro factor es el control del suministro. La escasez relativa de GPUs de Nvidia durante 2023 y 2024 mostró cuán vulnerable puede ser una empresa cuando su capacidad de cómputo depende de un tercero. Los hyperscalers buscan diversificar su base de silicio y reservar capacidad propia sin quedar expuestos a los tiempos y precios de Nvidia.

Google como referente y Broadcom como socio clave

Google es el caso más maduro del sector. La compañía lleva más de una década desarrollando sus TPUs (Tensor Processing Units, chips especializados para operaciones de redes neuronales) y ya despliega la sexta generación de la familia, llamada Trillium, tanto en sus propios centros de datos como en Google Cloud. Estimaciones sectoriales sitúan a los chips de Google en más del 70% del mercado de servidores de IA en nube basados en ASIC, aunque ese dato proviene de análisis de la industria y no de cifras oficiales publicadas por la empresa.

Broadcom, por su parte, se consolida como el socio industrial de referencia para quien quiere diseñar un chip propio pero no tiene la infraestructura interna para fabricarlo. La empresa aparece vinculada a múltiples iniciativas de hyperscalers como habilitador técnico y de diseño, lo que la convierte en uno de los grandes beneficiarios del auge ASIC independientemente de qué empresa gane la carrera en software o modelos.

OpenAI entra al juego del hardware

Uno de los movimientos más comentados del sector es el desarrollo del primer chip propio de OpenAI. La compañía estaría trabajando en un ASIC de IA en el marco de una asociación valorada en 10.000 millones de dólares con Broadcom. El equipo de diseño estaría liderado por Richard Ho, ex ejecutivo de Alphabet, y contaría con alrededor de 40 ingenieros dedicados. La fabricación estaría prevista en TSMC, la fundición taiwanesa que produce la mayor parte de los chips avanzados del mundo. El objetivo inicial era tener resultados en el segundo trimestre de 2026, pero el calendario se habría corrido al menos hasta el tercer trimestre. El chip apuntaría principalmente a cargas de inferencia, en línea con la tendencia del sector.

Es relevante aclarar que ni OpenAI ni Broadcom confirmaron oficialmente estos detalles en comunicados formales. La información surge de reportes periodísticos y debe leerse como tal: datos con alta credibilidad en el ecosistema, pero sin anuncio oficial de las compañías.

Meta, Amazon y Microsoft también avanzan

Meta tiene su propio proyecto bajo el nombre MTIA (Meta Training and Inference Accelerator), orientado a mejorar la eficiencia de su infraestructura interna para cargas de IA. La empresa ha invertido públicamente en infraestructura de IA a gran escala, y el desarrollo de chips propios forma parte de esa estrategia.

Además, fuentes del sector reportaron conversaciones avanzadas entre Meta y Google para que Meta despliegue TPUs de Google por miles de millones de dólares, con inicio posible desde mediados de 2026 y posibles instalaciones on-premises para 2027. Ese movimiento, si se concreta, sería inusual: Meta usaría chips diseñados por un competidor directo en lugar de su propia infraestructura o la de Nvidia. El dato aún no tiene confirmación oficial de las compañías.

Amazon Web Services opera con sus chips Trainium e Inferentia para cargas de IA dentro de su nube, y Microsoft tiene su propio proyecto de chip denominado Maia. Ambas compañías comparten la misma lógica: reducir la dependencia de GPUs de terceros para las cargas más predecibles y repetitivas, que son justamente las de inferencia a escala.

El contexto financiero detrás de toda esta actividad es enorme. Estimaciones del sector calculaban que, ya desde mediados de 2024, el gasto combinado en centros de datos, chips e infraestructura eléctrica asociada a IA superaba el billón de dólares en compromisos de inversión de las principales corporaciones tecnológicas y de utilities. Ese nivel de inversión hace que el costo por unidad de cómputo sea uno de los factores más críticos para la rentabilidad del negocio de IA, lo que explica por qué el diseño de chips propios dejó de ser una curiosidad técnica y se convirtió en una prioridad de negocio.

La narrativa del sector no es GPU versus ASIC. La mayoría de los expertos y análisis disponibles coinciden en que la infraestructura de IA en 2026 es una combinación de ambos: GPUs para entrenamiento y casos de uso generales, ASICs para optimizar costos en cargas de inferencia a gran escala. Lo que está cambiando es la proporción y el lugar que ocupa cada uno en la estrategia de los hyperscalers. Que el porcentaje de ASIC llegue al 27,8% del mercado de servidores de IA este año, frente a niveles menores en años anteriores, refleja que esa segunda capa de infraestructura ya no es complementaria: es parte estructural del negocio.

+ Temas relacionados
Internacionales
Tecnología

Artículo anterior

El agro frenó al dólar, pero reservas netas y tasas reales siguen en foco

Artículo siguiente

El vino rebota en ventas, pero el consumo se mueve hacia las categorías más baratas

MAS COMENTADAS

DEJA UNA RESPUESTA Cancelar respuesta

Por favor ingrese su comentario!

Por favor ingrese su nombre aquí

¡Has introducido una dirección de correo electrónico incorrecta!

Por favor ingrese su dirección de correo electrónico aquí

Los chips ASIC propios ganan terreno en IA y apuntan al 28% del mercado en 2026

Por qué la inferencia cambió el cálculo

Google como referente y Broadcom como socio clave

OpenAI entra al juego del hardware

Meta, Amazon y Microsoft también avanzan

Escándalo en Italia: un piloto de Fórmula 1 aparece en las escuchas de una red de prostitución VIP

Bitcoin sube por sexta vez en siete ruedas y llega a su mayor valor en tres meses

Huawei dice que llegará a chips de 1,4 nm en 2031 sin litografía EUV

DEJA UNA RESPUESTA Cancelar respuesta

MAS VISTAS

El pozo creció hasta que Casilda lo cobró: $2.336 millones!

Microsoft reduce tiempos de carga en juegos de 90 segundos a 4 con shaders precompilados

Icardi y la China Suárez reforzaron su vínculo con una cena íntima en Estambul

Códigos de Free Fire Max para hoy, 30 de enero: listado y guía para canjear recompensas en el portal de premios

COMENTARIOS RECIENTES

SEGUINOS