Hasta hace unos años, construir un chip de inteligencia artificial propio era una apuesta reservada a Google y a algún otro gigante con recursos casi ilimitados. Hoy es una prioridad estratégica para la mayoría de los grandes actores del sector. Según estimaciones del mercado, los servidores de IA basados en chips ASIC —circuitos diseñados para una tarea específica, en este caso operaciones de IA— alcanzarían el 27,8% de los envíos totales de servidores de IA en 2026, el nivel más alto desde 2023, con un crecimiento interanual de 44,6% en los envíos de estos chips personalizados. Detrás de ese número hay una lógica concreta: a escala masiva, un chip propio puede reducir entre 50% y 67% el costo por token frente a una GPU de propósito general.
Por qué la inferencia cambió el cálculo
El impulso no viene del entrenamiento de modelos —la fase intensiva que todavía depende en gran medida de GPUs— sino de la inferencia, es decir, el proceso de responder consultas en tiempo real. A medida que los productos de IA escalan a decenas o cientos de millones de usuarios activos, el costo de cada respuesta se vuelve el principal factor de rentabilidad. Diseñar un ASIC orientado a inferencia puede costar entre 10 millones y más de 100 millones de dólares, pero para una empresa que consume cómputo a escala de hyperscaler, ese gasto se recupera con relativa rapidez si el chip es eficiente. La lógica es similar a la que llevó a los grandes bancos a construir su propia infraestructura de redes hace décadas: a cierta escala, dejar de depender de proveedores externos y diseñar la herramienta para el uso propio termina siendo más barato.
Otro factor es el control del suministro. La escasez relativa de GPUs de Nvidia durante 2023 y 2024 mostró cuán vulnerable puede ser una empresa cuando su capacidad de cómputo depende de un tercero. Los hyperscalers buscan diversificar su base de silicio y reservar capacidad propia sin quedar expuestos a los tiempos y precios de Nvidia.
Google como referente y Broadcom como socio clave
Google es el caso más maduro del sector. La compañía lleva más de una década desarrollando sus TPUs (Tensor Processing Units, chips especializados para operaciones de redes neuronales) y ya despliega la sexta generación de la familia, llamada Trillium, tanto en sus propios centros de datos como en Google Cloud. Estimaciones sectoriales sitúan a los chips de Google en más del 70% del mercado de servidores de IA en nube basados en ASIC, aunque ese dato proviene de análisis de la industria y no de cifras oficiales publicadas por la empresa.
Broadcom, por su parte, se consolida como el socio industrial de referencia para quien quiere diseñar un chip propio pero no tiene la infraestructura interna para fabricarlo. La empresa aparece vinculada a múltiples iniciativas de hyperscalers como habilitador técnico y de diseño, lo que la convierte en uno de los grandes beneficiarios del auge ASIC independientemente de qué empresa gane la carrera en software o modelos.
OpenAI entra al juego del hardware
Uno de los movimientos más comentados del sector es el desarrollo del primer chip propio de OpenAI. La compañía estaría trabajando en un ASIC de IA en el marco de una asociación valorada en 10.000 millones de dólares con Broadcom. El equipo de diseño estaría liderado por Richard Ho, ex ejecutivo de Alphabet, y contaría con alrededor de 40 ingenieros dedicados. La fabricación estaría prevista en TSMC, la fundición taiwanesa que produce la mayor parte de los chips avanzados del mundo. El objetivo inicial era tener resultados en el segundo trimestre de 2026, pero el calendario se habría corrido al menos hasta el tercer trimestre. El chip apuntaría principalmente a cargas de inferencia, en línea con la tendencia del sector.
Es relevante aclarar que ni OpenAI ni Broadcom confirmaron oficialmente estos detalles en comunicados formales. La información surge de reportes periodísticos y debe leerse como tal: datos con alta credibilidad en el ecosistema, pero sin anuncio oficial de las compañías.
Meta, Amazon y Microsoft también avanzan
Meta tiene su propio proyecto bajo el nombre MTIA (Meta Training and Inference Accelerator), orientado a mejorar la eficiencia de su infraestructura interna para cargas de IA. La empresa ha invertido públicamente en infraestructura de IA a gran escala, y el desarrollo de chips propios forma parte de esa estrategia.
Además, fuentes del sector reportaron conversaciones avanzadas entre Meta y Google para que Meta despliegue TPUs de Google por miles de millones de dólares, con inicio posible desde mediados de 2026 y posibles instalaciones on-premises para 2027. Ese movimiento, si se concreta, sería inusual: Meta usaría chips diseñados por un competidor directo en lugar de su propia infraestructura o la de Nvidia. El dato aún no tiene confirmación oficial de las compañías.
Amazon Web Services opera con sus chips Trainium e Inferentia para cargas de IA dentro de su nube, y Microsoft tiene su propio proyecto de chip denominado Maia. Ambas compañías comparten la misma lógica: reducir la dependencia de GPUs de terceros para las cargas más predecibles y repetitivas, que son justamente las de inferencia a escala.
El contexto financiero detrás de toda esta actividad es enorme. Estimaciones del sector calculaban que, ya desde mediados de 2024, el gasto combinado en centros de datos, chips e infraestructura eléctrica asociada a IA superaba el billón de dólares en compromisos de inversión de las principales corporaciones tecnológicas y de utilities. Ese nivel de inversión hace que el costo por unidad de cómputo sea uno de los factores más críticos para la rentabilidad del negocio de IA, lo que explica por qué el diseño de chips propios dejó de ser una curiosidad técnica y se convirtió en una prioridad de negocio.
La narrativa del sector no es GPU versus ASIC. La mayoría de los expertos y análisis disponibles coinciden en que la infraestructura de IA en 2026 es una combinación de ambos: GPUs para entrenamiento y casos de uso generales, ASICs para optimizar costos en cargas de inferencia a gran escala. Lo que está cambiando es la proporción y el lugar que ocupa cada uno en la estrategia de los hyperscalers. Que el porcentaje de ASIC llegue al 27,8% del mercado de servidores de IA este año, frente a niveles menores en años anteriores, refleja que esa segunda capa de infraestructura ya no es complementaria: es parte estructural del negocio.




