Microsoft presenta Maia 200, el chip con el que refuerza su apuesta por la IA en la nube

Última actualización: 30/01/2026
Autor: Isaac
  • Maia 200 es el nuevo chip de inferencia de Microsoft para IA generativa en Azure, fabricado en 3 nm y con más de 140.000 millones de transistores.
  • Ofrece una mejora de hasta el 30% en rendimiento por coste frente al hardware anterior de Microsoft y compite directamente con Amazon Trainium y Google TPU.
  • Se integra en servicios clave como Microsoft 365 Copilot, Foundry y los modelos GPT más recientes de OpenAI, además de usarse para generar datos sintéticos.
  • El chip ya se despliega en centros de datos de Azure en Estados Unidos y refuerza la estrategia de Microsoft de desarrollar su propio silicio para IA.

Chip de inteligencia artificial Maia 200

La nueva generación de chips para inteligencia artificial de Microsoft ya está en marcha. Con Maia 200, la compañía da un paso más en su estrategia de controlar el hardware que impulsa sus servicios de IA, reduciendo su dependencia de proveedores externos y ajustando mejor los costes de operación de sus centros de datos.

Este nuevo acelerador está orientado por completo a la inferencia de modelos de gran tamaño, es decir, a la fase en la que los sistemas de IA ya entrenados responden a consultas en tiempo real. En un momento en el que la demanda de servicios basados en IA generativa se dispara y la presión sobre la infraestructura en la nube es cada vez mayor, Maia 200 se presenta como una pieza clave en el puzle tecnológico de Microsoft.

Un chip propio para la carrera de la inteligencia artificial

Acelerador Maia 200 para centros de datos

Microsoft ha confirmado que Maia 200 es la segunda generación de su chip de inteligencia artificial, lanzado dos años después del Maia 100, un primer intento que no llegó a abrirse al público general. Ahora, la compañía sí sitúa este nuevo modelo en el centro de su oferta de infraestructura en la nube, con la vista puesta en competir de tú a tú con Google y Amazon.

Según la empresa, Maia 200 está optimizado específicamente para tareas de inferencia y se incorpora como un acelerador interno dentro de Azure. Su objetivo es claro: ejecutar modelos de IA de forma más rápida y rentable, al tiempo que se reduce la dependencia de Nvidia, que hasta ahora dominaba el mercado de chips para estos usos.

Scott Guthrie, responsable de nube e inteligencia artificial en Microsoft, ha llegado a describirlo como “el sistema de inferencia más eficiente” que la compañía ha desplegado hasta la fecha, subrayando el papel que tendrá en la nueva generación de servicios basados en IA. El anuncio se enmarca en una carrera global por liderar la infraestructura que sostiene la inteligencia artificial generativa, un negocio que ya mueve miles de millones de euros.

En la práctica, Maia 200 se integra en la arquitectura heterogénea de IA de Azure, donde convivirá con otros tipos de hardware y aceleradores. Este enfoque permite a Microsoft elegir en cada caso la plataforma más adecuada para un modelo concreto, combinando chips propios y de terceros en función de las necesidades de rendimiento y coste.

Tecnología de 3 nanómetros y más de 140.000 millones de transistores

Detalle del hardware Maia 200

En el plano técnico, Maia 200 se ha fabricado con el proceso de 3 nanómetros de TSMC (Taiwan Semiconductor Manufacturing Company), uno de los más avanzados disponibles actualmente a gran escala. Este salto de nodo permite integrar una enorme densidad de componentes en cada chip.

  Lyon avanza en soberanía digital con la adopción de software de código abierto

Cada unidad de Maia 200 supera los 140.000 millones de transistores, acompañados de núcleos especializados para cálculos en formatos de baja precisión, como FP4 y FP8, muy habituales en inferencia de modelos de lenguaje y visión. Según las cifras facilitadas por Microsoft, el chip puede alcanzar más de 10 petaFLOPS en FP4 y alrededor de 5 petaFLOPS en FP8, siempre con un consumo que se mantiene dentro de los márgenes habituales de los grandes aceleradores de IA.

Esta capacidad de cálculo se centra en cargas de trabajo que necesitan procesar enormes cantidades de datos con latencias muy bajas, como asistentes conversacionales, motores de búsqueda enriquecidos con IA o herramientas de productividad con generación de contenido. La empresa insiste en que el diseño prioriza tanto el rendimiento bruto como la eficiencia económica, un equilibrio clave para mantener bajo control los costes de la nube.

Además de la potencia de cómputo, uno de los puntos fuertes del diseño es el tratamiento de la memoria. El chip incluye 216 GB de memoria HBM3e que alcanzan hasta 7 TB/s de ancho de banda, combinados con 272 MB de SRAM integrada. Esta arquitectura busca evitar cuellos de botella en el suministro de datos a los núcleos de cálculo, algo crítico cuando se manejan modelos de lenguaje de gran tamaño que consumen enormes volúmenes de parámetros.

La propia Microsoft sostiene que, en términos prácticos, un nodo Maia 200 es capaz de ejecutar los modelos más grandes disponibles hoy en el mercado, dejando margen para modelos aún más ambiciosos en los próximos años. Esta capacidad es especialmente relevante en la hoja de ruta de la compañía junto a OpenAI y otros socios estratégicos.

Una arquitectura centrada en la inferencia y el flujo de datos

Más allá del chip en sí, Maia 200 se acompaña de una arquitectura de sistema que reorganiza el flujo de datos para evitar esperas innecesarias. El rediseño del subsistema de memoria, con HBM3e y SRAM integradas, se combina con motores de movimiento de datos capaces de mantener alimentados a los modelos de forma constante, reduciendo los tiempos muertos.

La compañía destaca que todo el conjunto se ha planteado pensando en cargas de trabajo multimodales, es decir, modelos que no solo procesan texto, sino también imágenes, audio o vídeo. Este tipo de sistemas híbridos, cada vez más habituales en aplicaciones avanzadas de IA, requieren un equilibrio fino entre cálculo, memoria y red.

En cuanto a la interconexión, Maia 200 se apoya en una red de dos niveles basada en Ethernet estándar, reforzada por una capa de transporte propia y una tarjeta de red integrada. Este enfoque permite escalar clústeres de inferencia a miles de aceleradores manteniendo un comportamiento predecible en las operaciones colectivas, algo importante para modelos distribuidos en muchos nodos.

Microsoft afirma que esta fórmula posibilita desplegar hasta 6.144 aceleradores Maia 200 en un mismo clúster, con un balance entre rendimiento, consumo energético y coste que busca ser competitivo frente a otras soluciones de la industria. La prioridad no es solo maximizar la potencia, sino conseguir que esa potencia se traduzca en respuestas más rápidas y baratas para los usuarios finales.

  Edge Computing en el Contact Center: Cómo la Inteligencia en el Borde Revoluciona la Experiencia del Cliente

Todo ello coloca a Maia 200 como una pieza pensada para la ejecución intensiva de modelos en producción, más que para las fases iniciales de entrenamiento. Es precisamente en la inferencia, donde se concentran millones de consultas diarias, donde se juegan buena parte de los márgenes de negocio de las plataformas de IA.

Ventaja en rendimiento por coste y comparación con Amazon y Google

Uno de los mensajes centrales del lanzamiento es la mejora del rendimiento por dólar (o por euro) frente al hardware previo de Microsoft. La compañía asegura que Maia 200 ofrece un incremento de aproximadamente un 30% en esta métrica frente a los aceleradores de última generación que ya utilizaba en su flota de centros de datos.

Este dato no solo tiene valor técnico, sino también económico: la eficiencia por coste se ha convertido en un indicador clave para decidir qué tipo de hardware se emplea en cada servicio de IA. En un contexto de fuerte presión sobre la demanda de chips avanzados y de costes energéticos al alza, cualquier mejora en esta variable puede marcar la diferencia.

Microsoft también ha querido situar a Maia 200 en el mapa frente a sus principales rivales. Según sus propias comparativas, el nuevo chip triplica el rendimiento en FP4 del Trainium de tercera generación de Amazon y ofrece un rendimiento en FP8 superior al de la séptima generación de los TPU de Google. Aunque estas cifras parten de datos aportados por la propia empresa, reflejan la intención de competir de forma directa en el terreno del silicio.

El objetivo no es cortar de golpe la relación con Nvidia, que sigue siendo un socio clave, sino avanzar hacia una diversificación de proveedores y tecnologías. De esta forma, Microsoft busca ganar margen de maniobra en precios, disponibilidad y diseño de sistemas, al mismo tiempo que posiciona sus propios chips como alternativa madura para múltiples cargas de trabajo.

Para los clientes europeos que operan sobre Azure, esta apuesta significa que, a medio plazo, parte de los servicios de IA que utilicen podrían ejecutarse sobre silicio diseñado por la propia Microsoft, con implicaciones tanto en costes como en capacidad de escalar proyectos complejos.

Integración con Azure, Copilot y los modelos de OpenAI

Maia 200 no se queda en un proyecto de laboratorio. Desde su lanzamiento, el chip se está integrando en servicios clave del ecosistema Microsoft. Entre ellos destaca Microsoft 365 Copilot, que lleva funciones de IA generativa a aplicaciones como Word, Excel, PowerPoint, Outlook o Teams.

Además, el nuevo acelerador se utilizará para ejecutar los modelos GPT más recientes de OpenAI, como la familia GPT-5.2, así como otros modelos fundacionales que Microsoft ofrece a través de Azure. El equipo de Microsoft Superintelligence, centrado en el desarrollo de sistemas avanzados de IA, también empleará Maia 200 para generar datos sintéticos y llevar a cabo tareas de aprendizaje por refuerzo, dos técnicas clave para mejorar el rendimiento y la robustez de los modelos internos.

Otro de los proyectos que se beneficiará del nuevo chip es Microsoft Foundry, plataforma orientada a la creación y despliegue de modelos personalizados para empresas y organizaciones. Al disponer de un hardware más eficiente, la compañía busca facilitar que más clientes puedan poner en producción modelos complejos sin disparar los costes.

  Apple prepara iOS 27 con nuevas herramientas de IA para la app Fotos

En conjunto, la integración vertical entre hardware propio, servicios en la nube y aplicaciones de usuario final permite a Microsoft optimizar el rendimiento de extremo a extremo. Este enfoque refuerza la idea de que la compañía quiere controlar todos los niveles de la cadena de valor de la IA, desde el silicio hasta las herramientas que se utilizan a diario en oficinas, administraciones públicas o centros educativos en Europa.

Para desarrolladores y equipos de investigación, la empresa ha anunciado también herramientas de acceso temprano y kits de desarrollo orientados a universidades y proyectos de código abierto, con el fin de fomentar un ecosistema de software que saque partido específico a las capacidades de Maia 200.

Despliegue en centros de datos y hoja de ruta futura

En esta primera fase, Maia 200 se está desplegando en centros de datos de Azure en Estados Unidos. Concretamente, ya está operativo en la región US Central, situada cerca de Des Moines (Iowa), y Microsoft ha adelantado que pronto llegará también a la región US West 3, en el entorno de Phoenix (Arizona).

El plan pasa por un despliegue gradual, que permita validar el rendimiento del chip y ajustar la infraestructura antes de su llegada a más zonas geográficas. Aunque la compañía no ha detallado aún un calendario para Europa, lo habitual en este tipo de productos es que, una vez se consolida la adopción en las primeras regiones, se extienda progresivamente a otras áreas clave, incluidas las europeas.

La presencia de Maia 200 en los centros de datos también refuerza el control de Microsoft sobre su infraestructura crítica, algo especialmente sensible en un contexto de tensión en la cadena de suministro de semiconductores avanzados. Diseñar y desplegar su propio silicio le permite planificar con más precisión su capacidad, así como adaptarse a las exigencias de soberanía digital y protección de datos que marcan la agenda regulatoria en la Unión Europea.

Al mismo tiempo, Microsoft ya mira más allá del lanzamiento actual. Fuentes de la compañía han señalado que ya se trabaja en el desarrollo del sucesor, Maia 300, lo que indica que no se trata de un proyecto aislado, sino de una familia de productos con una hoja de ruta a varios años vista.

En paralelo, el acuerdo estratégico con OpenAI ofrece a Microsoft acceso a diseños de chips en los que trabaja la propia OpenAI, lo que añade una capa adicional de opciones si en el futuro decide combinar tecnologías o explorar otras arquitecturas para cargas de trabajo muy específicas.

Con Maia 200, Microsoft consolida una estrategia que va mucho más allá de lanzar un nuevo procesador: busca asegurar la base tecnológica que soporta la expansión de la inteligencia artificial en su nube, mejorar la eficiencia económica de sus servicios y competir en el terreno del silicio con Amazon y Google. A medida que el chip se despliegue en más regiones y empiece a soportar modelos cada vez más complejos, su impacto se dejará notar en la forma en que empresas, instituciones y usuarios finales en España y en el resto de Europa acceden a herramientas de IA avanzadas a través de Azure y del ecosistema Microsoft.