- Maia 200 es el nuevo acelerador de IA de Microsoft, centrado en la inferencia y fabricado en 3 nm por TSMC.
- Ofrece hasta 10,1 PFLOPS en FP4, 5 PFLOPS en FP8 y un 30% más de rendimiento por coste frente al hardware previo de Azure.
- Impulsa servicios como Microsoft 365 Copilot, Foundry y los modelos avanzados de OpenAI dentro de la nube Azure.
- Refuerza la estrategia de Microsoft de desarrollar su propio silicio y reducir la dependencia de Nvidia, compitiendo con Google y Amazon.

La presentación de Maia 200, el nuevo chip de inteligencia artificial de Microsoft, supone un movimiento relevante en la carrera por controlar la infraestructura que sostiene la IA generativa en la nube. La compañía da un paso más en su estrategia de diseñar su propio silicio, con un acelerador pensado específicamente para la inferencia y para recortar costes operativos en sus centros de datos de Azure.
Más allá de los grandes titulares, el interés de Maia 200 está en que busca reducir la dependencia de Nvidia y plantar cara a las soluciones de Google y Amazon, al tiempo que refuerza servicios clave como Microsoft 365 Copilot y los modelos avanzados desarrollados junto a OpenAI. Todo ello en un contexto marcado por una demanda creciente de capacidad de cómputo y por la presión para hacer la IA más eficiente y sostenible.
Un chip de segunda generación centrado en la inferencia de IA
Maia 200 es la segunda generación de chips de IA de Microsoft, y llega dos años después del Maia 100, que nunca llegó a ofrecerse de forma generalizada a clientes. A diferencia de otros procesadores más polivalentes, este nuevo diseño se ha creado desde cero para la inferencia, es decir, para la fase en la que los modelos ya entrenados generan respuestas, textos, imágenes o código en tiempo real.
En la práctica, esto significa que Maia 200 está optimizado para ejecutar modelos de gran tamaño con la menor latencia posible y con un consumo ajustado, un aspecto crítico cuando se manejan millones de peticiones diarias en aplicaciones empresariales y de consumo. Microsoft insiste en que la inferencia se ha convertido en el auténtico cuello de botella económico de la IA, mucho más que el entrenamiento inicial de los modelos.
Según la compañía, el nuevo chip se comporta como el sistema de inferencia más eficiente que ha desplegado hasta ahora, con una mejora aproximada del 30 % en rendimiento por dólar respecto a su hardware anterior. Esta relación entre potencia y coste es determinante para fijar precios, márgenes y disponibilidad de los servicios en la nube.
Con este enfoque, Microsoft busca que los clientes que utilizan Azure para aplicaciones de IA puedan contar con respuestas más rápidas y costes más previsibles, algo especialmente relevante para grandes empresas, administraciones públicas europeas y proyectos de investigación que dependen de infraestructuras escalables.

Tecnología de 3 nanómetros y más de 140.000 millones de transistores
En el plano técnico, Maia 200 se fabrica con el proceso de 3 nanómetros de TSMC, una de las tecnologías de semiconductores más avanzadas actualmente en producción comercial. Cada chip integra más de 140.000 millones de transistores, una cifra que refleja la complejidad necesaria para manejar modelos de IA de última generación.
El acelerador combina núcleos optimizados para operaciones en FP4 y FP8, dos formatos de precisión reducida que permiten exprimir al máximo el rendimiento en inferencia sin comprometer la calidad de los resultados en la mayoría de aplicaciones. Microsoft señala que Maia 200 alcanza alrededor de 10,1 petaFLOPS en FP4 y unos 5 petaFLOPS en FP8 por chip.
En términos comparativos, la empresa asegura que triplica el rendimiento FP4 del Trainium de tercera generación de Amazon y supera en FP8 a la séptima generación de TPU de Google. Aunque estos datos proceden de la propia Microsoft y habrá que ver pruebas independientes, el mensaje es claro: la compañía quiere situar su silicio al nivel —o por encima— del de los otros grandes proveedores de nube.
Este salto de potencia no se limita a tareas concretas, sino que está pensado para modelos de lenguaje de gran escala y sistemas multimodales capaces de trabajar con texto, imagen, audio o vídeo. El objetivo es que las aplicaciones que corren sobre Azure puedan crecer en complejidad sin que la infraestructura se convierta en un freno.
Memoria HBM3e, SRAM integrada y un flujo de datos sin cuellos de botella
Uno de los puntos que más repite Microsoft es el rediseño del subsistema de memoria. Maia 200 incorpora 216 GB de memoria HBM3e con un ancho de banda de hasta 7 TB/s, acompañados de 272 MB de SRAM integrada dentro del propio chip. Esta combinación está pensada para reducir el tráfico fuera del chip y mantener los modelos “alimentados” de datos de forma constante.
Al acercar tanta memoria de alta velocidad al procesador, la compañía pretende que los modelos de tamaño masivo puedan ejecutarse sin esperas, minimizando la latencia y mejorando el rendimiento efectivo por vatio. Esto es clave, por ejemplo, cuando se generan largas secuencias de texto o se procesan consultas complejas en tiempo real.
Además, el diseño incluye motores de movimiento de datos y una red interna que buscan evitar cuellos de botella en el flujo de información, algo que suele convertirse en un problema cuando se conectan miles de aceleradores en un mismo clúster. Microsoft describe este enfoque como parte de una infraestructura “heterogénea”, preparada para distintos tipos de cargas de trabajo de IA.
Según la empresa, un nodo equipado con Maia 200 es capaz de ejecutar los modelos comerciales más grandes disponibles hoy, dejando margen para futuras generaciones aún más exigentes. Esta capacidad resulta especialmente relevante para proyectos europeos que necesitan modelos propios de gran tamaño, tanto en sectores regulados como en ámbitos de investigación avanzada.
Red de interconexión y despliegue masivo en centros de datos
Más allá del chip, Microsoft ha trabajado en la forma de interconectar miles de Maia 200. El sistema apuesta por una red de dos niveles basada en Ethernet estándar, con una capa de transporte personalizada y tarjetas de red integradas en el diseño. Con ello, la compañía afirma que puede escalar clústeres de inferencia hasta 6.144 aceleradores manteniendo operaciones colectivas predecibles y con alto rendimiento.
Este tipo de arquitectura resulta clave para reducir el consumo energético global y el coste total de propiedad de los centros de datos, dos factores muy vigilados tanto en Estados Unidos como en la Unión Europea. En un escenario de precios energéticos elevados y exigencias crecientes en materia de sostenibilidad, la eficiencia ya no es solo un argumento técnico, sino también regulatorio y económico.
De momento, el despliegue inicial de Maia 200 se está realizando en centros de datos de Azure en la región US Central, cerca de Des Moines (Iowa), con planes de expansión a US West 3, en Arizona, y posteriormente a otras ubicaciones. A medida que se consolide su funcionamiento en producción, es previsible que llegue a regiones europeas de Azure para dar servicio a clientes locales.
La compañía subraya que estos aceleradores ya están impulsando proyectos del equipo Microsoft Superintelligence, así como iniciativas de Microsoft Foundry centradas en el desarrollo de modelos y aplicaciones avanzadas de IA. Este uso interno sirve como banco de pruebas antes de una puesta a disposición más amplia para organizaciones y desarrolladores.
Integración con Azure, Copilot y los modelos de OpenAI
Maia 200 nace totalmente integrado en la arquitectura de nube de Azure y se convierte en una pieza clave para sostener el crecimiento de servicios basados en IA generativa. Entre ellos destacan Microsoft 365 Copilot —que añade funciones de IA a herramientas como Word, Excel, Outlook o Teams— y la plataforma Foundry, orientada a crear y desplegar modelos personalizados.
El chip también se utilizará para ejecutar las versiones más recientes de los modelos GPT desarrollados por OpenAI, incluidos los de la familia GPT-5.x, lo que refuerza la alianza estratégica entre ambas compañías. El equipo de Microsoft Superintelligence empleará Maia 200 para generar datos sintéticos y para procesos de aprendizaje por refuerzo que ayuden a mejorar modelos propios.
En los llamados “pipelines” de datos sintéticos, la compañía señala que el diseño del acelerador permite generar y filtrar datos específicos de dominio a mayor velocidad, proporcionando señales más frescas y relevantes para posteriores fases de entrenamiento. Este tipo de procesos resulta cada vez más importante para adaptar modelos generales a entornos locales, sectores regulados o idiomas concretos, incluido el español europeo.
Para facilitar la adopción, Microsoft ha adelantado que trabaja en herramientas de desarrollo y SDKs orientados a investigadores, universidades y proyectos de código abierto, con la intención de crear un ecosistema alrededor de su nuevo silicio. El objetivo es que la comunidad pueda experimentar con Maia 200 sin tener que partir de cero en cada implementación.
Competencia directa con Nvidia, Google y Amazon
El lanzamiento de Maia 200 se entiende mejor si se enmarca en la carrera por la infraestructura de IA entre los grandes proveedores de nube. Nvidia continúa dominando el mercado de aceleradores, pero Google ha apostado por sus TPUs y Amazon por procesadores como Trainium e Inferentia. Microsoft se suma a esta tendencia con su propia línea de chips.
La compañía insiste en que este movimiento no supone una ruptura con Nvidia, sino una diversificación estratégica. En la práctica, significa ganar margen de maniobra, mayor capacidad de negociación y más control sobre la hoja de ruta tecnológica a medio y largo plazo.
Desde una perspectiva económica, contar con un chip propio permite a Microsoft reducir costes estructurales y planificar mejor la inversión en infraestructura, algo especialmente sensible en un mercado tan volátil como el de los semiconductores avanzados. También le facilita ofrecer servicios de IA más escalables y con tarifas potencialmente más competitivas.
En Europa, este tipo de iniciativas encaja con el debate sobre soberanía digital y control de la infraestructura, ya que muchos gobiernos y grandes empresas exigen garantías adicionales sobre dónde y cómo se procesan sus datos. Aunque Maia 200 se despliega inicialmente en EE. UU., su llegada futura a regiones europeas podría influir en decisiones de contratación y en proyectos que buscan reducir dependencias externas.
Impacto estratégico y hoja de ruta futura
Para Microsoft, la inteligencia artificial se ha convertido en uno de los pilares centrales de su estrategia de crecimiento. La inversión en OpenAI, la expansión de Copilot y ahora el desarrollo de chips propios forman parte de un mismo plan: controlar la cadena completa de valor, desde el hardware hasta las aplicaciones finales.
Directivos de la compañía han defendido que Maia 200 supera a los semiconductores comparables de Google y Amazon en determinadas tareas de IA y lo señalan como el sistema de inferencia más eficiente que han desplegado. Al mismo tiempo, ya se trabaja en el sucesor, Maia 300, con el que pretenden seguir incrementando potencia y eficiencia.
La empresa también cuenta con opciones adicionales: en el marco de su alianza con OpenAI, tiene acceso a diseños de chips en los que trabaja el creador de ChatGPT, lo que abre la puerta a posibles colaboraciones futuras o a integrar ideas externas en sus propias soluciones de silicio.
En un mercado que algunos ya describen como la “guerra del silicio”, la capacidad de ofrecer IA potente, eficiente y económicamente viable será uno de los factores que definan qué empresas liderarán la próxima década tecnológica. Maia 200 es, en este contexto, una pieza más de un tablero que va mucho más allá de un único lanzamiento de hardware.
Con Maia 200, Microsoft refuerza su apuesta por la inteligencia artificial al combinar un chip de alto rendimiento, un enfoque decidido en la inferencia y una integración profunda con Azure y su ecosistema de servicios, en un intento de equilibrar costes, reducir dependencias externas y posicionarse como uno de los actores con más peso en la infraestructura global de IA, también de cara a clientes y proyectos en España y el resto de Europa.
