Construir infraestructura a escala de nube implica que cada punto porcentual de eficiencia se traduce en millones de dólares y en toneladas de CO2. Amazon Web Services acaba de revelar que rediseñó desde cero la arquitectura de red interna de sus centros de datos con un enfoque llamado Resilient Network Graphs (RNG), basado en grafos aleatorios, y los números que presenta son significativos: 69% menos dispositivos de red, 40% de reducción en el consumo eléctrico de la red y 33% más de throughput (capacidad de transferencia de datos). La arquitectura ya opera como estándar predeterminado para la mayoría de las cargas de trabajo dentro de AWS.
Por qué importa el diseño de red en un data center
Las redes internas de los centros de datos de hiperescala —los que operan Amazon, Google, Microsoft y Meta— no se parecen a las redes empresariales convencionales. Son estructuras con decenas de miles de servidores interconectados que deben mover petabytes de datos entre instancias de cómputo, almacenamiento y servicios administrados, con latencia mínima y sin cuellos de botella. Históricamente, la solución dominante fue la topología fat-tree o Clos, un diseño jerárquico que escala sumando capas de switches. El problema: a medida que la escala crece, el número de dispositivos físicos crece de forma casi proporcional, con todo el costo en hardware, energía, espacio y puntos de falla que eso implica.
RNG reemplaza ese modelo jerárquico por una topología basada en grafos aleatorios, una técnica que proviene de la teoría matemática de grafos y que permite conectar nodos de manera aparentemente no estructurada pero con propiedades formalmente garantizadas de conectividad y resiliencia. La reducción de 69% en dispositivos sugiere que AWS logró mantener o mejorar la conectividad global de la red usando una fracción del hardware que requería el esquema anterior.
Qué cambia operativamente
El aumento del 33% en throughput es relevante porque no viene de agregar más hardware sino de aprovechar mejor el que ya existe. En una red fat-tree tradicional, los caminos entre nodos tienden a concentrarse en ciertos enlaces troncales que se convierten en cuellos de botella bajo carga alta. Un grafo aleatorio bien diseñado distribuye el tráfico de manera más uniforme entre múltiples rutas posibles, lo que reduce la saturación de enlaces individuales y permite que el ancho de banda agregado de la red se use con mayor eficiencia.
La reducción del 40% en consumo eléctrico de la red es el dato que probablemente más pese en la planificación a largo plazo de AWS. Los centros de datos son grandes consumidores de energía, y la red —switches, transceivers ópticos, cables activos— representa una porción significativa de ese consumo. Menos dispositivos físicos implica directamente menos watts en operación continua. Para una compañía que opera docenas de regiones y zonas de disponibilidad alrededor del mundo, esa cifra tiene impacto tanto en costos operativos como en compromisos de sostenibilidad.
El contexto de la carrera por eficiencia en infraestructura
El anuncio de RNG se enmarca en una tendencia más amplia: los grandes proveedores de nube están invirtiendo en diseño propio de hardware y redes para diferenciarse y reducir dependencia de proveedores externos. Amazon ya fabrica sus propios chips de cómputo (la familia Graviton) y sus procesadores de red (Nitro). Google desarrolló su propia red de centros de datos llamada Jupiter, que también usa topologías no convencionales. Microsoft invirtió en diseño de switching personalizado para Azure. El diseño propietario de red es la extensión natural de esa estrategia.
Para los equipos técnicos que construyen sobre AWS —sean desarrolladores, arquitectos de soluciones o responsables de infraestructura— el anuncio no implica cambios en la forma en que se configuran o usan los servicios. RNG opera por debajo de la capa visible para el cliente: es la red física y lógica interna que conecta los recursos de cómputo y almacenamiento dentro de cada zona de disponibilidad. Su impacto se sentiría indirectamente, en la forma de menor latencia entre servicios co-localizados o mayor estabilidad bajo picos de tráfico, aunque AWS no ha publicado benchmarks públicos que permitan verificar esas mejoras desde afuera.
Lo que sí es verificable es la decisión de despliegue: que RNG sea ya la arquitectura predeterminada para la mayoría de las cargas de trabajo en AWS indica que la compañía superó la fase experimental y está confiando en este diseño para su operación productiva a escala global. En infraestructura de nube, ese tipo de migraciones no se hacen de manera apresurada.
Qué viene después
AWS no detalló un calendario de expansión, pero dado que RNG ya es el estándar para la mayor parte de sus workloads, es razonable esperar que las nuevas regiones y zonas que la compañía planea abrir en los próximos años —incluyendo expansiones en América Latina— nazcan directamente con esta arquitectura. El debate técnico más interesante que deja abierto el anuncio es si este enfoque basado en grafos aleatorios es aplicable a redes que conectan múltiples zonas de disponibilidad o si, por ahora, su ventaja se limita al interior de cada data center individual.
Para el ecosistema más amplio de la industria, el anuncio agrega evidencia a la idea de que las topologías de red tradicionales están siendo revisadas en profundidad a escala de hiperescala. Si AWS publica los detalles técnicos de RNG, es probable que el diseño influya en cómo otros operadores y fabricantes piensan sus propias redes en los próximos años.




