Cómo la IA está cambiando el trabajo de SRE en 2026

Rustam Atai5 min

Hay un viejo dibujo animado soviético de 1965 llamado "Vovka en el Reino Lejano". Allí, el protagonista sueña con una vida de cuento en la que no tenga que hacer nada por sí mismo. En cierto momento aparecen "dos del cofre", unos ayudantes que, con una orden, hacen todo rápido y sin hacer preguntas de más. Pero la gracia está en que no entienden los límites de la tarea: no solo consiguen dulces, también empiezan a comérselos ellos mismos. De ahí viene la famosa protesta de Vovka: "¿Qué, también van a comerse los caramelos por mí?" El sentido de la escena no es que los ayudantes sean malos. El punto es otro: si uno mismo no piensa qué quiere y dónde debe estar el límite de la automatización, los ayudantes no tardarán en apropiarse no solo del trabajo, sino también del resultado. (Wikipedia)

En 2026, con la IA, las empresas de servicios de IT viven más o menos la misma historia.

Parece que el sueño se hizo realidad. La IA ya puede clasificar alertas, resumir incidentes, sugerir causas probables de degradación, ordenar eventos en una línea de tiempo, generar borradores de postmortems, detectar patrones sospechosos en los logs e incluso "hablar" con la telemetría en un lenguaje casi humano. Para los equipos de SRE y ops esto es muy tentador: ahí está por fin el asistente esperado, el que no se cansa y no se queja por las guardias nocturnas.

Pero el problema es que la IA en operaciones funciona muy bien justo hasta el momento en que la empiezan a tratar como si fuera una persona adulta.

La IA no sustituyó a SRE. Sustituyó parte de la rutina

El cambio principal no es que "ahora la IA maneja producción". El cambio principal es que empezó a quitarles a las personas, con bastante solvencia, la parte sucia, ruidosa y agotadora del trabajo operativo.

Antes, un ingeniero podía pasar horas armando manualmente el cuadro de un incidente a partir de logs, métricas, trazas, eventos de despliegue y conversaciones en chats. Ahora, una parte de ese trabajo puede comprimirse a minutos. Según Elastic, en 2026 el 85 % de las organizaciones ya usa GenAI en observability, y en dos años esperan llegar al 98 %. Pero allí mismo aparece una salvedad importante: las herramientas standalone, sin contexto, solo sirven para análisis puntuales; en producción, lo que realmente importa son las plataformas que entienden las dependencias entre servicios, los patrones de despliegue y los propios datos de la empresa. (Elastic)

Para una empresa de servicios, esto es muy práctico. El cliente no paga por el heroísmo de desplazarse por Kibana a las tres de la mañana. El cliente paga por que el problema se encuentre y se aísle más rápido. Y la IA ayuda mucho justo en la fase inicial del análisis: reunir la señal, conectar los síntomas, resaltar hipótesis probables y no olvidar piezas importantes de la telemetría.

O sea, sí, esos "dos del cofre" ahora de verdad pueden ser los primeros en llegar al incidente. Pero eso todavía no significa que se les pueda confiar la toma de decisiones.

En 2026, lo más valioso no es la automatización, sino los límites de la automatización

Aquí es donde empieza la parte adulta de la conversación.

En operaciones, un error cuesta más que en una demo bonita. Si la IA se equivoca en un artículo, es molesto. Si en medio de un incidente guía con seguridad al equipo hacia el camino equivocado, perderás horas, dinero y la confianza del cliente. Por eso, una empresa de servicios sólida en 2026 no se distingue por la cantidad de funciones de IA que tiene, sino por la calidad de las barandillas que construye alrededor de ellas.

El human-in-the-loop dejó de ser un nice-to-have para convertirse en una norma obligatoria. Elastic escribe de forma explícita que, al elegir plataformas de observability, los equipos se fijan cada vez más en los guardrails y en los mecanismos de control humano, mientras que la seguridad sigue siendo la principal preocupación para el 61 % de las organizaciones al adoptar GenAI. (Elastic)

Y tiene toda la lógica. En SRE no basta con decir: "que el agente lo resuelva solo". Se le puede delegar la clasificación de señales. Se le puede delegar la recopilación de contexto. Se le puede delegar un borrador de RCA. Se le puede delegar la búsqueda de incidentes parecidos. Pero el derecho a cambiar de verdad el sistema, sobre todo en pleno incidente, debe permanecer bajo un control estricto.

Porque, de lo contrario, un día la IA no solo te ayudará a lidiar con producción. Empezará a equivocarse en producción en tu nombre.

Y eso ya no tendrá nada de un remake gracioso de Vovka.

No solo cambia la respuesta a incidentes, sino también la economía misma del servicio

Para una empresa de servicios, la IA también importa porque cambia el costo del trabajo rutinario.

Parte de las tareas que antes parecían "varias horas de un ingeniero con experiencia" ahora se parecen cada vez más a "15 minutos de un ingeniero competente más buen contexto más verificación". Y eso significa que la vieja magia del billing, donde mucha agitación manual podía venderse como gran valor, funciona cada vez menos.

Esto se nota especialmente en support y managed services. Si la IA puede resumir rápido un flujo de eventos, reducir parte del alert fatigue, levantar contexto relacionado y sugerir pasos típicos, el cliente empieza a esperar no solo "un equipo de guardia", sino un servicio más rápido y más maduro. En su informe de 2026, SolarWinds vincula de forma directa el AI-driven monitoring con la reducción del alert fatigue, la aceleración de la incident response y la necesidad de una visibilidad unificada en infraestructura híbrida. En ese mismo informe también se señala que el 51 % de los entornos siguen siendo mayoritariamente o totalmente on-premises, lo que significa que el viejo y conocido dolor híbrido no ha desaparecido de las empresas de servicios. (SolarWinds)

Y ese es, probablemente, uno de los cambios más interesantes.

Antes se podía vender esfuerzo. Ahora cada vez más habrá que vender la madurez del modelo operativo.

No "tenemos ingenieros". Sino "tenemos un proceso en el que ingenieros e IA juntos reducen el MTTR, disminuyen el ruido, restauran el servicio más rápido y no rompen la seguridad por el camino".

Observability se convierte en el centro de gravedad

Hasta hace poco, en muchas empresas observability se percibía como algo entre un mal necesario y un costoso almacén de logs. En 2026 ya no es un almacén. Es el combustible de trabajo de la IA en operaciones.

Si la telemetría es mala, está fragmentada, es incompleta y carece de contexto normal y de relaciones entre servicios, la IA se convierte en ese mismo personaje del cofre: corre rápido, habla con seguridad y aporta poco valor. Pero si los datos están bien recogidos, si hay tracing, eventos de despliegue, dependencias, inventario de servicios e historial de fallos parecidos, entonces la IA sí refuerza de verdad al equipo.

Por eso, las empresas de servicios venderán cada vez menos solo soporte de infraestructura y cada vez más un servicio más maduro: llevar el caos operativo a un estado apto para una operación asistida por IA.

Suena un poco largo, pero la idea es simple. Antes de llamar al ayudante mágico, por lo menos hay que quitar la basura del suelo.

La IA hace que SRE sea más rápido. La responsabilidad, no

Esa es, probablemente, la conclusión principal.

En 2026, la IA ya encaja bastante bien en el papel de un junior de guardia muy despierto. Lee rápido, busca rápido, resume rápido, propone rápido. A veces incluso demasiado rápido como para no inquietar. Pero todo el valor de una empresa madura de servicios de IT sigue estando en cosas humanas: la capacidad de distinguir el síntoma de la causa, el ruido de la señal, una hipótesis probable de un disparate peligroso, y una automatización útil de una estupidez automatizada.

Por eso, un buen negocio de servicios hoy no se construye alrededor del eslogan "usamos IA", sino alrededor de una fórmula más aburrida, pero mucho más rentable:

sabemos exactamente qué se puede delegar a la IA y qué no.

Y sí, hay cierta ironía en eso. La industria pasó años soñando con un asistente que llegara y aliviara la operación. Al fin llegó. Está ahí, resumiendo logs, encontrando correlaciones, dibujando timelines, sugiriendo hipótesis. Una maravilla. Da gusto mirarlo.

Pero aun así hay que mirarlo con una ligera inquietud, la misma de Vovka:

"¿Qué, también van a comerse los caramelos por mí?"

Porque en el servicio de IT de 2026 eso ya no es una broma. Es casi una política de seguridad.