Ideas e investigación

El lunes gris de Comcast: cómo seguimos siendo productivos durante una interrupción de servicio de Internet

Un mapa que muestra las interrupciones

"Cámbiate al acceso del smartphone si tienes Comcast", decía el mensaje de Slack. Eran las 21:45 del lunes 8 de noviembre.

Al principio, parecía una broma infantil, pero venía de una fuente legítima: nuestro equipo de TI. Estábamos haciendo una llamada importante por Zoom, ajustando los detalles de última hora para el evento de lanzamiento del producto "Sin interrupciones" programado para el martes por la mañana. 

"Estamos viendo cortes de servicio en cascada para los usuarios de Comcast en todo el norte de California; podría afectarte próximamente", advertía el siguiente mensaje.

La interrupción y la coordinación posterior para hacer nuestro trabajo habría sido una molestia innecesaria para nosotros. En respuesta a la alerta, nos cambiamos a nuestros puntos de acceso y seguimos trabajando felizmente en nuestras reuniones, mientras la interrupción se producía en el norte de California. 

Las interrupciones imprevistas de ISP de varias horas son infrecuentes en la actualidad, pero cuando ocurren, especialmente cuando la mayoría de nosotros trabajamos desde casa, el impacto en la productividad es significativo. 

La interrupción de Comcast fue un recordatorio de que debemos planificar situaciones imprevisibles. Pero ¿cómo prepararse para las interrupciones aleatorias?  

En el mundo de la supervisión de la experiencia digital (DEM), la supervisión proactiva es el mejor enfoque para adelantarse a las interrupciones y cortes inesperados. Sin embargo, la promesa de buscar continuamente señales de problemas es difícil de creer hasta que se ve en acción. 

El apagón de Comcast fue una inesperada oportunidad para el equipo que estaba dando los últimos toques al lanzamiento de actualizaciones a nuestra solución de supervisión al día siguiente. ¿Cómo lo logró el equipo informático? Veamos cómo el equipo utilizó la supervisión proactiva nativa de la nube para ayudarnos a mantener la productividad durante la interrupción del servicio.

Utilizamos Zscaler Digital Experience (ZDX) dentro de Zscaler para rastrear y diagnosticar el rendimiento de las aplicaciones utilizadas por los empleados de Zscaler. En la tarde del 8 de noviembre, empezamos a ver una grave degradación del rendimiento, que afectaba a múltiples aplicaciones críticas utilizadas por nuestros empleados. ZDX mostró puntos problemáticos en todo el país, pero había un grupo destacable en el área de la bahía de San Francisco. Dada la concentración de nuestros empleados allí, decidimos investigar. La puntuación ZDX de estas aplicaciones críticas, que solía estar de color verde, había caído precipitadamente a la categoría OK/pobre, acompañada de un fuerte aumento de los tiempos de carga de las páginas. Consulte la figura 1.

Figura 1: La puntuación ZDX y la hora de obtención de la página muestran una caída significativa alrededor de las 21:00 PT (o 12:00 ET)

ZDX supervisa la experiencia de todos y cada uno de los empleados de Zscaler, usándolos como "ojos" y "oídos" para supervisar las degradaciones de las aplicaciones. En este caso, observó un comportamiento anómalo procedente de zonas de alto uso de Comcast, repartidas por toda la zona de la bahía. En las Figuras 2 y 3, podemos ver la experiencia de los empleados de Zscaler antes de la interrupción y durante la interrupción: 

Figura 2: Los empleados de Zscaler en el área de la Bahía tienen un buen rendimiento en condiciones normales
 

Figura 3: Empleados de Zscaler en el área de la Bahía que experimentaron los inconvenientes de la interrupción de servicio de Comcast en la noche del 8 de noviembre de 2021

Una vez que identificamos que había un número significativo de empleados concentrados en una misma región que tenían problemas, el siguiente paso fue aislar la causa del problema. Dado que ZDX aprovecha el mismo agente que da servicio a nuestra solución de seguridad en la nube, Zscaler Internet Access (ZIA), teníamos acceso a un tesoro oculto de datos casi en tiempo real para analizar a toda nuestra base de empleados. ZDX hace mediciones desde tres perspectivas diferentes: la aplicación, la red y el punto final de usuario. El análisis rápido descartó la perspectiva de la aplicación y el punto final del usuario, lo que nos dejó con un problema de red que debíamos diagnosticar más a fondo.

Examinamos los datos de ZDX CloudPath, que mide la latencia continua y la pérdida de paquetes entre el punto final de un usuario y la aplicación, y aislamos rápidamente un problema de ISP. CloudPath nos ayudó a descartar problemas de wifi, problemas en la nube de Zscaler y problemas en la red troncal de Internet. Nos mostró que cada usuario afectado era un cliente de Comcast y que toda la degradación se producía entre el portal del usuario y Comcast. 

La Figura 4 muestra cómo CloudPath indica que el salto entre la puerta de enlace del usuario y Comcast es el problema, ya que se muestran una latencia y pérdida excesivas (a veces no había conexión en absoluto). También muestra un wifi que funciona correctamente (con una latencia mínima) y destaca que no era posible establecer una conexión descendente de Comcast a la nube de Zscaler.


 

Figura 4: Este empleado pudo establecer una conexión con Comcast, pero con una latencia y pérdida excesivas

Damos por sentada la presencia de Internet, especialmente ahora que la mayor parte de los ISP construyen redes altamente resilientes para brindar conectividad de banda ancha rápida a nuestros hogares. No obstante, al igual que cualquier sistema complejo, una vez que se produce la interrupción, el rendimiento de Internet que se obtiene es extremadamente impredecible y degradado. La supervisión proactiva combinada con los efectos en la red de supervisar a cada usuario ayuda a proporcionar una medida de control y previsibilidad. 

Eche un vistazo a Zscaler Digital Experience para saber cómo puede ayudar a su personal distribuido a mantenerse productivo.

Manténgase informado sobre los últimos consejos y noticias en materia de transformación digital.

Al enviar el formulario, declara estar de acuerdo con nuestra política de privacidad.