Ideas e investigación

El lunes gris de Comcast: cómo seguimos siendo productivos durante una interrupción de servicio de Internet

mapa que muestra las interrupciones de servicio

"Usa el punto de acceso del smartphone si tienes Comcast", decía el mensaje de Slack. Eran las 21:45 del lunes 8 de noviembre.

Al principio, parecía una broma infantil, pero venía de una fuente legítima: nuestro equipo de TI. Estábamos haciendo una llamada importante por Zoom, ajustando los detalles de última hora para el evento de lanzamiento del producto "Sin interrupciones" programado para el martes por la mañana. 

"Estamos viendo cortes de servicio en cascada para los usuarios de Comcast en todo el norte de California; podría afectarte próximamente", advertía el siguiente mensaje.

La interrupción y la coordinación posterior para hacer nuestro trabajo habría sido una molestia innecesaria. En respuesta a la alerta, pasamos a usar los puntos de acceso y seguimos trabajando en nuestras reuniones, mientras la interrupción se producía en el norte de California. 

Las interrupciones imprevistas de varias horas de los ISP son infrecuentes pero, cuando ocurren, especialmente cuando la mayoría de nosotros trabajamos desde casa, el impacto en la productividad es significativo. 

La interrupción de Comcast fue un recordatorio de que debemos planificar situaciones imprevisibles. Pero ¿cómo prepararse para las interrupciones aleatorias?  

En el mundo de la supervisión de la experiencia digital (DEM), la supervisión proactiva es el mejor enfoque para adelantarse a las interrupciones y cortes inesperados. Sin embargo, las ventajas de buscar continuamente señales de problemas son dudosas hasta que se ven en acción. 

La interrupción del servicio de Comcast fue una inesperada oportunidad para el equipo que estaba dando los últimos toques al lanzamiento de actualizaciones a nuestra solución de supervisión al día siguiente. ¿Cómo lo logró el equipo informático? Veamos cómo el equipo utilizó la supervisión proactiva nativa de la nube para ayudarnos a mantener la productividad durante la interrupción del servicio.

Utilizamos Zscaler Digital Experience (ZDX) en Zscaler para rastrear y diagnosticar el rendimiento de las aplicaciones utilizadas por los empleados de Zscaler. En la tarde del 8 de noviembre, empezamos a ver una grave degradación del rendimiento, que afectaba a múltiples aplicaciones críticas utilizadas por nuestros empleados. ZDX mostró puntos problemáticos en todo el país, pero había un grupo destacable en el área de la bahía de San Francisco. Dada la concentración de nuestros empleados allí, decidimos investigar. La puntuación ZDX de estas aplicaciones críticas, que solía estar de color verde, había caído precipitadamente a la categoría OK/pobre, acompañada de un fuerte aumento de los tiempos de carga de las páginas. Consulte la figura 1.

Figura 1: la puntuación ZDX y la hora de obtención de la página muestran una caída significativa alrededor de las 21:00 PT (o 12:00 ET)

ZDX supervisa la experiencia de todos y cada uno de los empleados de Zscaler, usándolos como ojos y oídos para supervisar las degradaciones de las aplicaciones. En este caso, observó un comportamiento anómalo procedente de zonas de alto uso de Comcast, repartidas por toda la zona de la bahía. En las figuras 2 y 3, podemos ver la experiencia de los empleados de Zscaler antes de la interrupción y durante la interrupción: 

Figura 2: los empleados de Zscaler en el área de la Bahía tienen un buen rendimiento en condiciones normales
 

Figura 3: empleados de Zscaler en el área de la Bahía que experimentaron los inconvenientes de la interrupción de servicio de Comcast en la noche del 8 de noviembre de 2021

Después de identificar que había un número significativo de empleados concentrados en una misma región que tenían problemas, el siguiente paso fue aislar la causa del problema. Dado que ZDX aprovecha el mismo agente que da servicio a nuestra solución de seguridad en la nube, Zscaler Internet Access (ZIA), teníamos acceso a un tesoro oculto de datos casi en tiempo real para analizar a toda nuestra base de empleados. ZDX hace mediciones desde tres perspectivas diferentes: la aplicación, la red y el extremo del usuario. El análisis rápido descartó la perspectiva de la aplicación y el extremo del usuario, lo que nos dejó con un problema de red que debíamos diagnosticar más a fondo.

Examinamos los datos de ZDX CloudPath, que mide la latencia continua y la pérdida de paquetes entre el punto final de un usuario y la aplicación, y aislamos rápidamente un problema de ISP. CloudPath nos ayudó a descartar problemas de Wi-Fi, problemas en la nube de Zscaler y problemas en la red troncal de Internet. Nos mostró que cada usuario afectado era un cliente de Comcast, y que toda la degradación se producía entre la puerta de enlace del usuario y Comcast. 

La figura 4 muestra cómo CloudPath indica que el salto entre la puerta de enlace del usuario y Comcast es el problema, ya que se muestran una latencia y pérdida excesivas (a veces no había conexión en absoluto). También muestra una conexión Wi-Fi que funciona correctamente (con una latencia mínima) y destaca que no era posible establecer una conexión descendente de Comcast a la nube de Zscaler.


 

Figura 4: este empleado pudo establecer una conexión con Comcast, pero con una latencia y pérdida excesivas

Damos por sentada la presencia de Internet, especialmente ahora que la mayor parte de los ISP construyen redes altamente resistentes para proporcionar conectividad de banda ancha rápida a nuestros hogares. No obstante, como cualquier sistema complejo, cuando se produce una interrupción, el rendimiento de Internet que se obtiene es extremadamente impredecible y degradado. La supervisión proactiva combinada con los efectos en la red de supervisar a cada usuario ayuda a proporcionar una medida de control y previsibilidad. 

Eche un vistazo a Zscaler Digital Experience para saber cómo puede ayudar a su personal distribuido a mantenerse productivo.

Manténgase informado sobre los últimos consejos y noticias en materia de transformación digital.

Al enviar el formulario, declara estar de acuerdo con nuestra política de privacidad.