Por: Andréz Lamouroux S.
Los negocios dependen de sistemas conformados por diferentes elementos que hacen parte de su infraestructura IT para competir de forma efectiva. Todos estos sistemas deben permanecer en un estado “saludable” para que las operaciones de la organización se realicen de forma eficiente. En el ambiente IT actual, los recursos informáticos de muchos fabricantes son frecuentemente utilizados para abordar muchos requerimientos. Si algunos de estos recursos fallan inesperadamente, los efectos negativos pueden ser severos. Una estimación conservadora de Gartner indica que el costo promedio del tiempo de interrupciones para una red de computadores es de USD $42.000 por hora. Gartner también estima que las empresas suelen experimentar un total de 87 horas de tiempo de interrupciones al año. Una empresa que experimente más de 175 horas al año en interrupciones podría ahorrar hasta 3,6 millones de dólares anualmente mediante la implementación exitosa de tecnologías de monitoreo para reducir el tiempo de inactividad al promedio de las 87 horas. Con la creciente complejidad y cantidad de equipos de cómputo y software, monitorear el estado de salud de estos sistemas ya no es posible hacerlo manualmente. Específicamente, el software de monitoreo debe ser utilizado continuamente para ejecutar pruebas que aseguren que todos los elementos de la infraestructura IT funcionen apropiadamente. Gartner señala que cuando los sistemas críticos fallan, las empresas pagan muy caro en términos de productividad, sufren daños en su reputación y se afectan sus rendimientos financieros. Cuando las fallas ocurren, minimizar la interrupción causada es crucial para limitar el impacto en los procesos del negocio. Si un sitio web corporativo, disponible las 24 horas al día, 7 días a la semana, se ve interrumpido, la compañía pierde una valiosa vía de ventas, contactos, esfuerzos de marketing, y desarrollo de nuevos negocios. Por lo regular, estas pérdidas son difíciles de cuantificar. Las fallas en los sistemas también pueden cortar importantes líneas de comunicación corporativa, las interrupciones frecuentes en los servicios de IT causan a la cultura corporativa pérdida de confianza en estos servicios y sistemas de alta eficiencia, minimizando el retorno de su inversión. Las empresas que desean asumir el reto de mantener su infraestructura IT operacional disponibles 24×7 deben considerar los siguientes requerimientos al invertir en tecnologías de monitoreo que les ayuden a mantener en funcionamiento permanentemente: Vistas de usuario final en tiempo real El conocimiento en tiempo real de los estados de los elementos administrados desde la perspectiva del usuario final puede alcanzarse mediante el monitoreo de puntos de verificación sobre indicadores generados por la operación o funcionamiento de los sistemas monitoreados. Esto permitirá medir y ajustar el desempeño de los recursos y asegurar que los objetivos de productividad e ingresos se cumplan. Capacidad de detectar problemas antes de que impacten la infraestructura IT La vigilancia de las fallas, condiciones de errores, y umbrales de tiempos de respuesta deben ser configurados de forma individual para cada uno de los elementos administrados. Disponer de la flexibilidad al establecer umbrales con diferentes niveles de sensibilidad, permite al administrador mantener un ojo cerrado en áreas críticas y recibir alertas tempranas sobre condiciones de fallas potenciales, antes de que los usuarios de estos sistemas empiecen a llamar a la mesa de ayuda o al departamento de soporte IT. Alertas inmediatas sobre fallas e información detallada para identificar rápidamente las causas raíz y mejorar los tiempos de respuesta y resolución. Las alertas deben incluir información detallada y configurable sobre las condiciones que causan las alertas, incluyendo los códigos de error devueltos por el elemento administrado, mensajes de excepción, entradas de logs, y rutas de traza para identificar la localización exacta del elemento que dispara la alerta. Lo ideal es que el producto de monitoreo proporcione la capacidad de ejecutar comandos o tareas para diagnosticar o resolver problemas tales como reiniciar un proceso o servicio, lanzar un ejecutable, etc.; lo cual ahorra tiempo a la hora de resolver un caso y disminuir el impacto de la falla. Capacidad de funcionar en ambientes e infraestructuras complejas. En infraestructuras pequeñas que no contienen demasiados elementos críticos para el funcionamiento del negocio, el monitoreo simple de los servicios puede proporcionar una defensa adecuada contra la problemática que afecta la disponibilidad. Sin embargo, en infraestructuras mucho más grandes y heterogéneas, cada elemento administrado debe ser monitoreado haciendo uso de los protocolos estándar en la industria, apropiados para cada dispositivo, servicio o aplicación. Por ejemplo, a los servidores no solo se les debe monitorear variables tales como el consumo de procesador, el uso de disco duro, o las estadísticas de consumo de memoria, sino también ocurrencias específicas de errores y problemas potenciales que pueden surgir en la ejecución de los procesos o de los servicios y en los registros de eventos. Las herramientas avanzadas de monitoreo toman ventaja de los comandos SNMP (Simple Network Management Protocol) para monitorear profundamente dentro de la infraestructura IT. Las bases de datos deben ser monitoreadas con el fin de asegurar que acepten conexiones, ejecuten las consultas y devuelvan los resultados esperados. Finalmente, el servidor web debe ser monitoreado para obtener una vista acumulativa de la disponibilidad y del tiempo de actividad del servicio. Visibilidad de redes e infraestructuras no controladas. Muchos fabricantes ofrecen herramientas basadas en agentes que requieren la instalación de agentes en los dispositivos administrados (servidores, estaciones de trabajo, laptops, etc.). Estos agentes recolectan y envían información del desempeño a un servidor de monitoreo central. Sin embargo, la instalación de agentes en dispositivos que no están bajo el control de TI puede ser un inconveniente. Adicionalmente, estos agentes requieren de cierto mantenimiento, lo cual agrega complejidad al despliegue y a la gestión posterior de la solución de monitoreo. Las soluciones que no requieren de agentes y que utilizan protocolos estándar para conectarse directamente, consultar, publicar o simular de alguna manera la actividad del usuario y las estadísticas de desempeño, son transparentes para la infraestructura de soporte y proveen mediciones precisas, sin agregar sobrecargas o mantenimientos adicionales. Flexibilidad para implementar rápidamente nuevos elementos de monitoreo a medida que cambian las prioridades del negocio. Nada en los negocios se encuentra exento al cambio. Las nuevas aplicaciones y su correspondiente infraestructura deben ser incluidas en el sistema tan rápidamente como las prioridades del negocio cambien y por consiguiente demanden el monitoreo de un nuevo sistema o dispositivo. Por lo tanto, la flexibilidad para interactuar directamente con la consola de administración para agregar, cambiar o suspender fácilmente el monitoreo de un elemento es críticamente importante. Adicionalmente, la capacidad de cambiar el estado del monitoreo de l recurso en tiempo real, ayuda a preservar la precisión de los reportes de los Acuerdos de Niveles del Servicio (SLA) y de las estadísticas de disponibilidad. Fácil implementación sin una curva de aprendizaje empinada. La implementación de una solución de monitoreo no debería tomar semanas de ajuste y soporte técnico del fabricante. La configuración de los monitores para un sistema o servicio debe ser facilitada con mecanismos de fácil uso para el administrador. Adicionalmente, las soluciones avanzadas de monitoreo deben proporcionar una interfaz de usuario intuitiva y familiar y requerir de poco entrenamiento formal. Reportes amigables de tendencias de desempeño, estadísticas de fallas y cumplimiento de SLAs. La herramienta de monitoreo ideal produce informes útiles que muestran tendencias históricas y en tiempo real de los desempeños, caídas del servicio, brechas en el cumplimiento del SLA y otra información en un conjunto de reportes con detalles técnicos y al mismo tiempo amigables al administrador ROI inmediato en la inversión en software de monitoreo. Las “Soluciones de Monitoreo Empresarial” pueden tener costos de hasta USD $50.000 y tomar semanas de trabajo en su implementación, ubicándolas fuera de alcance para la pequeña y mediana empresa. Los fabricantes de las herramientas más avanzadas en monitoreo ofrecen soluciones que abarcan las funcionalidades descritas anteriormente por una fracción del costo y del esfuerzo requerido por otras herramientas tradicionales. Una estimación conservadora de Gartner indica que el costo promedio del tiempo de interrupciones para una red de computadores es de USD $42.000 por hora. Gartner también estima que las empresas suelen experimentar un total de 87 horas de tiempo de interrupciones al año. Una empresa que experimente más de 175 horas al año en interrupciones podría ahorrar hasta 3,6 millones de dólares anualmente mediante la implementación exitosa de tecnologías de monitoreo para reducir el tiempo de inactividad al promedio de las 87 horas. Con la creciente complejidad y cantidad de equipos de cómputo y software, monitorear el estado de salud de estos sistemas ya no es posible hacerlo manualmente. Específicamente, el software de monitoreo debe ser utilizado continuamente para ejecutar pruebas que aseguren que todos los elementos de la infraestructura IT funcionen apropiadamente. Gartner señala que cuando los sistemas críticos fallan, las empresas pagan muy caro en términos de productividad, sufren daños en su reputación y se afectan sus rendimientos financieros. Cuando las fallas ocurren, minimizar la interrupción causada es crucial para limitar el impacto en los procesos del negocio. Si un sitio web corporativo, disponible las 24 horas al día, 7 días a la semana, se ve interrumpido, la compañía pierde una valiosa vía de ventas, contactos, esfuerzos de marketing, y desarrollo de nuevos negocios. Por lo regular, estas pérdidas son difíciles de cuantificar. Las fallas en los sistemas también pueden cortar importantes líneas de comunicación corporativa, las interrupciones frecuentes en los servicios de IT causan a la cultura corporativa pérdida de confianza en estos servicios y sistemas de alta eficiencia, minimizando el retorno de su inversión. Las empresas que desean asumir el reto de mantener su infraestructura IT operacional disponibles 24×7 deben considerar los siguientes requerimientos al invertir en tecnologías de monitoreo que les ayuden a mantener en funcionamiento permanentemente: Vistas de usuario final en tiempo real El conocimiento en tiempo real de los estados de los elementos administrados desde la perspectiva del usuario final puede alcanzarse mediante el monitoreo de puntos de verificación sobre indicadores generados por la operación o funcionamiento de los sistemas monitoreados. Esto permitirá medir y ajustar el desempeño de los recursos y asegurar que los objetivos de productividad e ingresos se cumplan. Capacidad de detectar problemas antes de que impacten la infraestructura IT La vigilancia de las fallas, condiciones de errores, y umbrales de tiempos de respuesta deben ser configurados de forma individual para cada uno de los elementos administrados. Disponer de la flexibilidad al establecer umbrales con diferentes niveles de sensibilidad, permite al administrador mantener un ojo cerrado en áreas críticas y recibir alertas tempranas sobre condiciones de fallas potenciales, antes de que los usuarios de estos sistemas empiecen a llamar a la mesa de ayuda o al departamento de soporte IT. Alertas inmediatas sobre fallas e información detallada para identificar rápidamente las causas raíz y mejorar los tiempos de respuesta y resolución. Las alertas deben incluir información detallada y configurable sobre las condiciones que causan las alertas, incluyendo los códigos de error devueltos por el elemento administrado, mensajes de excepción, entradas de logs, y rutas de traza para identificar la localización exacta del elemento que dispara la alerta. Lo ideal es que el producto de monitoreo proporcione la capacidad de ejecutar comandos o tareas para diagnosticar o resolver problemas tales como reiniciar un proceso o servicio, lanzar un ejecutable, etc.; lo cual ahorra tiempo a la hora de resolver un caso y disminuir el impacto de la falla. Capacidad de funcionar en ambientes e infraestructuras complejas. En infraestructuras pequeñas que no contienen demasiados elementos críticos para el funcionamiento del negocio, el monitoreo simple de los servicios puede proporcionar una defensa adecuada contra la problemática que afecta la disponibilidad. Sin embargo, en infraestructuras mucho más grandes y heterogéneas, cada elemento administrado debe ser monitoreado haciendo uso de los protocolos estándar en la industria, apropiados para cada dispositivo, servicio o aplicación. Por ejemplo, a los servidores no solo se les debe monitorear variables tales como el consumo de procesador, el uso de disco duro, o las estadísticas de consumo de memoria, sino también ocurrencias específicas de errores y problemas potenciales que pueden surgir en la ejecución de los procesos o de los servicios y en los registros de eventos. Las herramientas avanzadas de monitoreo toman ventaja de los comandos SNMP (Simple Network Management Protocol) para monitorear profundamente dentro de la infraestructura IT. Las bases de datos deben ser monitoreadas con el fin de asegurar que acepten conexiones, ejecuten las consultas y devuelvan los resultados esperados. Finalmente, el servidor web debe ser monitoreado para obtener una vista acumulativa de la disponibilidad y del tiempo de actividad del servicio. Visibilidad de redes e infraestructuras no controladas. Muchos fabricantes ofrecen herramientas basadas en agentes que requieren la instalación de agentes en los dispositivos administrados (servidores, estaciones de trabajo, laptops, etc.). Estos agentes recolectan y envían información del desempeño a un servidor de monitoreo central. Sin embargo, la instalación de agentes en dispositivos que no están bajo el control de TI puede ser un inconveniente. Adicionalmente, estos agentes requieren de cierto mantenimiento, lo cual agrega complejidad al despliegue y a la gestión posterior de la solución de monitoreo. Las soluciones que no requieren de agentes y que utilizan protocolos estándar para conectarse directamente, consultar, publicar o simular de alguna manera la actividad del usuario y las estadísticas de desempeño, son transparentes para la infraestructura de soporte y proveen mediciones precisas, sin agregar sobrecargas o mantenimientos adicionales. Flexibilidad para implementar rápidamente nuevos elementos de monitoreo a medida que cambian las prioridades del negocio. Nada en los negocios se encuentra exento al cambio. Las nuevas aplicaciones y su correspondiente infraestructura deben ser incluidas en el sistema tan rápidamente como las prioridades del negocio cambien y por consiguiente demanden el monitoreo de un nuevo sistema o dispositivo. Por lo tanto, la flexibilidad para interactuar directamente con la consola de administración para agregar, cambiar o suspender fácilmente el monitoreo de un elemento es críticamente importante. Adicionalmente, la capacidad de cambiar el estado del monitoreo de l recurso en tiempo real, ayuda a preservar la precisión de los reportes de los Acuerdos de Niveles del Servicio (SLA) y de las estadísticas de disponibilidad. Fácil implementación sin una curva de aprendizaje empinada. La implementación de una solución de monitoreo no debería tomar semanas de ajuste y soporte técnico del fabricante. La configuración de los monitores para un sistema o servicio debe ser facilitada con mecanismos de fácil uso para el administrador. Adicionalmente, las soluciones avanzadas de monitoreo deben proporcionar una interfaz de usuario intuitiva y familiar y requerir de poco entrenamiento formal. Reportes amigables de tendencias de desempeño, estadísticas de fallas y cumplimiento de SLAs. La herramienta de monitoreo ideal produce informes útiles que muestran tendencias históricas y en tiempo real de los desempeños, caídas del servicio, brechas en el cumplimiento del SLA y otra información en un conjunto de reportes con detalles técnicos y al mismo tiempo amigables al administrador ROI inmediato en la inversión en software de monitoreo. Las “Soluciones de Monitoreo Empresarial” pueden tener costos de hasta USD $50.000 y tomar semanas de trabajo en su implementación, ubicándolas fuera de alcance para la pequeña y mediana empresa. Los fabricantes de las herramientas más avanzadas en monitoreo ofrecen soluciones que abarcan las funcionalidades descritas anteriormente por una fracción del costo y del esfuerzo requerido por otras herramientas tradicionales.