
Las organizaciones comerciales están rediseñando su infraestructura y aplicaciones de TI para superar los desafíos asociados con las tecnologías más antiguas.
En lugar de desarrollar software monolítico estrechamente acoplado con hardware local (que debe administrarse cuidadosamente para evitar interrupciones impredecibles y tiempo de inactividad del rendimiento), las organizaciones están recurriendo a la contenedorización y los microservicios. Estos pueden ejecutar componentes de aplicaciones independientemente del hardware subyacente y las dependencias externas.
El contenedor actúa como una burbuja, donde los componentes de la aplicación se empaquetan con todas las bibliotecas, dependencias y archivos de configuración necesarios para ejecutar un entorno informático completamente funcional y portátil.
Esto conduce a un mayor desafío de observabilidad para los equipos de infraestructura y operaciones (I&O): el consumo supera con creces los presupuestos de infraestructura debido a la visibilidad inadecuada de los sistemas en contenedores.
Con una avalancha de contenedores y herramientas de administración de infraestructura distribuidas en un sistema grande, ¿cómo se realiza el seguimiento, el proceso y el control de los estados de rendimiento de cada componente de la aplicación y la infraestructura más amplia y el sistema consolidado?
Combinando observabilidad e inteligencia artificial.
La observabilidad se refiere a la capacidad de inferir los estados internos de un sistema a partir de sus salidas externas. En el contexto de la computación en la nube distribuida, las herramientas de observabilidad procesan datos de métricas de registro generados en los nodos de un sistema en red para rastrear un evento hasta su origen.
La observabilidad se diferencia del monitoreo en que este último utiliza un mecanismo de alerta basado en reglas predefinidas y preconfiguradas. A diferencia de un escenario de monitoreo donde los umbrales métricos se pueden atribuir directamente a eventos potenciales, la observabilidad toma una perspectiva más profunda para obtener información y comprender el comportamiento de la red y el rendimiento de la aplicación.
Las herramientas modernas de observabilidad se basan en datos y se basan en algoritmos avanzados de inteligencia artificial y aprendizaje automático (AI/ML) para clasificar eventos en función de patrones ocultos en los grandes datos de registro de la red.
La IA mejora las capacidades de observación para ofrecer resultados de servicios de TI predecibles de las siguientes maneras:
Modelado del comportamiento del sistema y servicios dinámicos.
En lugar de crear manualmente relaciones entre los elementos de configuración de los servicios y los componentes de la aplicación, un modelo de IA puede aprender a modelar el sistema y sus relaciones asociadas. Una vez que el modelo está entrenado para emular con precisión el comportamiento del sistema, los conocimientos dentro de las nuevas métricas de registro y el comportamiento cambiante del sistema se pueden asignar al rendimiento del sistema, identificando relaciones y descubriendo dependencias para casos de uso de observabilidad.
Observabilidad y aprendizaje adaptables.
A medida que se crean nuevos servicios en contenedores, los nuevos elementos de configuración pueden ser dinámicos y temporales: cualquier dependencia podría mantenerse durante un período específico y desconocido y causar un impacto significativo en el rendimiento del sistema. Los modelos de IA se pueden entrenar dinámicamente, en línea y sobre la marcha a medida que se generan nuevos datos de métricas. Esto asegura la observabilidad al considerar la dinámica cambiante del sistema y, por lo tanto, un análisis de observabilidad preciso.
Análisis complejo y a gran escala.
El análisis de observabilidad implica el procesamiento de métricas de registro de un flujo cada vez mayor de información generada a través de la red de TI. Los parámetros, las relaciones y las dependencias que afectan a cada servicio y sistema de TI crecen exponencialmente y se extienden a través de entornos locales y en la nube. AI automatiza el proceso de recopilar métricas relevantes, descubrir activos y aplicar cambios de configuración automáticamente en función de políticas organizacionales predefinidas.
Optimización de costes.
Con el creciente número de implementaciones de contenedores, se vuelve un desafío realizar un seguimiento del rendimiento de los contenedores sin una tubería de observación extensa y automatizada. Las tecnologías de IA permiten a los equipos de I&O comprender el coste real de los servicios distribuidos y los componentes de la infraestructura en contenedores con análisis de registros y seguimientos agregados.
Los modelos de IA reconocen dónde se sobreaprovisionan las implementaciones de contenedores y administran los recursos de manera óptima según sea necesario. Por lo tanto, los costes de infraestructura pueden validarse mediante datos de consumo y optimizarse en función de las necesidades cambiantes de los equipos de desarrollo y control de calidad.
Análisis de causa raíz.
La canalización de observabilidad habilitada por IA le permite obtener información sobre el comportamiento de su sistema de TI y hacer preguntas hipotéticas sobre cómo se comporta el sistema con respecto a la dinámica cambiante, incluida la introducción de nuevos servicios, relaciones y cambios de configuración.
Esto conduce a una depuración más rápida, un análisis de la causa raíz y una identificación proactiva del impacto potencial antes de que el incidente se propague por la red.
Automatización e integración inteligentes.
Una de las tareas más importantes para generar un análisis de observabilidad preciso es recopilar datos e integrar la gestión de recursos en fuentes y herramientas desacopladas. Cuando los equipos de I&O operan una canalización de observabilidad que desacopla las herramientas de la fuente de datos, pueden procesar los datos de métricas por separado, integrar la creciente cantidad de fuentes de datos y usar tecnologías de IA para realizar el análisis necesario.
Como resultado, la tarea de identificación de problemas y gestión de incidentes también se puede automatizar, y el conjunto integrado de activos de datos puede permitir la automatización inteligente para el rendimiento de las aplicaciones y las tareas de gestión de la infraestructura.
Mejoras en la experiencia del usuario.
Los modelos de IA se pueden usar para priorizar los cambios en función de los comentarios inmediatos de los clientes. Al ejecutar los datos de observabilidad a través de los modelos de IA, las organizaciones pueden comprender cómo los parámetros específicos del sistema, los servicios, los cambios de configuración y las métricas de rendimiento afectan la experiencia del usuario final.
Dado que las organizaciones a gran escala invierten cada vez más en tecnologías de contenedores para mejorar la experiencia del usuario final, acelerar los ciclos de vida de desarrollo de software y mejorar la calidad de los lanzamientos de software, los líderes de I&O están reevaluando la viabilidad de las herramientas de observación tradicionales para administrar de manera efectiva las operaciones de infraestructura.
Al combinar capacidades avanzadas de inteligencia artificial y observabilidad, estas organizaciones pueden obtener información sobre cómo se comportan los sistemas de infraestructura complejos para ayudar a sus equipos de TI a optimizar los costes y el rendimiento de la infraestructura.
Fuente BMC.