BLOG

Aprovecha el poder de las métricas, trazas y registros en tu negocio

Analítica de Datos  Blogs

En este artículo analizaremos los conceptos de métricas, trazas y registros, a menudo llamados los “Tres pilares de la Observabilidad”. Cada uno de estos puede proporcionarte información clave para identificar problemas y causas, ampliando significativamente su poder cuando se usan en conjunto.

Si retrocedemos lo suficiente en la historia de la computación, encontraremos que antes no habían registros, ni trazas, ni métricas. La “aplicación” sencillamente se hacía cargo de un sistema, o no.

Pero incluso entonces, había un concepto para encontrar problemas dentro de los sistemas, llamado “cerca de lobos”, acuñado alrededor de 1982. El nombre surgió de una idea para encontrar un lobo en Alaska.  Primero, se construye una valla en medio de un territorio, luego se espera escuchar el aullido del lobo y se determina en qué mitad está.  Entonces se elige ese segmento, se divide en dos y se repite hasta que se encuentra al lobo.

Al formalizar esto como un método estándar de operaciones condujo al concepto de registros, que revelan qué está causando un problema y, a su vez, a nuevas formas de depuración.

 

Todo es un Evento

En primer lugar, podemos decir que todo lo que sucede puede ser considerado un evento. En realidad, si está grabado es un evento. Si no se grabó, para los efectos de un análisis de datos, nunca ocurrió.

Ahora bien, las métricas, las trazas y los registros son todos eventos que se superponen, pero proporcionan diferentes tipos de información que, en conjunto, pintan una imagen completa.

Las aplicaciones modernas proporcionan un conjunto de información tan complejo que puede ser difícil incluso saber qué mirar; hay demasiados componentes interconectados. Solo reuniendo métricas, trazas y registros se puede determinar dónde buscar para identificar un problema.

 

Métricas

Las métricas son datos numéricos capturados a lo largo del tiempo que se pueden comprimir, almacenar, procesar y recuperar mucho más eficientemente que los eventos. Puedes fácilmente correlacionar datos de métricas con otros datos de eventos para recibir alertas sobre lo que acaba de suceder (métricas) y por qué (registros).

Ahora, dado que las métricas provienen de tantas fuentes, si se correlacionan puede accederse a una información más completa de un problema determinado. Por ejemplo, las métricas pueden provenir de servidores, aplicaciones, sensores IoT o casi cualquier máquina que genere datos marcados secuencialmente en el tiempo.

Las métricas se diferencian de los datos de registro en que se pueden almacenar y optimizar más eficientemente para realizar consultas. No contienen la rica información de un registro, pero presentan una medida específica de un sistema a lo largo del tiempo.

 

Trazas

Las trazas hacen exactamente lo que sugiere el nombre: rastrean la ruta de un evento a través de la red. Un seguimiento puede ayudar a identificar dónde ocurre un evento regularmente o se está produciendo un cuello de botella. Si los clientes tienen problemas para iniciar sesión, por ejemplo, un seguimiento puede encontrar la base de datos impidiéndoles obtener acceso.

Además, las trazas ayudan a recopilar los datos proporcionados por las métricas y los registros para tener una imagen completa del rendimiento de un sistema a lo largo del tiempo. En un entorno distribuido de TI que incluye aplicaciones en contenedores y microservicios, una solicitud o acción puede viajar a través de una variedad de sistemas. Una traza incorpora toda la información para crear un mapa de ese viaje y lo que ocurrió en el camino.

Una traza normalmente captura datos sobre:

  • Intervalos (nombre del servicio, nombre de la operación, duración y otros metadatos).
  •  Errores
  • Duración de operaciones importantes dentro de cada servicio.
  • Atributos personalizados.
 

Si bien los tres tipos de datos se tratan por separado, en realidad todos se superponen.

Los registros y las trazas pueden producir métricas, y las métricas pueden llevarte a la traza o registro correcto. Por lo tanto, con métricas, trazas y registros, puedes reconocer problemas más rápido para encontrar la causa raíz subyacente.

 

Registros

Los registros son registros de eventos generados por el sistema que ocurren dentro de una aplicación.

Los sistemas de TI modernos generan muchos archivos de registro que rastrean todo lo que pasa. Para monitorear esos sistemas existen soluciones como Splunk, que se articulan sobre la capacidad de analizar los datos de registro y usarlos para identificar y solucionar problemas del sistema y prevenir que se repitan.

Su mayor valor es que proporcionan más información y contexto sobre por qué ocurrió un problema, en lugar de solo los datos que identifican el evento.

Ahora bien, el desafío de usar registros para identificar y remediar problemas es de volumen; ya que los sistemas generan tanta información de registro que encontrar las pistas más importantes puede ser muy difícil. Además, existen múltiples formatos de registro utilizados por múltiples sistemas en la red de una organización, por lo que el camino hacia la resolución de un problema puede verse oscurecido.

Algunos ejemplos de registros son:

  • Registros del sistema y del servidor (syslog, journald).
  • Registros de un sistema de detección de intrusos y cortafuegos.
  • Feeds de redes sociales (Twitter, etc.)
  • Registros de aplicaciones, plataformas y servidores (log4j, log4net, Apache, MySQL, AWS).
 

¿Para quienes tienen sentido estos 3 pilares?

Para algunas organizaciones, las métricas pueden proporcionar la suficiente información como para que puedan resolver la mayor parte de sus problemas.

Para departamentos de TI con infraestructuras simples que generan cantidades comparativamente pequeñas de datos, se puede obtener lo que necesitan solo desde las métricas. Además, hay que destacar que no todas las organizaciones necesitan identificar problemas con rapidez.

Pero si estás leyendo esto, lo más probable es que seas responsable del rendimiento de sistemas en un negocio dinámico e impulsado digitalmente.

En tu caso, si combinas métricas, trazas y registros podría ser un gran paso adelante en la modernización de las TI en tu empresa.

 

¿Te interesa avanzar en el monitoreo de tus sistemas? Podemos ayudarte a sacar el máximo provecho de tus datos, solo debes escribirnos a [email protected].

¡Sigamos en contacto!