SLA y entrega de datos

El retraso de la entrega de datos y el incumplimiento SLA o ANS es un problema identificado por las entidades ya que tiene impacto en negocio.

Qué es un SLA o un ANS:

Aplicados a la producción informática los SLA o ANS, (Acuerdos de nivel de servicio) son una condición de disponibilidad de datos. Bien por hora de finalización o por duración total de una malla de procesado.

SLA-entrega-de-datos-A

Los incumplimientos en los horarios de entrega de datos, impactan en la apertura de operativas online que dan servicio a las oficinas y clientes.

Anualmente van en aumento, debido al volumen creciente de datos a procesar.

Tipos de SLA o ANS:

Las entidades suelen dividirlos en diferentes niveles según su criticidad, pero básicamente podemos diferenciar dos grandes bloques por su nivel de impacto en el negocio digital.

SLA-entrega-de-datos-B

De Negocio:

Con una criticidad alta, su incumplimiento supone un impacto sobre la entidad: afectación de disponibilidad parcial del servicio online, sanción o pérdida económica.

Algunas entidades con datos comprometidos por ejemplo son: Banco de España, Banco Central Europeo, Sepa, Sareb, Iberpay o Iberclear, entre otras.

SLA-entrega-de-datos-C

De Gestión:

Su incumplimiento no supone impacto directo sobre el negocio de la entidad, pero repercute en aspectos como imagen de marca.

El retraso en informes sobre productos contratados y ofertas de fidelización puede representar una pérdida de oportunidades para la red comercial.

La arquitectura de los procesos y el diseño de las mallas de procesado puede retrasar la entrega de datos:

Paralelización:

Procesos extremadamente pesados que podrían “partirse” en varios procesos para dividir su duración.

Cíclicos:

Procesos que podrían ejecutarse durante el día avanzando la obtención de datos y eliminando tiempo de procesamiento.

Dependencias:

Procesos que no empiezan, ya que esperan datos que deben ser entregados por otros procesos, incurriendo en “delay”.

Vigilancia de SLA:

Detección de incumplimientos y mallas en riesgo al no disponer de un margen de tiempo de finalización suficiente.

Las estrategias empleadas para avanzar el tiempo de procesamiento deben tener en cuenta múltiples factores:

SLA-entrega-de-datos-BB

Incoming:

Los archivos a tratar que llegan para su procesamiento cada vez tienen un volumen mayor, debido al aumento creciente de las operaciones efectuadas.

SLA-entrega-de-datos-BC

Días de corte:

Este volumen creciente de datos afecta especialmente al tiempo de procesado de los días “clave”, cómo los días de corte, semanales, quincenales o mensuales.

SLA-entrega-de-datos-BD

Mallas paralelas:

Los procesos de algoritmia que asignan puntos de fidelidad por ejemplo, generan mallas paralelas que pueden llegar a retrasar la malla principal, por falta de datos.

Caso de estudio real de la optimización en el horario de entrega de datos comprometidos SLA de una malla de tarjetas.

14-por-cien

Situación inicial de malla. 14% de incumplimientos.

Malla con incumplimientos de SLA en un entorno Hybrid IT. La duración media de la malla era 5:20 horas diarias, 7:30 horas en cierre.

La duración de 7:30h hacía peligrar la finalización, al tener un SLA definido de 8:00h ya que los aumentos puntuales en el procesamiento de datos propiciaban la aparición de incumplimientos.

2-por-cien-A

Caracterización y detección del problema. Responsables, menos del 2% de elementos.

La malla contaba con 1.359 Procesos de los cuales 84 Pertenecían al camino crítico y generaban dependencias.

De forma algorítmica y a través de Logs del planificador, sin instalar nada se detectaron 15 procesos responsables. Menos del 2% del total de procesos.

La prevaloración del ahorro de estos 15 procesos daba como resultado un escenario de reducción de 1:40h.

-2:15 horas

Resultado final de la actuación

Se Trataron un total de 15 procesos con Optimización, Paralelización y ajustes en filtrado. Estas actuaciones tuvieron una inversión de 322 horas de desarrollo y estuvieron implantadas en 64 días.

La reducción efectiva de la malla en producción fue de 2:15 horas en día de corte, solucionando los incumplimientos de SLA y mejorando también su ejecución diaria.

El diseño de software debe enfocarse al uso racional del dato.

En Orizon contamos con la detección algorítmica avanzada de procesos AIOps, visión global de toda la ejecución y simulaciones de caminos críticos SLA, para la detección y solución de estas casuísticas.

BOA-SLA-entrega-de-datos

Poseemos los algoritmos específicos para el análisis recursivo del camino crítico, obtención de candidatos y solución, para lograr su objetivo de finalización.

Estos datos están disponibles en una interfaz gráfica con los datos de los totales del camino, sus dependencias y el detalle de cada proceso implicado.

Esto permite de forma sencilla visualizar que elementos tienen capacidad de paralelizarse o que delays afectan a la duración del camino, así como procesos “ocultos” que retrasan la ejecución.