Un acuerdo de nivel de servicio (SLA) es un contrato jurídicamente vinculante entre un proveedor de servicios y sus clientes. Documenta el nivel de servicio que se espera del proveedor de servicios y describe las expectativas y requisitos del cliente. Un SLA define los parámetros con los que se mide la calidad de los servicios, las penalizaciones en las que se puede incurrir si no se alcanzan los niveles de servicio acordados y las resoluciones a cualquier incumplimiento del SLA.
Las penalizaciones para una empresa derivadas del incumplimiento de un SLA pueden ser elevadas. El tiempo de inactividad tiene un impacto significativo en la cuenta de resultados de una empresa, incluyendo mayores costes de mano de obra, pérdida de clientes, pérdida de ingresos y la posibilidad de pagar penalizaciones por SLA, por lo que es una métrica importante de monitorear y vigilar. Una encuesta de ITIC reveló que el coste por hora de las métricas de SLA comúnmente medidas, como el tiempo de inactividad, puede superar los 300.000 dólares para el 91% de las PYMES y grandes empresas.
Los acuerdos de nivel de servicio son un componente crucial para cualquier empresa, pero lo son especialmente para las asociaciones entre clientes y proveedores de servicios en el ámbito tecnológico. Pueden diseñarse para apoyar a ambas partes en estas asociaciones. Sin embargo, los SLA estándar proporcionados por los proveedores de servicios suelen ser genéricos, se aplican ampliamente a todos sus clientes y, en ocasiones, pueden ser unilaterales. Por ello, las empresas deben recurrir a asesores jurídicos para garantizar la inclusión de intereses específicos del cliente en un SLA, por ejemplo, cláusulas de escape.
Hay tres tipos principales de SLA: corporativo, de cliente y de servicio. Pueden combinarse para crear acuerdos multinivel.
Un SLA corporativo define el nivel de servicio para requisitos empresariales específicos, como la seguridad, en toda una organización. Un SLA basado en el cliente describe los servicios que puede utilizar un cliente concreto, por ejemplo, el departamento financiero de una organización. Un contrato basado en el servicio cubre un único servicio, por ejemplo, el uso de una aplicación, prestado por un proveedor de servicios a un cliente o empresa. La mayoría de las organizaciones utilizan varios tipos de SLA para crear una estructura de SLA jerárquica o de varios niveles.
Los servicios pueden ser prestados por proveedores externos o internamente entre departamentos de una organización. Por ejemplo, el departamento de TI de una organización puede establecer un SLA entre él y otro departamento para proporcionar servicios de hardware y soporte.
Un objetivo de nivel de servicio (SLO) es un acuerdo en un SLA sobre una métrica específica y cuantificable, como la disponibilidad del sistema o el tiempo de respuesta. Un SLO define la métrica de un SLA, por ejemplo, que el tiempo de actividad debe ser del 99,99%.
Los SLA se utilizan externamente para definir un acuerdo entre las dos partes. Los SLO son objetivos que se miden internamente para evaluar si se cumple un punto de referencia SLA. El seguimiento de los SLO se realiza midiendo indicadores específicos del nivel de servicio (SLI).
Un SLI mide el cumplimiento de un SLO. Un SLI es una medida interna que proporciona métricas reales para comparar con el SLA. Por ejemplo, si el nivel de tiempo de actividad especificado es del 99,99% y el tiempo de actividad real, el SLI, es del 99,5%, significa que no se ha cumplido el nivel de servicio acordado.
A diferencia de los SLA, los SLO no conllevan consecuencias contractuales, que son penalizaciones que se producen cuando no se cumplen los puntos de referencia especificados en un SLA. Los SLA son legalmente exigibles.
Las alertas personalizadas y la visualización de datos le permiten identificar y prevenir rápidamente los problemas de salud y rendimiento de la red.
Un SLA puede incluir una descripción del servicio, objetivos del servicio, condiciones contractuales y cláusulas de rescisión, así como objetivos de rendimiento y métricas del nivel de servicio. Para garantizar un medio de rendición de cuentas, un SLA define responsabilidades y funciones tanto para el cliente como para el proveedor. Los procedimientos de gestión de problemas, resolución de conflictos y violaciones de la seguridad son cruciales para crear un SLA aplicable. Un SLA sólo es eficaz si existen procesos para monitorear, medir e informar sobre las métricas.
Las tres áreas principales de medición de los SLA son el rendimiento del sistema, el rendimiento de la respuesta y la satisfacción del cliente. Las dos primeras mediciones afectan a la satisfacción del usuario final.
Los acuerdos de nivel de servicio satisfactorios son aquellos que alcanzan los parámetros de rendimiento y respuesta definidos y cumplen las expectativas de los usuarios finales.
La priorización de las métricas de los SLA será diferente para los distintos tipos de servicios. Por ejemplo, el tiempo de actividad y la disponibilidad serían más importantes para un servicio de alojamiento web, mientras que los tiempos de respuesta a las llamadas y las tasas de resolución serían más relevantes para un centro de llamadas.
Las métricas de rendimiento más comunes son la latencia, la pérdida de paquetes, el rendimiento, el ancho de banda, la tasa de errores de red, la tasa de respuesta de red, el tiempo de actividad, la fiabilidad, la tasa de resolución de problemas, las métricas de costes (por ejemplo, medidas por la utilización de recursos y los gastos operativos), las tasas de éxito de copias de seguridad y recuperación, las alertas de incidentes, el número de infracciones de cumplimiento, las tendencias de uso de recursos, los errores de software, las infracciones de seguridad y el rendimiento de los componentes de infraestructura.
Una métrica importante que las empresas deben tener en cuenta es la satisfacción del cliente, ya que coincide con el objetivo de alto nivel de un SLA: retener a los clientes antiguos y captar a los nuevos. Alineado con esto está medir el número de "resoluciones de autoservicio", o situaciones en las que los clientes resuelven sus tiquetes de soporte utilizando herramientas e información proporcionadas en el sitio web de una empresa.
Las penalizaciones se especifican en un SLA para que, si el proveedor de servicios no cumple sus obligaciones contractuales, el cliente pueda ser compensado por la interrupción del negocio y la pérdida de productividad. La compensación puede adoptar la forma de penalizaciones económicas o créditos de servicio, como la ampliación de los plazos de licencia o la asistencia adicional al cliente por parte de un proveedor. Sin embargo, los clientes también tienen que sopesar el coste de la reparación legal frente a las pérdidas financieras; por esta razón, un SLA debe incluir procesos para gestionar los problemas controvertidos.
Para resolver los problemas controvertidos, se pueden utilizar como prueba del incumplimiento de un SLA las métricas seguidas y medidas mediante una herramienta de informes de SLA.
Las cifras del coste de las penalizaciones por SLA difieren, pero siempre son elevadas.
En 2011, Virgin Blue (ahora Virgin Australia) hizo pagar al proveedor de sistemas de reservas Navitaire casi 15 millones de dólares en concepto de daños y perjuicios cuando se incumplió su acuerdo de SLA. Los cortes de Navitaire habían durado 11 días, afectando a miles de pasajeros de Virgin Blue.
Originalmente, la razón para crear acuerdos de nivel de servicio en el sector de TI era establecer las expectativas y la responsabilidad de los proveedores de servicios, sobre todo cuando se externalizaban servicios. Hoy en día, la mayoría de las empresas cuentan con acuerdos de nivel de servicio para garantizar el cumplimiento de las expectativas de los clientes, eximirse de las consecuencias de los fallos del sistema y exigir responsabilidades por los niveles de servicio deficientes. Los acuerdos de nivel de servicio reducen los malentendidos entre proveedores de servicios y clientes y sirven de criterio para medir y mejorar el rendimiento del servicio.
La gente espera mucho de las empresas digitales y exige unos niveles elevados, como tiempo de actividad, velocidad, disponibilidad y facilidad de uso. Las empresas incluyen los SLA en sus contratos para establecer las expectativas y responsabilidades propias y de sus proveedores de servicios, de modo que puedan ofrecer altos niveles de servicio a sus clientes. Estos acuerdos estandarizados se utilizan en muchos sectores, como el marketing, el comercio electrónico y el SEO.
El objetivo al establecer una métrica no es agitar un palo, sino motivar un comportamiento positivo por parte del proveedor de servicios. Por lo tanto, al crear un SLA, se establece una línea de base con medidas definidas para niveles de rendimiento razonables y alcanzables.
Los acuerdos de nivel de servicio no son lo mismo que los términos y condiciones. Los SLA se centran en la prestación de servicios y en las normas, mientras que los T&C se centran en las condiciones de venta, licencia y uso.
Los SLA responden a preguntas como ¿Con qué rapidez se resolverá un problema? ¿Cómo se protegen los datos de los clientes? ¿Cuándo estará disponible un sistema?
Los acuerdos de nivel de servicio fueron utilizados originalmente por los proveedores de servicios de red para mejorar el rendimiento del sistema y satisfacer las expectativas de los clientes en el espacio digital.
Las métricas que deben medirse y analizarse en el monitoreo de redes incluyen los tiempos de respuesta de la red, la disponibilidad del sistema, los tiempos de resolución de problemas, la satisfacción del cliente y las métricas relacionadas con el rendimiento. Las métricas relacionadas con el rendimiento y la respuesta incluyen la utilización de recursos, las tasas de error de código, el rendimiento, los tiempos de respuesta de las aplicaciones, la seguridad de los datos y el tiempo medio de respuesta (MTTR).
Uno de los principales focos de atención del monitoreo de redes es la disponibilidad del sistema. Incluye diversos factores, como el tiempo que se tarda en recuperar un sistema, si los datos se han visto comprometidos en un ciberataque y si la empresa ha sufrido daños en su reputación.
Las notificaciones en tiempo real significan una solución de problemas más rápida para que pueda actuar antes de que se produzcan problemas más graves.
Las métricas de los SLA pueden ser difíciles de medir, seguir e informar. Por ejemplo, si una empresa promete resolver un problema en una hora, puede que no se tenga en cuenta que el servicio de asistencia no tiene toda la información que necesita para diagnosticar el problema, por ejemplo, si el cliente que registró el problema se ha ido de vacaciones.
El monitoreo automatizado de la red puede ayudar, ya que permite a los proveedores de servicios y a los TI Teams resolver las incidencias antes de que se conviertan en un problema para los clientes.
Los informes de SLA garantizan que los proveedores de servicios sean responsables de ofrecer el nivel de servicio acordado. Los informes de SLA también protegen a los proveedores de servicios de posibles desviaciones en las demandas de sus clientes y ayudan a resolver disputas contractuales.
Los informes de SLA ayudan a los desarrolladores a identificar incumplimientos y errores del sistema. Ayudan a los desarrolladores a identificar los cuellos de botella del sistema y las áreas de mejora.
Los informes de SLA ayudan a los departamentos financieros, DevOps y equipos de gestión a elaborar estrategias, planificar y tomar decisiones con información útil sobre la asignación de recursos, la capacidad y el potencial de ampliación de la empresa.
Las métricas de SLA y los indicadores clave de rendimiento (KPI) no son lo mismo. Los SLA definen las obligaciones contractuales, mientras que los KPI realizan un seguimiento de las métricas de rendimiento para la mejora continua. Los SLA pueden utilizarse para identificar áreas en las que se puede mejorar el rendimiento del sistema, pero no es su objetivo principal.
La mayoría de las organizaciones que tienen o utilizan servicios tienen ANS. Aunque suelen existir con proveedores externos, también es posible que una organización utilice acuerdos de nivel de servicio entre departamentos. Los acuerdos de nivel de servicio se aplican siempre que pueda surgir un problema, por pequeño que sea.
Son utilizados por numerosos tipos de proveedores de servicios, incluidos los proveedores de servicios de red, los proveedores de servicios en la nube, los proveedores de servicios gestionados (MSP) y los centros de datos. Las empresas digitales, los servicios de comercio electrónico y las empresas que ofrecen aplicaciones de monitoreo de seguridad implementan SLA.
Los SLA no son acuerdos de talla única y deben negociarse para adaptarse a las necesidades y requisitos de una organización.
Los contratos entre empresas y proveedores de servicios suelen llevar asociado un SLA para evitar interpretaciones erróneas deliberadas o involuntarias.
Los SLA se utilizan cuando es necesario formalizar la relación entre los proveedores de servicios y sus clientes. Aunque inicialmente se utilizaron en entornos de TI, también son relevantes en sectores como el marketing, las ventas y la SEO, en los que las empresas suelen depender de agencias externas. Por ejemplo, los mercados en línea contratan consultores SEO para mejorar su posicionamiento en los motores de búsqueda.
Los SLA abarcan dos áreas principales: servicio y gestión. Los elementos de servicio pueden incluir normas aceptables de servicios, servicios excluidos y compensaciones entre costes y servicios.
Los elementos de gestión pueden incluir un proceso de resolución de conflictos, una cláusula de indemnización que proteja al cliente de litigios con terceros en caso de incumplimiento del nivel de servicio y un método para actualizar el acuerdo. Los acuerdos de nivel de servicio son un trabajo en curso, en el que las ofertas y capacidades de los proveedores y los requisitos empresariales pueden cambiar a menudo. Por ejemplo, unos equipos más fiables o unas herramientas de monitoreo de SLA más fiables podrían hacer posibles unas mejores garantías de servicio. Para tener en cuenta los cambios empresariales y técnicos estratégicos, los acuerdos de nivel de servicio deben revisarse periódicamente.
Los acuerdos de nivel de servicio permiten a las empresas mantener los estándares de servicio, identificar las deficiencias del servicio y añadir nuevos requisitos empresariales a medida que una empresa crece o añade nuevas funciones a sus sistemas.
Los SLA garantizan el cumplimiento de la normativa pertinente del sector, establecen penalizaciones por un rendimiento deficiente y pueden ofrecer incentivos por un rendimiento excelente.
Una matriz de rendimiento puede ayudar a fomentar la lealtad del cliente cumpliendo sus expectativas.
Los acuerdos de nivel de servicio garantizan la continuidad del negocio estableciendo los procesos a seguir en caso de desastre y describiendo las mejores prácticas.
Los SLA responsabilizan a los proveedores de servicios de sus compromisos. Por ejemplo, un SLA puede especificar que un cliente puede reducir la tarifa del proveedor en un porcentaje determinado si no se alcanza un tiempo de actividad del 99,99%, como demuestra el SLI de la empresa.
Un SLA puede utilizarse como punto de referencia para resolver disputas entre las empresas y sus proveedores de servicios, y entre las empresas y sus clientes.
Monitorear los SLA ayuda a los proveedores de servicios a detectar posibles problemas con antelación, lo que les permite tomar medidas correctivas proactivas.
La mejor manera de vigilar el rendimiento es desplegar una herramienta de monitoreo de red de extremo a extremo, como con Paessler PRTG. Esta herramienta permite a las organizaciones configurar y monitorear servicios empresariales, que abarcan servicios de usuario, infraestructura y aplicación. Los servicios se basan en sensores que monitorean sensores asociados a dispositivos o componentes. Se definen SLO para estos sensores, por ejemplo, cuáles son las tasas de fallo aceptables para un dispositivo y qué prioridad tiene la fiabilidad de un dispositivo. Si se alcanza un valor de SLO, se puede considerar que se ha incumplido el SLA asociado y tomar medidas correctoras.
Las herramientas de monitoreo ofrecen a los empleados de distintas funciones visibilidad sobre el rendimiento del sistema a través de interfaces de usuario fáciles de usar.
Los factores externos pueden interrumpir un servicio e influir en el rendimiento del SLA, por lo que deben estar contemplados en un SLA. Estos factores incluyen ciberataques, condiciones meteorológicas (por ejemplo, daños en los equipos por inundaciones o incendios), comportamiento inusual de los usuarios (por ejemplo, grandes volúmenes durante competiciones o ventas en una plataforma de comercio electrónico) y cambios en las normativas de cumplimiento.
Medir demasiadas métricas puede ser contraproducente y provocar demasiados incumplimientos de los SLA. Los SLA están pensados para cubrir procesos básicos y tener demasiados puede diluir el impacto de uno, confundiendo al proveedor sobre qué priorizar. Demasiadas métricas pueden desviar la atención de los servicios de misión crítica a los de menor prioridad. Debe tenerse en cuenta si el proveedor de servicios puede controlar si una métrica funciona según lo especificado.
Cuando hay acuerdos de nivel de servicio separados para procesos de varios proveedores, puede ser difícil hacer responsables a los proveedores de las partes que están fuera de su alcance.
Los cambios en un SLA pueden afectar negativamente a los equipos de soporte, haciendo imposible el cumplimiento de sus obligaciones a menos que se les haya notificado los cambios a tiempo y hayan recibido la formación adecuada.
Los SLA estándar son buenos para medir los procesos y métricas de TI, pero no miden la satisfacción del usuario final.
La respuesta puede ser una combinación de SLA y acuerdos de nivel de experiencia (XLA) para tener en cuenta la calidad de la experiencia del usuario final.
PRTG es un software de monitoreo de red integral y realiza un seguimiento de toda su infraestructura de TI.
PRTG SLA Reporter de Paessler es una potente herramienta que le permite realizar un seguimiento de sus SLA. Permite a las organizaciones seleccionar elementos del árbol de dispositivos de PRTG y definir qué objetos de monitoreo se utilizan para monitorear un SLA. Los objetos de monitoreo incluyen elementos como sensores, sondas y dispositivos.
Una vez en funcionamiento, lo que puede hacerse en cinco sencillos pasos, PRTG SLA Reporter genera informes de SLA automáticamente. Una de las principales características de PRTG SLA Reporter es que permite a los Teams de TI reclasificar retroactivamente las interrupciones como planificadas o no planificadas, y perfeccionar sus SLA a medida que cambian los requisitos.