White paper
White paper de Bloor Autor: Philip Howard Fecha de publicación: febrero de 2016
Comparación de costes y usos de las plataformas de integración de datos en las empresas ágiles
“
La integración de datos debe constituir el eje de las iniciativas de modernización de la arquitectura de datos, por ejemplo, análisis de nueva generación, modernización de aplicaciones, relación global con el cliente, gobernanza de datos, etc.
”
Autor: Philip Howard
1. Resumen ejecutivo n el año 2014, Bloor Research realizó una encuesta entre usuarios de plataformas de integración de datos con objeto de conocer qué uso daban a esa tecnología y a cuánto ascendía el coste de propiedad en un plazo de tres años. Nos basamos en las respuestas a casi 300 cuestionarios para confeccionar nuestro análisis, donde llegamos a la conclusión de que la plataforma de integración de datos de Informatica ofrecía, en general, las mejores cifras en cuanto al coste de propiedad y era, de media, la más fácil de implantar en distintos casos de uso, con una amplia posibilidad de reutilización de competencias, herramientas y código. En este documento, vamos a repasar los resultados obtenidos, no porque sospechemos que las respuestas recibidas en 2014 hayan dejado de tener validez, sino porque estamos convencidos de que se ha producido un cambio en el mercado. En la encuesta, identificamos los casos de uso a los que las organizaciones dedicaban las plataformas de integración de datos. Sin embargo, en el último par de años, hemos observado en las empresas basadas en datos un viraje hacia un enfoque más amplio, del cual ha constituido parte esencial la integración de datos. La integración de datos no se debe considerar como una mera herramienta táctica que facilita una sola implementación o un caso de uso único, sino como una base estratégica para la empresa moderna. La integración de datos debe constituir el eje de las iniciativas de modernización de la arquitectura de datos, por ejemplo, análisis de nueva generación, modernización de aplicaciones, relación global con el cliente, gobernanza de datos, etc. Por consiguiente, las organizaciones deben asegurarse de que su plataforma de integración de datos ofrezca de manera inherente la capacidad, la escala y el rendimiento (por no mencionar la flexibilidad o la agilidad) indispensables para admitir diferentes casos de uso en toda la organización.
E
3
1.1 Base para la empresa ágil La agilidad empresarial (en Bloor Research, se emplea el término “empresa mudable”) es un tema tan extenso que sería imposible de abordar en este informe. En pocas palabras, se entiende por empresa ágil la que posee flexibilidad y capacidad de adaptación suficientes como para adoptar cambios en cuanto sea preciso. Ello se aplica a todos los ámbitos: personal, procesos e infraestructura. La causa fundamental del cambio es la información (esto es, los datos) porque ninguna organización sabe si debe adaptarse a otras circunstancias, ni cómo hacerlo, si carece de información sobre sus actividades o su rendimiento, entre otros factores. Por eso, la infraestructura en que se sustentan dichos datos debe incorporar cierto grado de capacidad estratégica para facilitar el cambio, la transformación y la agilidad. En la práctica, el equipo de TI tiene un doble mandato. Por un lado, debe mantener la empresa en funcionamiento. Por otro, debe dar respuesta al cambiante panorama de datos en que desarrolla su actividad, lo cual implica aprovechar muchas más fuentes de datos que antes (Big Data), de más ubicaciones y basadas en una amplia gama de arquitecturas de implantación física diferentes. Desde el punto de vista de la integración de datos, significa dar cobertura a un abanico mucho mayor de funcionalidades que antes. En el mundo del Big Data, mantener datos oportunos, pertinentes, conectados y de máxima calidad supone un reto bastante más complicado que antes. Además, como el mantenimiento del funcionamiento añade presión al presupuesto, las empresas se centran en la consolidación y la racionalización de las aplicaciones, pero se rebajan costes en estos ámbitos para permitir la inversión en la infraestructura que sustenta la agilidad del negocio. Ello se traduce, en particular y en el contexto de este documento, en la modernización de la arquitectura de datos. Teniendo presentes estas consideraciones, hemos ampliado nuestro informe de 2014 añadiendo algunas observaciones que atañen a la agilidad en la empresa.
White paper de Bloor
“
[…] en el último par de años, hemos observado en las empresas basadas en datos un viraje hacia un enfoque más amplio, del cual ha constituido parte esencial la integración de datos.
”
1.2 Incremento de los datos antes recopilados Con objeto de reunir la información adecuada para extraer conclusiones, Bloor Research llevó a cabo una encuesta en la que participaron 292 empresas que emplean herramientas (o, en algunos casos, codificación manual) de integración de datos con diversos fines. Aunque se hizo especial hincapié en los costes, estos tan solo son (y deberían ser) uno de los distintos factores determinantes a la hora de seleccionar una solución de integración de datos. No obstante, es probable que lo más destacado de los resultados obtenidos en 2014 se refleje en el gráfico que aparece a continuación (Figura 1). En él se muestra el coste total de propiedad calculado a lo largo de tres años, atenuado por dos factores: el número de proyectos en que se utilizó el producto de integración de datos y la complejidad de dichos proyectos (valorada según el número de fuentes y destinos). Ahora bien, si se interpreta este gráfico de forma aislada, puede inducir a error, ya que las cifras, en particular las correspondientes a Microsoft que aparecen tanto en él como en apartados posteriores, no representan una auténtica comparación en términos equivalentes. Consulte en el cuadro lateral más detalles sobre este tema. En esta actualización del informe original, no hemos vuelto a encuestar a los usuarios. Tenemos el convencimiento de que los resultados originales conservan su validez en lo que respecta tanto al coste de propiedad como a los casos de uso
“
Tenemos el convencimiento de que los resultados originales conservan su validez en lo que respecta tanto al coste de propiedad como a los casos de uso individuales. Sin embargo, sí los hemos incrementado con algunos datos obtenidos en la encuesta realizada por TechValidate a finales de 2015.
”
Figura 1: coste total de propiedad en tres años por proyecto y por fuente/destino (miles de USD) 16 14
Codificación manual
SAP
2
IBM
4
Actian
6
Informatica
8
Oracle
10
Microsoft
12
0
© 2016 Bloor
individuales. Sin embargo, sí los hemos incrementado con algunos datos obtenidos en la encuesta realizada por TechValidate a finales de 2015 entre la base de usuarios de Informatica, a la que agradecemos que nos facilitara esta información para reutilizarla en este documento. Conviene señalar, no obstante, que su inclusión no avala ni a Informatica ni su tecnología: la información solo sirve como ejemplo de la clase de utilidades dignas de consideración a la hora de plantear la integración de datos desde el punto de vista estratégico. Respecto al formato, en el apartado 2 se explica la clase de funciones que debe incluir la plataforma de integración de datos para facilitar la modernización de la arquitectura de datos o, en un sentido más amplio, para convertirse en la tecnología que posibilita la empresa mudable. En los fragmentos pertinentes de dicho apartado, también hemos incluido detalles de nuestra encuesta de 2014. En el apartado 3, donde profundizamos en las cifras, figuran otros datos semejantes. En aras de la brevedad, los hemos editado a fin de aportar solo los detalles más prominentes. El texto completo del informe original de 2014 se encuentra disponible aquí.
Cifras relativas a Microsoft Consideramos que las cifras atribuidas a Microsoft en el informe no representan una auténtica comparación en términos equivalentes con los demás productos cubiertos por distintos motivos, pero por dos principales razones. En primer lugar, los entornos de Microsoft suelen ser bastante homogéneos, de modo que el número de fuentes y destinos no refleja con precisión la complejidad de los proyectos. En segundo lugar, las funcionalidades de integración de datos de Microsoft están incluidas en SQL Server, así que los encuestados no tuvieron que suscribir ninguna cuota de licencia ni mantenimiento para utilizarlas. Resulta evidente que ello distorsiona en gran medida los cálculos resultantes.
4
2. Integración de datos para posibilitar empresas ágiles xisten diversas funciones que la plataforma de integración de datos debe ofrecer para facilitar el cambio y la modernización. Aunque solo las vamos a mencionar de pasada, sin ningún orden en particular, resultan útiles para plantear como punto de partida una pregunta dirigida al equipo de negocio que formuló TechValidate. Según se desprende de la Figura 2, la integración de datos no trata solo de resolver problemas técnicos, sino que también puede posibilitar el cambio en el negocio. Aunque las respuestas afectan a Informatica PowerCenter en concreto, cabe esperar otras similares para productos con funcionalidades comparables.
E
2.1 Flexibilidad La primera característica —y quizá la más obvia— de la clase de plataforma de integración de datos deseable consiste en que admita varios casos de uso. Este tema se abordó en 2014. En nuestra encuesta, perfilamos seis ámbitos comunes en los que se pueden utilizar herramientas de integración de datos. Según nuestra experiencia, estos ámbitos o casos de uso representan la gran mayoría de tipos de proyecto en los que se implantan productos de integración. Son los siguientes: 1. Proyectos de migración y consolidación de datos 2. Soluciones de MDM y otras relacionadas 3. Integración de aplicaciones en aplicaciones 4. Implementaciones de data warehousing y business intelligence 5. Sincronización de datos con aplicaciones SaaS 6. Intercambio de datos B2B, por ejemplo, de clientes o proveedores En la Figura 3, que incluye datos de nuestra encuesta de 2014, se muestra la importancia relativa de estas tareas de integración, pues, como cabía esperar, más del 50 % del trabajo de integración se centra en data warehousing o migración de datos, 5
Figura 2: facilitación de la agilidad en la empresa ¿Qué retos de negocio ha permitido solucionar PowerCenter? Datos e informes inoportunos para la toma de decisiones de negocio
52 %
Necesidad de generar datos de mayor calidad que tengan utilidad para el equipo de negocio al tomar decisiones
48 %
Integración y sincronización de datos insuficientes entre las aplicaciones
47 %
Rendimiento o disponibilidad insuficientes para encajar el aumento en el volumen, la diversidad, la velocidad y la complejidad de los datos
41 %
Productividad de TI deficiente y ciclos de desarrollo prolongados Mejor información obtenida a partir de los datos: linaje, análisis de impacto y términos de negocio comunes Costes de TI elevados Problemas de cumplimiento de normativas
28 % 27 % 18 % 14 %
Fuente: encuesta de TechValidate entre 508 usuarios de Informatica PowerCenter
Figura 3: proporción general de casos de uso obtenida en 2014 Integración de aplicaciones B2B Migración de datos Data warehousing Gestión de datos maestros (MDM) Software como servicio (SaaS)
mientras que la suma de la integración de MDM y SaaS representa menos del 15 % del mercado. Como explicaremos en breve, en la actualidad, estamos observando algunos casos de uso adicionales. No obstante, en lo que concierne a las cifras de 2014, también pedimos a los encuestados que identificasen los productos de integración que empleaba su organización en dichos ámbitos y que indicasen el producto con el que tenían más experiencia. En relación con dichos productos, los participantes ofrecieron su opinión sobre la idoneidad de la herramienta en cada uno de los escenarios. No era necesario que el producto o proveedor elegidos se utilizasen en cada escenario, sino que White paper de Bloor
los encuestados considerasen que los productos eran adecuados para ellos. Nota: no recibimos un número suficiente de respuestas por parte de los usuarios de las herramientas de código abierto (como Talend o Pentaho) o de otros proveedores de productos (SAS, Ab Initio, etc.), por lo que no las incluimos en el análisis. En la Figura 4 se refleja esa calificación de idoneidad. En resumen, más de la mitad de los usuarios de Informatica pensaba que el producto era adecuado en casi todos los casos de uso antes citados. Por el contrario, Actian y SAP se consideraron apropiados para menos de la mitad de los casos de uso.
Ahora están saliendo a la luz nuevos casos de uso de integración de datos, lo cual se refleja en los datos de TechValidate que aparecen en la Figura 5. Por ejemplo, el 26 % de los usuarios de PowerCenter lo utiliza para casos de uso en tiempo real y el 6 % ya lo emplea para los entornos híbridos o de cloud. De forma más general, el 88 % de los usuarios de PowerCenter lo implanta para análisis y data warehousing, mientras que las cifras de “modernización, migración o consolidación de data warehouses” y “consolidación o migración de aplicaciones” alcanzan el 44 y el 31 %, respectivamente. También alcanza un significativo 48 % la integración de aplicaciones en aplicaciones.
Aparte de preguntar a los usuarios sobre la idoneidad de herramientas concretas, también analizamos el número de proyectos, por casos de uso, en que utilizaban su plataforma de integración de datos, o planeaban hacerlo. Los resultados aparecen en la Figura 6. Informatica es el producto más adecuado en general y también es el proveedor líder en dos categorías: B2B y data warehousing. Oracle se sitúa al frente de la integración de aplicaciones y SaaS; SAP, de la migración de datos; e IBM, de MDM. Por supuesto, IBM, Oracle y SAP (sin olvidar a Microsoft) imponen algún grado de dependencia a su base de clientes, por lo que, hasta cierto punto, les favorecen las cifras si tenemos en consideración funcionalidades generales. Por eso, el liderazgo de Informatica es todavía más impresionante.
4
1
IBM
2
Actian
3
SAP
5
Oracle
7 6
Microsoft
8
Informatica
Codificación manual
Figura 4: número de casos en que al menos el 50 % de los encuestados consideraba adecuado al proveedor
0
Figura 5: reutilización de casos de uso de PowerCenter ¿En qué proyectos ha empleado PowerCenter su organización? Data warehousing y análisis
88 %
Integración de aplicaciones en aplicaciones
46 %
Modernización, migración o consolidación de data warehouses
44 %
Consolidación o migración de aplicaciones
31 %
Gobernanza de datos
19 %
Aplicaciones en tiempo real o casi en tiempo real
16 %
Auditorías o cumplimiento de normativas
11 %
Análisis en tiempo real
10 %
Entornos híbridos o de cloud Otro
6% 3%
Fuente: encuesta de TechValidate entre 524 usuarios de Informatica PowerCenter
© 2016 Bloor
2.2 Conectividad Una de las principales características del actual panorama de TI es la proliferación de bases de datos (en www.NoSQL-database.org se enumeran 225 bases de datos NoSQL) y aplicaciones (basadas en cloud), junto con toda la variedad de formatos de datos nuevos (como JSON) que se deben admitir. Por lo tanto, la conectividad reviste cada vez más importancia. En algunos casos, se proporciona de serie, pero su auge implica que también hacen falta herramientas de desarrollo para crear conectores, así como sitios comunitarios donde compartirlos. Este asunto lo obviamos en la encuesta de 2014, pero, tal y como hemos apuntado, su relevancia no deja de aumentar. Según TechValidate (Figura 7), una gran mayoría de usuarios es consciente de la importancia de dicha funcionalidad. Asimismo, conviene recordar que la conectividad ya no se limita a las fuentes y los destinos relacionales, sino que también se extiende a muchos otros entornos que admiten datos estructurados, no estructurados y semiestructurados. Merece la pena apuntar que la mayor necesidad de conectividad ha desviado el foco de atención a la arquitectura que sustenta los productos de integración de datos. Si el número de fuentes y destinos es reducido, no importa demasiado cómo se implementa la conectividad, pero, si llega a, digamos, centenares de endpoints, las herramientas deben poseer la agilidad suficiente para permitir el desarrollo y la implementación de conectores sin perjudicar la lógica de integración. En la práctica, eso implica que los proveedores de integración de datos van a tener que asignar niveles independientes a la lógica de integración y la conectividad dentro de la arquitectura del producto.
2.3 Productividad y agilidad Aunque no aludimos a los conectores en sí, preguntamos a los encuestados por la productividad de la plataforma de integración de datos que habían elegido en función del par fuente/destino, que guarda una relación evidente con la conectividad. Los resultados de esta parte de la encuesta muestran la duración del proceso de desarrollo, que depende del número de endpoints que incluya el proyecto. Estos resultados se presentan en la Figura 8.
6
7
Figura 6: número de proyectos ponderados por idoneidad 30 25 20 15 10
SAP
Oracle
Microsoft
Informatica
IBM
Actian
0
Codificación manual
5
Software como servicio (SaaS)
Migración de datos
B2B
MDM
Data warehousing
Integración de aplicaciones
Figura 7: importancia de la conectividad
71 % De acuerdo
El 71 % de las organizaciones encuestadas se beneficia de la amplia conectividad entre fuentes y destinos diferentes que proporciona PowerCenter
Fuente: encuesta de TechValidate entre 386 usuarios de Informatica PowerCenter
Figura 8: tiempo medio (en semanas) de desarrollo por fuente/destino 4 3,5
White paper de Bloor
SAP
0
Oracle
0,5
Microsoft
1
Informatica
2 1,5
IBM
2,5
Codificación manual
3
Actian
Como puede apreciarse, Informatica y Microsoft, seguidos por IBM, demuestran bastante más eficiencia en este aspecto que la competencia. También cabe destacar que la codificación manual es el método menos eficaz. En la Figura 9 se presenta una segunda medida, relacionada con la primera, que muestra la duración media de los proyectos, ponderada en función de su complejidad (número de endpoints), por cada tipo de tarea de integración antes identificado. Se puede apreciar, por ejemplo, que la codificación manual no es muy adecuada para el data warehousing o que no se recomendaría Oracle para la integración B2B. Quizá lo más importante sea que tanto Informatica como Microsoft ofrecen el mismo rendimiento en todos los ámbitos de integración, mientras que otros proveedores y enfoques son más adecuados en determinadas tareas, pero no en otras. El estudio de TechValidate confirma ese resultado, ya que el 70 % de los encuestados afirma haber aumentado la productividad gracias a “la facilidad de uso, la automatización, la reducción del tiempo de desarrollo, la reutilización del código y de las competencias, las herramientas visuales basadas en metadatos y las plantillas y los mappings de serie”. En esta cita no se menciona otro factor importante: la colaboración, en particular, la colaboración entre los equipos de TI y negocio. Esta se facilita con distintos medios como glosarios de negocio (para usar del mismo modo la terminología), flujos de trabajo, herramientas basadas en funciones específicas de algunas clases de usuarios (por ejemplo, analistas) y prototipos que posibiliten el enfoque iterativo del desarrollo. También resultan provechosas algunas utilidades (como el análisis de impacto, facilitado gracias a la gestión de los metadatos), en el sentido de que reducen los riesgos. Si bien la colaboración entre los equipos de TI y negocio no fue materia de nuestra encuesta de 2014 ni de la de TechValidate, sí se abordó en estudios anteriores de Bloor Research. Por ejemplo, en nuestro estudio más reciente sobre migración de datos, se citaba la falta de colaboración entre los equipos de TI y negocio como el motivo principal por el que los proyectos superan el plazo o el presupuesto asignados.
Figura 9: duración del proyecto (en semanas) por fuente/destino 7 6
Software como servicio (SaaS)
5
MDM
4
Data warehousing
3
Migración de datos B2B
2
Integración de aplicaciones
1
Actian
Codificación manual
IBM
Informatica
Microsoft
Oracle
Figura 10: casos de uso de la validación de datos ¿Qué factores influyeron más a la hora de comprar las pruebas de Data Validation? Reducir el tiempo preciso para el desarrollo o las pruebas de control de calidad
43 %
Aumentar la confianza del equipo de negocio en los datos que suministra el de TI
41 %
Reducir el tiempo preciso para probar los datos de producción
55 %
Rebajar el coste total asociado a las pruebas de datos
61 %
Reducir el tiempo requerido para capturar y corregir los problemas de calidad de datos
45 %
Mejorar las decisiones de negocio basadas en datos Mejorar los acuerdos de nivel de servicio
24 % 12 %
Fuente: encuesta entre 49 usuarios de Informatica Data Quality o Data Integration
2.4 Pruebas Las pruebas son una parte más del proceso de desarrollo que se lleva a cabo en los entornos de integración, al igual que se efectúan para las aplicaciones convencionales. En general, se llevan a cabo demasiadas pruebas manuales, con las que se malgastan tiempo y dinero. Este tema, no obstante, no se suele solucionar en los entornos de integración de datos, a pesar de que representa un porcentaje significativo del coste del desarrollo. Son bienvenidas funciones como la gestión de datos de prueba y el enmascaramiento de datos (que se abordan a continuación), así como técnicas convencionales como las pruebas de unidad y de regresión. En lo que atañe específicamente a la integración de datos,
también son útiles las denominadas pruebas del antes y el después, esto es, se comparan los datos existentes antes de transferirlos o transformarlos con los resultantes a fin de comprobar que no se produzca ningún error de integridad. TechValidate ha abordado el uso de herramientas comparativas de esa clase; en el caso de Informatica, se trata de Data Validation, que también ofrece técnicas de prueba convencionales. En la Figura 10 se destacan los motivos para invertir en Data Validation. Resulta interesante fijarse en el número de encuestados que cita la mejora de las decisiones de negocio basadas en datos y de la confianza del equipo de negocio en los datos, ya que son características fundamentales de la empresa ágil. © 2016 Bloor
SAP
Se aprecian resultados parecidos en la Figura 11 con respecto a la supervisión del rendimiento operacional. Es importante reconocer que no se trata de una mera cuestión técnica, sino también de confianza (consulte el apartado siguiente) en que los datos estén completos y actualizados de verdad. Si tenemos en cuenta que, según algunas encuestas, uno de cada tres ejecutivos de negocio se queja de la poca fiabilidad de los datos en los que se basa para tomar decisiones, favorecer dicha confianza cobra gran importancia. Además, la supervisión proactiva también se aplica al proceso de prueba con el fin de permitir la revisión automatizada del código y de reforzar las mejores prácticas de desarrollo.
2.5 Confianza La base de la empresa ágil la constituyen los datos que dirigen las decisiones de la organización de cara al futuro, así como su análisis. Esos análisis deben inspirar confianza a los ejecutivos que los emplean para extraer información, lo cual significa que los datos en sí han de ser fiables. Según estudios recientes, un tercio de los líderes de negocio desconfía de la información en la que debe basar sus decisiones. En lo que se refiere a los datos, la confianza no es una isla en medio del mar: integra de manera específica tanto la gobernanza como la seguridad de los datos, así como la garantía de oportunidad y precisión del cumplimiento.
8
En lo tocante al cumplimiento en la banca y los servicios financieros, cabe esperar datos precisos, coherentes y completos, una mejor práctica igual de válida en otros sectores. Resulta ineludible detallar las auditorías y el linaje de datos (visibilidad de la procedencia de los datos y del procedimiento para extraerlos). Es más, se gana confianza en los datos cuando proporcionan el linaje mediante informes y cuadros de mando integrados. También el uso de un glosario de negocio (antes mencionado) y la colaboración favorecen la confianza en los datos. Tanto la oportunidad de los datos (que permite Proactive Monitoring) como el rendimiento y la disponibilidad son factores relevantes para generar confianza, al igual que la capacidad para cumplir los acuerdos de nivel de servicio. Por otro lado, los datos sensibles no pueden estar a la vista de quienes carecen de autorización para verlos. Aunque la integración con herramientas de calidad de datos es una característica de las principales plataformas de integración de datos de sobra conocida, en ocasiones no resulta evidente la necesidad de proteger los datos sensibles. En el contexto de la integración de datos, los desarrolladores de los procesos de integración no pueden ver la información personal identificable, aun cuando deban probar dichos procesos con datos que, como mínimo, parezcan reales. Por eso, es conveniente que la plataforma de integración admita el enmascaramiento de datos. Eso se aplica, asimismo, a los desarrolladores (especialistas en datos) de análisis que utilicen, por ejemplo, una plataforma de preparación de datos. No se incluyó en la encuesta, pero Bloor Research publicó en 2015 un informe de actualización del mercado sobre el enmascaramiento de datos. Fuera de esto, conviene señalar que la gobernanza de datos está evolucionando a fin de favorecer la agilidad en la empresa. Antes, esta materia se centraba demasiado en la calidad de datos sin más, en lugar de en los aspectos importantes para la organización. Nos complace comprobar que los proveedores de las soluciones de gobernanza de datos están adoptando un enfoque basado en el negocio. Al igual que el enmascaramiento de datos, tampoco se incluyó en la encuesta, pero existe un informe de actualización del mercado al respecto. Cabe destacar que los 9
Figura 11: casos de uso de la supervisión proactiva ¿Qué factores influyeron más a la hora de comprar Proactive Monitoring? Automatizar y agilizar la supervisión de los sistemas operativos
81 %
Aumentar la confianza del equipo de negocio en los datos que suministra el de TI
46 %
Minimizar los datos defectuosos mediante la detección precoz de los problemas operacionales
42 % 50 %
Rebajar el coste total asociado a la detección tardía de los problemas de datos y el control de daños Mejorar la calidad del código y prevenir problemas posteriores en producción aplicando mejores prácticas
46 % 46 %
Mejorar los acuerdos de nivel de servicio Mejorar las decisiones de negocio basadas en datos Rebajar los costes asociados a las pruebas durante el desarrollo y el control de calidad
23 % 27 %
Fuente: encuesta entre 26 usuarios de Informatica Data Quality o Data Integration
dos únicos proveedores que colocamos en el segmento de “principales” en gobernanza y enmascaramiento de datos fueron IBM e Informatica.
2.6 Otros factores En nuestra opinión, existen otros factores imprescindibles para que la plataforma de integración de datos favorezca realmente la empresa ágil y adaptable. Aunque algunos de ellos ya se han mencionado o explicado en otros apartados de este documento, se merecen una referencia explícita, en particular, la colaboración y la plataforma integrada (con calidad de datos, gobernanza de datos, enmascaramiento de datos, etc.). Además, existe otro factor que ni siquiera hemos citado: la escalabilidad; con tantos proyectos, el aumento de fuentes y destinos, la mayor diversidad de los datos y su enorme cantidad, era previsible.
White paper de Bloor
“
En lo que se refiere a los datos, la confianza no es una isla en medio del mar: integra de manera específica tanto la gobernanza como la seguridad de los datos, así como la garantía de oportunidad y precisión del cumplimiento.
”
Resumen de las conclusiones anteriores 3.3 Escala y complejidad E n este apartado se resumen los resultados del informe original de 2014, que se pueden desglosar en cinco áreas principales.
3.1 Compatibilidad con varios ámbitos de integración
“
La conclusión es que la mayoría de las grandes empresas necesita una plataforma de integración de datos que admita todos los casos de uso identificados a fin de reportar el máximo retorno de la inversión.
”
En el informe de 2014, desglosamos las cifras antes indicadas (consulte las Figuras 4 y 5) según la idoneidad por caso de uso. Sin embargo, en el contexto actual (el de la plataforma estratégica que facilite la agilidad empresarial), ha perdido pertinencia. La conclusión es que la mayoría de las grandes empresas necesita una plataforma de integración de datos que admita todos los casos de uso identificados a fin de reportar el máximo retorno de la inversión.
3.2 Plazos y recursos de los proyectos Indagamos la mano de obra (recursos tanto internos como externos, incluidos los de consultoría, por semanas) invertida en cada uno de los casos de uso identificados y en el primer proyecto puesto en marcha. Por sí solos, estos resultados poseen una utilidad limitada: como cabía esperar, los productos que se solían emplear en entornos sencillos exigían menos mano de obra que los destinados a entornos más complejos. Vale la pena apuntar que Informatica y, en menor medida, Microsoft ofrecen una duración más sistemática en todos los casos de uso en comparación con otros proveedores. Lo razonable, pues, sería concluir que, en condiciones de igualdad en todo lo demás, esa incoherencia en la necesidad de recursos significaría que los productos pertinentes no presentan una particular idoneidad para algunos casos de uso, lo cual confirmaría lo que ya sabemos. También se podría deducir que las plataformas de Informatica y Microsoft son más flexibles a la hora de transferir competencias entre proyectos que las de sus rivales. Por último, comparamos los recursos del primer proyecto con los recursos requeridos para los proyectos siguientes. En este último caso, Informatica era el único proveedor que permitía reducir de manera considerable el personal tanto interno como externo de los proyectos posteriores, lo cual sugiere una mejor curva de aprendizaje. © 2016 Bloor
Ya hemos señalado en el punto anterior que la cuantificación de recursos por sí sola carece de utilidad, puesto que pasa por alto la complejidad de los proyectos. La medida relativa al número de proyectos en que se utiliza cada plataforma, que también valoramos, adolece del mismo problema. Es innegable la dificultad que entraña cuantificar la complejidad, sobre todo en una encuesta, ya que cuentan muchos factores: número de transformaciones, tipo de transformaciones, volumen de datos objeto de procesamiento, número de endpoints (tanto fuentes como destinos) y heterogeneidad de estos. En la encuesta, valoramos la complejidad según el número de fuentes y destinos, pero, visto en retrospectiva, también deberíamos haber preguntado por su homogeneidad o heterogeneidad. Con respecto a esta medida, descubrimos, sin sorpresa, que las soluciones de codificación manual se caracterizaban por su escasa complejidad, que era el caso también de Actian. Microsoft, en cambio, obtuvo una calificación mayor, suponemos que porque los entornos de Microsoft suelen ser más homogéneos que los personalizados de IBM, Informatica, Oracle y SAP. Llegamos a la conclusión de que, aparte de Microsoft, Informatica, seguida de IBM, era la empresa más idónea en el caso de los entornos complejos.
3.4 Mantenimiento y soporte continuo En este tema, formulamos dos preguntas relativas a los costes mensuales de mantenimiento (en minutos) y los días empleados en resolver problemas críticos. En cuanto a la primera, podría inducir a error presentar sin más los datos sin procesar, ya que no tienen en cuenta el número de integraciones objeto de mantenimiento en cualquier momento dado. Depende tanto del número de proyectos sustentados en la plataforma de integración como de su complejidad. Microsoft resultó ser la empresa más productiva en este ámbito, seguida por Informatica. Si se contemplan las cifras brutas, Actian parece la menos cara en días de mano de obra al mes, pero es porque se utiliza en menos proyectos, 10
Figura 12: días empleados en resolver problemas críticos 4 3,5 3 2,5
Oracle
Microsoft
0,5
IBM
1
Actian
1,5
0
Figura 13: coste total de propiedad en tres años por proyecto y por fuente/destino (miles de USD) 16
4 2
IBM
6
Informatica
8
Codificación manual
10
SAP
En cuanto a los costes, es necesario tener en cuenta dos medidas fundamentales: los costes iniciales y los costes sobrevenidos en un periodo de tres años o más. Es importante comprender que los costes de funcionamiento superan con creces los iniciales; suele suceder con todos los productos de software. Evidentemente, suele costar más conseguir autorización para gastos de capital que para gastos operacionales, pero fijarse solo en el coste inicial da la impresión de un falso ahorro. Si solo nos fijamos en los costes anuales, parece que Oracle e Informatica, por ejemplo, resultan caros, mientras que Actian ofrece una fantástica relación calidad-precio. Eso sí, sin realizar ajustes por complejidad o escala. Los costes brutos no son una medida comparativa útil: es imposible que un producto que se va a utilizar para un par de proyectos al año cueste lo mismo que una herramienta con la que se implementan veinte proyectos o más, que una oferta apta solo para un par de usos cueste lo mismo que una plataforma que sustenta un amplio abanico de ámbitos de integración, ni que el precio de un producto usado en unos pocos endpoints (fuentes y destinos) sea equivalente al de uno empleado en una docena de endpoints o más. En suma: una tecnología de integración de datos compatible con integraciones más complejas de mayor escala siempre es más cara que otra que carece de estas características. Así pues, las métricas clave no son solo los costes iniciales y los costes
Oracle
12
Microsoft
14
3.5 Costes
11
Informatica
2
Actian
con menos fuentes y destinos. En cuanto a la segunda, los resultados se ilustran en la Figura 12. Informatica tiene un rendimiento de casi un día por problema mejor que IBM y Oracle. Un día quizá no parezca mucho pero, cuando implica que carece de acceso a los datos o, aún peor, que los clientes carecen de él, pueden ser 24 horas muy caras. Este último caso, que puede significar perder clientes, puede empeorar aún más. Como ejemplo, recuerde que, en el 20 de junio de 2012, los clientes de las entidades Royal Bank of Scotland, Ulster Bank y National Westminster Bank no pudieron acceder a los servicios bancarios. Por ello, el grupo bancario fue sancionado con una multa de 42 000 000 GBP por Financial Conduct Authority, el organismo regulador británico.
0
en tres años, sino dichos costes ponderados según el número de proyectos y su complejidad, que se mide en función del número de endpoints incluidos en cada uno. Para abreviar, en la Figura 13 se muestra el coste total de propiedad durante tres años, ponderado según la complejidad y el número de proyectos. Microsoft muestra el menor coste total de propiedad, en parte por la homogeneidad de sus endpoints (lo que reduce la complejidad), pero también porque, al estar incluido su software en la licencia de SQL Server, no se computa como un coste independiente. Por dejarlo claro, no creemos que las cifras de Microsoft presentadas en este documento correspondan a una comparación justa en términos equivalentes. Aparte de eso, estos son, quizá, los resultados más destacables: a) Actian ya no parece ofrecer una relación calidad-precio fantástica b) La codificación manual es, en realidad, más costosa que las soluciones de la mayoría de los proveedores, con la salvedad de IBM y Oracle c) Aparte de Microsoft, Informatica ofrece el mejor coste total de propiedad White paper de Bloor
Son argumentos especialmente contundentes para no centrarse solo en los costes iniciales, ya que pueden resultar engañosos.
“
Es importante comprender que los costes de funcionamiento superan con creces los iniciales...
”
Conclusión as organizaciones adoptan productos de integración para una gama diversa de ámbitos de integración, ya que existe una gran cantidad de retos de integración de datos antes incluso de empezar a considerar la integración de datos como una plataforma estratégica que facilita la evolución empresarial. La reutilización en varios ámbitos puede resultar muy valiosa en cuanto al retorno de la inversión y la agilidad de las organizaciones a la hora de afrontar cambios. Nuestros resultados parecen revelar que, según sus usuarios, las soluciones de Informatica y Oracle son más reutilizables (aptas para varios casos de uso) que las de la competencia, aunque la de Oracle es considerablemente más cara. La codificación manual y, en menor medida, Actian no se consideran tan flexibles como otras soluciones. En nuestra opinión, estas cifras hablan por sí mismas: Informatica se considera como el producto más adecuado para una amplia gama de ámbitos y Microsoft se erige como claro vencedor desde el punto de vista de costes, aunque, como ya hemos dicho, no se trata de una comparación justa en términos equivalentes. Las herramientas de Microsoft son exclusivas, así que se suelen utilizar en organizaciones que usan, sobre todo, plataformas de Microsoft, pero no se pueden aplicar en ninguna otra plataforma. Para fines distintos a los de Microsoft, Informatica es claramente la opción de valor y se sitúa por delante de IBM y Oracle, pese a que Actian podría ser una buena opción en entornos de menor tamaño. No hay que olvidar que la codificación manual es relativamente cara. Queremos añadir un apunte final sobre la funcionalidad de los productos para tareas específicas. Cuanto mayor sea la frecuencia con la que se usa un proveedor o producto, en diferentes ámbitos, mejor se aprecia la funcionalidad del producto. Es preciso indicar, no obstante, que no intentamos diferenciar productos según su funcionalidad, por lo que quizá un producto
L
“
La reutilización en varios ámbitos puede resultar muy valiosa en cuanto al retorno de la inversión y la agilidad de las organizaciones a la hora de afrontar cambios.
”
sea más adecuado para transformaciones complejas que otro. De forma similar, puede que otro producto ofrezca un mejor rendimiento, más capacidades en tiempo real o cuente con funciones únicas. Los costes tan solo son (y deberían ser) uno de los distintos factores determinantes a la hora de seleccionar una solución de integración de datos.
4.1 Facilitación de la empresa ágil En las conclusiones anteriores, señalamos varios puntos relativos a la facilitación de los aspectos de datos de la agilidad empresarial (lo que Bloor Research denomina la empresa mudable). Por ejemplo, la reutilización posibilita la flexibilidad y la “agilidad de las organizaciones a la hora de afrontar cambios”. Sin embargo, hace falta algo más: un amplio abanico de opciones de conectividad, utilidades de colaboración (dentro del equipo de TI, entre desarrolladores y profesionales de operaciones y con el equipo de negocio), gobernanza, seguridad, escalabilidad, etc. En el apartado anterior, afirmamos que el coste es solo uno de los distintos factores determinantes al evaluar las plataformas de integración de datos. Iríamos aún más lejos: las características, las funciones y otras consideraciones de naturaleza técnica también representan solo un elemento de dichas evaluaciones. Según el estudio de Bloor Research, seguramente es más importante la capacidad de permitir la agilidad y la adaptación del negocio. A menudo, el impacto en el negocio de estas iniciativas puede ser mucho mayor que el impacto en el coste para el equipo de TI. Las empresas actuales están experimentando un cambio sin precedentes en su afán por satisfacer las exigencias de la economía digital y convertirse en empresas basadas en datos. El requisito para lograrlo es una plataforma de integración de datos que posea las características necesarias para permitir esa transición, es decir, la que cuente con todas las características señaladas en este informe.
INFORMACIÓN ADICIONAL Hay disponible más información en www.BloorResearch.com/update/2277 © 2016 Bloor
12
Acerca del autor
PHILIP HOWARD Director de investigación de gestión de la información
hilip inició su carrera en el sector informático ya en el año 1973 y ha trabajado como analista de sistemas, programador y comercial. También ha ocupado puestos de marketing y gestión de productos en varias empresas como GEC Marconi, GPT, Philips Data Systems, Raytheon y NCR. Tras veinticinco años sin ser su propio jefe, Philip constituyó en 1992 su empresa, cuyo primer cliente fue Bloor Research (entonces ButlerBloor), para la que trabajó como analista asociado. Su relación con Bloor Research se ha mantenido desde entonces y, en la actualidad, es director de investigación en materia de gestión de datos. La gestión de datos consiste en la gestión, la transferencia, la gobernanza y el almacenamiento de los datos e implica tecnologías tan diversas como, entre otras, bases de datos, data warehousing, integración de datos (que incluye ETL, migración de datos y federación de datos), calidad de datos, gestión de datos maestros, gestión de metadatos o gestión de eventos y registros. Philip también controla la gestión de hojas de cálculo y el procesamiento de eventos complejos.
P
13
Además de los numerosos informes que Philip ha elaborado para Bloor Research, también colabora con regularidad en IT-Director.com e IT-Analysis.com y, con anterioridad, fue redactor de Application Development News y Operating System News por encargo de Cambridge Market Intelligence. También ha colaborado con varias revistas y ha confeccionado diversos informes para sociedades como Cambridge Market Intelligence y The Financial Times. Philip pronuncia conferencias y asiste a otros actos celebrados por toda Europa y en Norteamérica con regularidad. Fuera del trabajo, las principales actividades de ocio de Philip consisten en navegar en barcaza, esquiar, jugar al bridge (es un auténtico as), salir a cenar y viajar al extranjero.
White paper de Bloor
Información general de Bloor Bloor Research es una de las principales organizaciones de investigación, análisis y consultoría de TI de Europa y celebró su vigesimoquinto aniversario en 2014. Explicamos cómo proporcionar una mayor agilidad a los sistemas de TI empresariales a través de la gobernanza, la gestión y el aprovechamiento efectivos de la información. Nuestra fama de “dar la versión adecuada de los hechos” se halla avalada por el contenido y las publicaciones de comunicaciones independientes, inteligentes y claras sobre todos los aspectos del sector de TIC (Tecnologías de la Información y Comunicaciones). Para nosotros, “dar la versión adecuada de los hechos” consiste en:
Desde su constitución en 1989, Bloor Research lleva 25 años distribuyendo estudios y análisis a organizaciones de proveedores y usuarios de TI de todo el mundo mediante suscripciones online, servicios de investigación personalizados, eventos y proyectos de consultoría. Estamos comprometidos con la transformación de nuestro conocimiento en valor de negocio para usted.
la tecnología en el contexto • Describir de su valor de negocio y de los demás sistemas y procesos con los que interacciona.
cómo las tecnologías • Comprender nuevas e innovadoras se adaptan a las inversiones de TIC existentes.
todo el mercado y explicar • Observar todas las soluciones disponibles y cómo se pueden evaluar de un modo más eficaz.
el “ruido” y facilitar la búsqueda • Filtrar de información adicional o noticias que respalden la inversión y la implementación.
que todo nuestro contenido • Garantizar esté disponible a través de los canales más adecuados.
© 2016 Bloor
14
Derechos de autor y descargo de responsabilidad
Este documento está protegido por derechos de autor: © 2016 Bloor. Queda prohibido reproducir ninguna parte de esta publicación por método alguno sin la autorización previa por escrito de Bloor Research. Debido a la naturaleza de este material, se ha mencionado el nombre de numerosos productos de hardware y software. En la mayoría de los casos, si no en todos, estos nombres de productos son marcas comerciales de las empresas que fabrican los productos. No es intención de Bloor Research reclamar estos nombres o marcas comerciales como propias. De igual modo, los logotipos de empresa, gráficos o capturas de pantalla se han reproducido con el consentimiento del propietario y están sujetos al copyright de éste. Aunque se han tomado las medidas necesarias durante la preparación de este documento para garantizar que la información es correcta, los editores no aceptarán la responsabilidad por cualquier error u omisión.
15
White paper de Bloor
Bloor Research International Ltd 20–22 Wenlock Road LONDON N1 7GU Reino Unido Teléfono: +44 (0)207 043 9750 Web: www.BloorResearch.com Correo electrónico:
[email protected]