Aplicaciones, Big data, Business Intelligence/Analytics, Cloud Computing, Del dia, Desarrollo, Movilidad, Principal, Seguridad

Cinco mejores prácticas para extraer valor de negocio a sus datos

Diariamente las empresas producen una enorme cantidad de información, distribuida en distintos lugares, tanto dentro como fuera de ellas. Sin embargo, pocas son las que cuentan con una estrategia efectiva de gestión de datos (Data Management) que les permita reunir, organizar y analizar detalladamente esos datos.

¿Sabe cuáles son los datos que son relevantes para su negocio y dónde se encuentran? ¿Puede tener acceso a ellos cuando quiere y lo necesita? ¿Son precisos, están actualizados, limpios y completos? ¿Puede reunirlos sin importar en qué formato estén y con qué frecuencia cambian? Y quizá la pregunta más importante: ¿sus datos están listos para soportar una iniciativa de analítica de negocio (Business Analytics)? Lo que es cierto es que para lograr sacarle el máximo provecho a la analítica primero hay que poner orden en el principal insumo con la ayuda de la gestión de datos analítica (Analytical Data Management).

Existen incontables casos de empresas que han implementado la analítica sobre datos cuando aún no estaban preparados para ello. Por ejemplo, los datos podrían haber estado incompletos, o trabajaban con datos duplicados, corruptos u obsoletos, por lo que los resultados del uso de la analítica son menos que óptimos.

Preparar los datos requiere tiempo y esfuerzo. De hecho, los científicos de datos invierten entre 50 y 80 por ciento de su tiempo para desarrollar modelos solamente en la preparación de la información, que en el corto plazo se convierten en nuevos repositorios de datos locales que deben ser administrados lo que se convierte en más trabajo.

Con el fin de brindar una guía práctica para preparar sus datos para la analítica, a continuación se en listan las cinco mejores prácticas para la gestión de datos:

 

1. Facilitar el acceso a los datos tradicionales y emergentes. Cuantos más datos existan, mejores serán los análisis que se puedan hacer a partir de ellos, lo que permite que los científicos de datos puedan hacer un mejor trabajo. Con un acceso ágil a más datos, es más sencillo determinar rápidamente qué datos arrojarán los mejores resultados.

 

2. Fortalecer a los científicos de datos con técnicas de perfilamiento avanzadas. Por ejemplo, el análisis de frecuencias ayuda a identificar valores atípicos o faltantes que pueden distorsionar otras medidas como la media, el promedio y el valor medio. Por su parte, las estadísticas de resumen ayudan a los analistas a entender la distribución y variación, pues los datos no siempre están distribuidos de forma normal, como muchos métodos estadísticos suponen. Mientras que la correlación puede mostrar qué variables o combinación de variables serán más útiles de acuerdo con el objetivo de negocio que se pretende cubrir además del método analítico que se pretenda utilizar.

 

3. Limpiar los datos para agregar calidad a los procesos existentes. Hasta 40 por ciento de los procesos estratégicos fracasan debido a la pobreza de los datos. Con una plataforma de calidad de datos diseñada alrededor de las mejores prácticas y un repositorio centralizado de reglas de limpieza y validaciones de negocio, es posible incorporar la limpieza de datos en cualquier flujo de integración de éstos, utilizando de manera corporativa las mismas reglas de calidad en todos los procesos.

 

4. Dar forma a los datos mediante técnicas de manipulación flexibles. Preparar los datos para la analítica requiere de fusionar, transformar y englobar los datos de múltiples tablas en una sola que permita su manipulación de una manera más ágil, denominada tabla de base analítica (ABT), que se utiliza para construir modelos analíticos y calificar (predecir) el comportamiento futuro de una entidad (un cliente, por ejemplo), la construcción de estos ABT´s se puede lograr de una manera más eficiente por medio de una metodología de gestión de datos analítico (Analytical Data Management).

CIO innovacion estrategia big data analisis5. Compartir metadatos con los dominios de gestión de datos y de analítica. Una capa de metadatos común permite repetir consistentemente los procesos de preparación de datos. Promueve la colaboración, ofrece información de linaje al proceso de preparación de datos. Esto da paso a una mejor productividad, modelos más precisos, tiempos más cortos en los ciclos de construcción, mayor flexibilidad, seguridad además de datos auditables. Todo esto se resume en la implementación de modelos analíticos de una forma más sencilla.

 

En conclusión, la analítica actualmente continúa siendo una de las tendencias de TI más notables. Sin embargo, hay que recordar que se fundamenta en el acceso y la calidad de los datos. ¿Están listos sus datos para sustentar la analítica y proporcionar información para toma decisiones estratégicas?

 

Por: Iván López, experto en Data Management de SAS México.