Existen diversas metodologías para realizar proyectos tecnológicos para el estudio de datos (como la metodología fundamental para la ciencia de datos de IBM o la metodología CRISP-DM, acrónimo de: Cross-Industry Standard Process for Data Mining). En dataly, diseñamos nuestro propio proceso basadonos en estas metodologías, este se divide en 6 fases; el proceso avanza y retrocede de fases cuando es necesario y las explicaremos a continuación.
![proceso-metodología](https://dataly.mx/wp-content/uploads/2022/07/metodologia-1024x630.png)
Fase 1. Comprensión del negocio
El primer paso de cualquier proceso de inteligencia de negocios es conocer la empresa, así como sus necesidades y requisitos específicos. Durante esta fase se evalúa la situación del negocio para alinear sus objetivos con los objetivos del proyecto de datos y se realiza un plan con las actividades necesarias para lograr los objetivos establecidos. Expertos del negocio deben participar proporcionando sus conocimientos y experiencia para definir los conceptos clave, enfoques, problemas y posibles soluciones.
Fase 2. Recopilación y comprensión de datos
Se recopilan todos los datos que puedan estar relacionados al proyecto, pueden ser de fuentes tanto internas como externas a la empresa, algunos datos pueden provenir del ERP o CRM, de un software de contabilidad y finanzas, del sistema de manejo de personal, redes sociales, bases de datos de estudios de mercado o incluso bases de datos de clientes y otros proveedores externos.
En esta fase se conoce el significado de cada uno de los datos, la estructura de los datos, se identifican los más importantes, las relaciones entre ellos, se hace un análisis estadístico simple y se verifica su calidad.
Fase 3. Preparación de los datos
Durante esta fase se obtienen los datos finales sobre los cuales se aplica el modelo. Contempla gestionar su calidad y adaptarlos para que puedan ser usados en los modelos. La preparación de los datos es la etapa más larga, pues implica la validación, limpieza (eliminar duplicados y columnas redundantes, dar un formato adecuado), estandarización, además se crean nuevas variables estructuradas extraídas de las bases de datos existentes. Para concluir la etapa, se deben cargar los datos para la integración de la base de datos.
Fase 4. Modelado
Esta fase consiste en seleccionar las técnicas de procesamiento más adecuadas para los datos con los que se cuenta y que se alineen a los objetivos del negocio. Se realiza es un diagrama Entidad-Relación y se decide que técnicas se usarán para complementar el proyecto, estas pueden ser de minería de datos, algoritmos de aprendizaje automático (una herramienta de la inteligencia artificial), OLAP, entre otras de acuerdo a los objetivos establecidos.
Fase 5. Despliegue
Es la penúltima fase del proyecto, consiste en mostrar los resultados obtenidos al usuario o usuarios finales. También consiste en el diseño para monitorear y mantener el modelo.
Fase 6. Evaluación
Se hacen pruebas al producto desarrollado para garantizar que la solución de BI personalizada se integre a la perfección con las operaciones de la organización y que siempre funcione como se espera.