Conozca las diferencias entre Analítica de Datos y Minería de Datos
En la era de los datos y la transformación digital los negocios, indistintamente de su tamaño o sector se valen de disciplinas, estrategias y metodologías, como la analítica de datos y la minería de datos para tomar decisiones mejor sustentadas y ganar ventajas competitivas.
Incluso para quienes trabajan en torno a la tecnología de la información, estos términos pueden llegar a intercambiarse.
Y aunque es un hecho que la analítica de datos y la minería de datos están íntimamente relacionadas y se complementan, no deben ser usadas como sinónimos ya que tienen diferentes niveles, alcances y procesos.
Por ello, presentamos en esta breve entrega las principales diferencias entre analítica de datos y minería de datos.
Conozca 7 herramientas de analítica de datos que puede implementar para mejorar las decisiones en su empresa.
Analítica de Datos vs Minería de Datos: El Concepto
Se puede afirmar que tanto la analítica de datos como la minería de datos son parte crucial de cualquier estrategia basada en develar conocimiento a partir de los datos.
Ambas comprenden una serie de metodologías cuyo propósito es la generación de información de valor a partir de los datos, esto es el procesamiento de información cuantitativa y cualitativa que se recoge por distintos canales y fuentes. ¡Hasta allí la semejanza!
CIO Magazine define a la analítica de datos como “una disciplina que se encarga de extraer conocimiento de los datos”.
La misma fuente define a la minería de datos como: “un proceso que consiste en disgregar grandes volúmenes de información con el fin de revelar patrones, tendencias y/o correlaciones”.
Estas definiciones aunque muy breves dejan entrever una diferencia significativa entre analítica y minería de datos, ya que la primera es catalogada como “disciplina para extraer conocimiento” y la segunda como un “proceso para develar patrones”.
Otra fuente, la muy reconocida firma de medios, consultoría e investigación especializada en tecnología Gartner ofrece las siguientes definiciones:
“Analítica de datos es la gestión para todos los usos, operativos y analíticos, para impulsar procesos comerciales y mejorar resultados a través de una toma de decisiones más efectiva y mejor experiencia del cliente”.
Ahora bien, Gartner conceptualiza a la minería de datos como:
“Un proceso que consiste en descubrir tendencias, correlaciones y patrones importantes al filtrar grandes cantidades de datos empleando tecnologías de reconocimiento de patrones y otras técnicas matemáticas y estadísticas”.
Minería de datos un subconjunto dentro de la analítica de datos
Con las definiciones antes expuestas queda claro el alcance de cada una, y se puede elevar a la analítica de datos como una disciplina un súper-conjunto de metodologías para la gestión de los datos, dentro del cual, podemos encontrar procesos como la minería de datos encargada de disgregar los mismos para develar patrones.
Se puede argumentar esta afirmación con lo expuesto por Splunk, la firma desarrolladora de uno de los mejores software para análisis de macro-datos:
“La analítica predictiva es la práctica de aplicar modelos matemáticos a grandes cantidades de datos, para identificar patrones previos y predecir resultados futuros; una combinación de minería de datos, aprendizaje automático y algoritmos estadísticos que proporciona una dimensión ‘predictiva’ y permite que la analítica vaya más allá de la simple correlación”.
Es necesario aclarar que la analítica predictiva es un tercer nivel de alcance o profundidad de la analítica de datos que abarca otros niveles como el descriptivo, diagnóstico y prescriptivo.
Analítica de Datos vs Minería de Datos: Sus tipos
Otra diferencia importante entre la analítica de datos y la minería de datos corresponde a sus tipos o niveles de implementación. Este es un breve resumen para cada una.
Tipos o niveles de la analítica de datos
1. Analítica descriptiva:
Su alcance y nivel es de caracterización, es decir, describe lo que está sucediendo en el momento, reúne herramientas que permiten procesar, presentar y resumir la información en forma de reportes, gráficas y/o dashboards. De acuerdo con CIO Magazine, a este nivel se ubica la analítica empresarial (business intelligence- BI).
2. Analítica diagnóstica:
Avanza a un segundo nivel de profundidad y busca determinar un diagnóstico, comprendiendo las causas subyacentes de los patrones y tendencias observados en los datos, ayudando a las empresas a comprender las raíces de los problemas y tomar decisiones informadas sobre cómo solucionarlos.
3. Analítica predictiva:
A otro grado de madurez de los datos está la analítica predictiva, a este nivel, sobre la base de los datos históricos, repositorios de información o bases de datos y su procesamiento se busca conocer lo que podría suceder en el futuro.
Para ello, a la serie de indicadores (descriptivos) y al diagnóstico, se superponen los algoritmos profundos y el aprendizaje automático, por lo que se considera ya un nivel avanzado. En el ámbito empresarial a este nivel corresponde la Business Analytics (BA).
4. Analítica prescriptiva:
El nivel o tipo más profundo de la analítica de datos es el prescriptivo, para sobre la base de técnicas como metaheurística, redes neuronales, IA o simulación avanzada; para ofrecer soluciones específicas u hojas de ruta sobre los escenarios proyectados.
Tipos de minería de datos
1. Soft data mining:
Un nivel elemental de minería de datos que consiste básicamente en la búsqueda en bases de información y la depuración bajo ciertos criterios.
2. Clustering data mining:
Datos depurados se organizan por grupos, bajo cumplimiento de ciertos criterios en común (clusters), y con ello, los analistas a través de modelado, regresiones o técnicas estadísticas puedan encontrar correlaciones o patrones.
Aquí un ejemplo de diseño, construcción y prueba de un sensor digital de temperatura, humedad relativa y presión barométrica.
Analítica de Datos vs Minería de Datos: Sus herramientas
Otra manera de diferenciar el proceso de la minería de datos vs la analítica de datos es a través de la serie de herramientas y técnicas que cada una emplea para extraer, procesar y presentar resultados.
Se resumen en la siguiente tabla:
Analítica de datos hace uso de:
Minería de datos hace uso de:
Técnicas:
|
Clusterización
Asociación
Depuración de data
Herramientas de visualización
Clasificación
Machine Learning
Redes neuronales
Bases de datos
Hojas de Cálculo
Macros
IA
Códigos de programación:
- Python
- R
- Java
- SQL
- SAS
- Python
- R
- Java
- SQL
- Scala
- Julia
Software:
- BM Watson Studio
- IBM Prescriptive Analytics
- Microsoft Azure Machine Learning
- SAP Analytics
- SAS
- H2O Driverless AI
- AIMMS
- RapidMiner Studio
- SAS Data Mining
- Oracle Data Mining
- SPSS Modeler
- Orange
- Data Melt
Elaboración Cidei.- Fuentes: CIO Magazine; Upgrad.com; TechTarget y The Bridge.
Analítica de Datos vs Minería de Datos - Conclusión
Para finalizar luce oportuna esta cita de SelectHub que aborda la relación entre ambos términos:
“La minería de datos cae bajo el abanico general de «analítica de datos» y puede considerarse función de analítica, utilizada para recopilar y revelar información relevante”.
En la era de la industria 4.0 y la transformación digital, datos cada vez más diversos son generados por una gama cada vez más amplia de fuentes. Por lo tanto, la capacidad de extraerlos y procesarlos para obtener información útil es algo cada vez más elemental y tanto la analítica de datos como la minería de datos, a su manera cumplen con este propósito
Esperamos que con esta entrega esté mucho más claro el alcance de cada término y sea posible marcar una frontera entre la disciplina de la analítica de datos y la minería de datos, esta última como un subconjunto y una función de la primera.
Analítica de Datos
Minería de Datos
Propósito
Se enfoca en comprender, interpretar y visualizar los datos
Se enfoca en descubrir patrones y relaciones dentro de los datos
Técnicas
Utiliza una variedad de técnicas, como el análisis estadístico, la visualización de datos y el aprendizaje automático
Utiliza principalmente técnicas como reglas de asociación, agrupación en clústeres y árboles de decisión
Datos de entrada
Generalmente usa datos estructurados
Puede usar datos estructurados como no estructurados
Salida
Produce información e informes
Produce predicciones y modelos
Periodo de recolección de los datos usados
Generalmente se realiza en tiempo real o casi en tiempo real
Se puede realizar con datos históricos
Herramientas
Utiliza técnicas estadísticas y matemáticas para analizar los datos
Utiliza algoritmos de aprendizaje automático y técnicas de inteligencia artificial
Aplicaciones
Se utiliza principalmente para el análisis estratégico y la toma de decisiones
Se utiliza principalmente para la investigación y el descubrimiento de conocimiento