Entradas

Técnicas utilizadas en el análisis de datos

Imagen
Técnica predictiva de minería de datos Se tomó la decisión de crear un árbol de decisión en el cual arrojara una visión sobre los materiales mas usados en cuestiones de numero de parte y cantidades suficientemente como para requerir una compra inmediata o tener una observación mas de cerca sobre un conteo cíclico en el cual como el primer paso de la técnica predictiva del árbol de decisiones fue la siguiente Diseño y modelado de datos Al ejecutar este modelado de datos arrojo automáticamente un árbol de decisiones en el cual se toma la iniciativa de los siguientes números de parte, así como sus cantidades que se consumen diariamente Al siguiente paso se dio una visualización grafica en la cual mediante un diagrama de Pareto nos indica un ascenso del uso del material indicándonos una observación sobre el uso de este material entre la producción que se lleva a diario Conclusión En conclusión, esta técnica es muy buena para el tipo de base de datos sobre inventarios cont...

Herramienta utilizada en el analisis

Imagen
 Rapidminer  1.     Como primer paso descargamos el instalador de rapidminer en el siguiente enlace: https://rapidminer.com/ , una vez descargado hacemos doble clic abriendo la siguiente ventana 2.     Una vez instalada aparecerá el siguiente recuadro instalando plug-in para las diferentes formas de visualizaciones e importaciones de los datos       Una vez terminando el paso anterior aparecerá un recuadro de inicio de sesión para las licencias de este programa que se hayan comprado en este caso es una versión gratuita 4.     En la opción de “Import data” daremos clic para buscar nuestro documento .CSV que es el formato mas adecuado para realizar esta actividad y que el programa lea los datos de manera adecuada 5.     Dentro de las opciones a la izquierda podemos observar las opciones de DATA, STATISTICS, VISUALIZATIONS y Annotations dond...

Técnicas de minería de datos

Imagen
 Hay varias técnicas y algoritmos utilizados en la minería de datos para descubrir patrones y relaciones en conjuntos de datos. A continuación, se presentan algunas de las técnicas más comunes: Regresión: Se utiliza para predecir valores numéricos continuos basados en variables independientes. Se busca establecer una relación matemática entre las variables para realizar predicciones. Clasificación: Se utiliza para asignar objetos o casos a diferentes categorías o clases. Se basa en características o atributos para construir modelos que puedan clasificar nuevos datos en las categorías existentes. Agrupamiento (clustering): Se utiliza para identificar grupos o clústeres de objetos similares en función de las similitudes o diferencias entre ellos. Los objetos dentro de un mismo clúster comparten características comunes. Análisis de asociación: Se utiliza para descubrir relaciones o patrones frecuentes en un conjunto de datos. El análisis de asociación identifica la co-ocurrencia de el...

Herramientas de minería de datos

Imagen
 Las herramientas de minería de datos son software y programas diseñados para ayudar en la extracción, análisis y visualización de información útil a partir de conjuntos de datos grandes y complejos. Estas herramientas permiten a los usuarios descubrir patrones, tendencias, correlaciones y relaciones ocultas en los datos, lo que puede ayudar en la toma de decisiones, la predicción de resultados y la identificación de oportunidades. Aquí hay algunas herramientas populares de minería de datos: R: Es un lenguaje de programación estadística y un entorno de software ampliamente utilizado para el análisis de datos y la minería de datos. R cuenta con una amplia variedad de paquetes y bibliotecas que brindan funciones específicas para la minería de datos. Python: Python es otro lenguaje de programación ampliamente utilizado en el análisis de datos y la minería de datos. Cuenta con bibliotecas populares como Pandas, NumPy y scikit-learn, que proporcionan una amplia gama de herramientas y al...

Vista minable

Imagen
  Concepto de vista minable Una vista minable se refiere a un conjunto de datos que según su relevancia son los más importantes dentro del contenedor de datos y asimismo, agrupar estos datos de una forma que se puedan procesar con más facilidad. 1.     Primera vista minable En esta vista podemos ver los tipos de números de parte más usados usándolos como base la cantidad que se usa adquiriendo una toma de decisión ante una posible compra sobre estos materiales ayudando así a predecir un paro de la linea de producción mediante estadísticas 2.     Segunda vista minable     Dentro de esta vista podemos observar los inicios de sesión que se han hecho así como también verificar los números de empleado y los correos que usan mas el sistema de información que contiene esta base de datos                                          ...

Tareas y técnicas de minería de datos y su correlación

Método / Técnica Función Tarea de minería perteneciente Técnica de regresión La regresión sirve para ubicar relaciones y calcular probabilidades con base en datos. Esto significa que puede utilizarse para predecir valores numéricos; por ejemplo, el flujo de clientes potenciales en una plataforma. En un caso así es posible filtrar de forma eficiente si un internauta es un prospecto comercial (1) o no (0). Este tipo de técnicas categorizan los valores de acuerdo con variables numéricas y, por tanto, toman decisiones basadas en códigos binarios. Selección Detección de anomalías La minería de datos también es capaz de detectar valores atípicos a través del rastreo o clasificación de datos. En algunos casos, los algoritmos pueden detectar irregularidades y predecir su resultado o las consecuencias, gracias al aprendizaje obtenido de otros casos similares. Estas técnicas son probabil...

Herramientas ETL y algunos ejemplos de herramientas ETL, MOLAP, Data warehouse, DataMarts.

Metodología SEMMA La metodología SEMMA de SAS divide el proceso de la minería de datos en las 5 fases relativas a las siglas SEMMA, que son: SAMPLE, EXPLORE, MODIFY, MODEL y ASSES (muestreo o selección, exploración, modificación, modelización y evaluación o valoración). La metodología SEMMA la utilizan las herramientas de minería de datos de SAS Institute y en concreto SAS enterprise miner que es la herramienta de minería de datos por excelencia de SAS. Esta metodología se divide en:   Sample orígenes de datos y muestreos   Explore análisis exploratorio de datos outliers, missing data, imputación. Modify transformación de datos y reducción de la información Modele modelado y técnicas predictivas Asses evaluación y comparación de modelos, ROC Metodologías CRISP-DM al igual que SAS, IBM probé una metodología completa para ordenar las tareas de minería de datos. El fundamento es similar SAS. CRISP-DM considera el proceso de extracción del conocimiento a partir de los ...