miércoles, 17 de noviembre de 2010

Los tipos de minado y su ciclo


Los tipos de minado

Fundamentalmente son dos:
Directo. En éste, el objetivo es usar los datos disponibles para construir un modelo que describe una variable de internes en particular en función del resto de variables
Indirecto.  En contraste con el directo. Ninguna variable se presupone como objetivo y la meta es establecer algún tipo de relación entre las variables

Existen cuatro enfoques para hacer minado.
Comprar información. Existen empresas especializadas en la venta de información relativa al área de especialización del negocio a las cuales comprar información que ya ha sido procesada y a partir de ella aplicar las habilidades de negocio para aprovechar posibles oportunidades.
Comprar software para minado. De suma utilidad cuando se buscan resultados precisos lo cual implica buscar significancia estadística y por tanto capacidades de proceso numérico muy grandes. Este enfoque se está aplicando con cierta frecuencia en los negocios con el inconveniente de la dificultad en la interpretación de resultados (como veremos posteriormente).
Contratar especialistas de negocio.  Un enfoque de mucha comodidad pero con el gran inconveniente de que las decisiones se dejan en manos que pudieran no ser las mas conocedoras del negocio.
Desarrollar las habilidades propias. Quizá el enfoque con mejores perspectivas a largo plazo pero que involucra recorrer una curva de aprendizaje nada fácil.

El ciclo de minado.


Es importante considerar al minado como un proceso cíclico, parte del ciclo de negocio, como se ilustra en el diagrama.





El proceso inicia cuando se ha identificado un área de oportunidad que se desearía explorar. De ahí se parte para transformar datos referentes a ella en información. La diferencia entre estos conceptos es fundamental, los datos pueden provenir de diferentes fuentes (transacciones de ventas, reportes, datos resultado de diferentes procesos de negocio, etc.) mientras que la información supone que ya los datos se han transformado para poder afirmar que son únicos (no redundantes) y uniformes (a este proceso se le llama limpiado). La información también implica que se han vuelto a estructurar los datos de forma que pueden orientar los procesos a mejorar que están relacionados con el área de oportunidad. A esta parte del proceso de minado pertenece la aplicación de diferentes técnicas y algoritmos que presentaremos en artículos posteriores.


Los siguientes pasos del proceso (actuar y medir en el diagrama), pertenecen a otras etapas y son parte del proceso administrativo en ganeral mas propiamente que al minado en si. Sin embargo, son fundamentales para ambos procesos, pues la credibilidad de los resultados del minado depende de cómo sus recomendaciones se implementen. La medición de resultados, a su vez, es decisiva para retroalimentar el proceso. Es importante aclarar que la medición puede llegar a ser compleja e implicar la aplicación de técnicas de minado a su vez

El procesa itera en si mismo. Se pretende que retroalimente, de forma que se pueda determinar si las recomendaciones (que pudieran no ser triviales ni inmediatas) resultado del minado ha sido de valor para el negocio o si se deben buscar otro tipo de relaciones para reiniciar el ciclo.

No hay comentarios:

Publicar un comentario en la entrada