miércoles, 10 de noviembre de 2010

Definiendo



Una definición, casi universalmente aceptada, de minado de datos es:

“El proceso de exploración y análisis, por medios automáticos o semiautomáticos, de grandes cantidades de datos con el objeto de descubrir patrones y reglas significativas en los mismos”.

La clave para poder entender la trascendencia del minado radica en los siguientes componentes (puntos claves en la definición):

Es un proceso no solo de análisis sino también de exploración. De aquí que podamos hacer minado con solo explorar los datos y sin que necesariamente se requiera de tecnologías de punta o estado del arte (y sus correspondientes inversiones) para poder beneficiarnos con el minado. Un analisis en este contexto implica la involucración de profesionales expertos en la materia y por tanto con una estructura de costos mas compleja, fuera del alcance de muchas organizaciones. Sin embargo el proceso no esta vedado para organizaciones mas pequeñas,

Por medios automáticos o semiautomáticos. La simple exploración de los datos de manera semiautomática implica que los beneficios también se pueden obtener después de hacer exploraciones con herramientas simples (como resúmenes, tablas extracto o mas ampliamente cubos). Actualmente el entorno de negocios es mas ambicioso y busca encontrar información que a primera vista pareciera insospechada o con relaciones entre los datos (patrones) que no se pueden fijar a priori. La diferencia fundamental entre los enfoques tradicionales y el enfoque moderno radica en que ahora se intenta usar herramientas que a priori no suponga un conocimiento a priori de los patrones y buscar confirmarlo; mas bien, se trata de que el proceso de exploración y análisis arroje las relaciones existentes para su posterior confirmación. Esta es la diferencia fundamental.

De grandes cantidades de datos. No se busca explicar el comportamiento para un individuo sino un comportamiento general; por tanto, el enfoque es estadístico, en muchos casos paramétrico, y por tanto implica el uso de sofisticados algoritmos y tecnologías para los casos de análisis profundo. Si bien este es el enfoque más ambicioso, también hay valor en el proceso de exploración de muestras de datos no tan grandes, aunque el mayor se obtiene cuando se examinan grandes volúmenes que le dan certidumbre a los criterios estadísticos.

Con el objeto de descubrir patrones y reglas significativas en los mismos. Como se menciona anteriormente, lo que actualmente llama mucho la atención, es el hecho de que los patrones pueden no estar fijados anteriormente al proceso de exploración. Las organizaciones por tanto encuentran mucho valor en el hecho de que el proceso les proporcione información de patrones no conocida y sobre la cual elaboran esfuerzos comerciales de enorme envergadura.

Si bien el minado se ha usado en mas de un campo del saber humano como la ciencia, la ingeniería, la cartografía, la seguridad y vigilancia publica, etc. En este blog estaremos ocupados de reflexionar en sus aplicaciones en la esfera de los negocios, en donde se ha usado, entre otras aplicaciones, para estudiar los hábitos de compra, abandono de clientes, prevención de fraudes, recursos humanos, comportamiento en Internet, análisis de redes sociales, etc.

No hay comentarios:

Publicar un comentario