Investigando un poco más sobre esta área de web mining encontré que algunas de las aplicaciones precisas de llevar a cabo web usage mining son:
- Web personalization
- Link prediction and analysis
- Web site evaluation or reorganization
- Web analytics and ecommerce data analysis
- Adaptive Web sites
- Web pre-fetching
Mientras cada uno de los usos previamente mencionados puede tener un fin distinto, el proceso que siguen para llevarlo a cabo sigue un patrón que en el análisis de los registros que existen en los servidores web. Los registros de los servidores no se encuentran abiertos a todo el público y la estructura interna que siguen varía dependiendo del contenido del sitio. Algunos ejemplos encontrados sobre la información contenida en los servidores y que fue empleada para algunos artículos se muestran a continuación:
Complementando la información sobre el acceso general a los servidores se cuenta también con los datos de las sesiones de cada usuario para hacer predicciones sobre individuos después de haber modelado su comportamiento, estas sesiones de igual forma dependen de la información que guarde el servidor y un ejemplo se encuentra en la siguiente figura:
Mientras que los métodos empleados para el análisis y clasificación son técnicas comunes en minería de datos (clustering, clasificadores, etc.) el principal problema con este tipo de investigaciones radica en la obtención y pre-procesamiento de los datos debido a que como se ha mencionado, la presentación de los datos no es uniforma y varia dependiendo del caso de estudio.
Otro problema ligado directamente a la obtención de los datos radica en el lugar de donde son obtenidos ya que la mayoría no se encuentran abiertos al público por lo que gran parte de los artículos emplea los servidores de la institución en la que se encuentran para realizar los análisis y pruebas de sus investigaciones.
Casale, G. (2005). Combining queueing networks and web usage mining techniques for web performance analysis. Proceedings of the 2005 ACM symposium on Applied computing - SAC ’05 (p. 1699). New York, New York, USA: ACM Press. doi:10.1145/1066677.1067061
Géry, M., & Haddad, H. (2003). Evaluation of web usage mining approaches for user’s next request prediction. Proceedings of the fifth ACM international workshop on Web information and data management - WIDM ’03 (p. 74). New York, New York, USA: ACM Press. doi:10.1145/956699.956716
Jin, X., Zhou, Y., & Mobasher, B. (2004). Web usage mining based on probabilistic latent semantic analysis. Proceedings of the 2004 ACM SIGKDD international conference on Knowledge discovery and data mining - KDD ’04 (p. 197). New York, New York, USA: ACM Press. doi:10.1145/1014052.1014076
No comments:
Post a Comment