Las decisiones de los usuarios se encuentran influidas por el contexto en el que se encuentran. Es por esto que acceden documentos web que contienen cosas, temas o eventos que se relacionan o que ocurren frecuentemente en su localidad. Dado esto, los autores toman la conciencia sobre el lugar (location awareness) como una forma de mejorar los modelos de usuario.
Se modelan las características de las tendencias usando el tiempo en que se dio y el lugar en el que se encontraban los usuarios para suponer que otros usuarios pueden ser influenciados por dicha tendencia si se encuentran en ese lugar y tiempo. Para dar pesos a la localidad y temporalidad se hace uso de TF-IDF y t-TF-IDF.
Se contribuye al problema del inicio en frío puesto que se tendría un panorama general del perfil de los usuarios en cierta locación.
El modelo de usuario se encuentra basado en regiones jerárquicas. El pesado de los conceptos se lleva a cabo por cada región. La siguiente figura es una muestra de este proceso:
La figura del árbol generado se parece al mapa de la población global y se muestra en la siguiente figura:
Para el procesamiento de los mensajes se empleó el servicio OpenCalais para obtener información semántica sobre los mensajes empleados. Para la parte de geolocalización se usó una combinación del API de twitter con el servicio de Geobatch. En la parte de enlaces de los mensajes, se usó el servicio SemanticProxy (una extensión de la iniciativa Calais).
De los mensajes usados de la base de datos sólo el 66% contienen algún tipo de referencia para la geolocalización. Se tomaron sólo las regiones que contienen 20 usuarios cortando el máximo en 100. Se obtuvieron 53 regiones en total. Para las pruebas se usaron 962 usuarios y la siguiente tabla muestra las opciones empleadas:
Algunos de los resultados al probar 160 combinaciones de parámetros muestran que el parámetro más determinante para dar una recomendación es la influencia de la tendencia. El modelo basado en intereses del usuario es 8 veces mejor que cuando sólo se emplean las tendencias. Basarse en entidades es al menos dos veces mejor que hacerlo en temas. La siguiente figura muestra el f-measure de las pruebas:
La siguiente prueba consistió en comparar el modelo empleando conciencia sobre el lugar contra un modelo global, dando como resultado lo siguiente:
En general los resultados muestran una mejoría al tomar la localidad como contexto a la hora de desarrollar un modelo de usuario. La parte de reconocimiento de entidades es llevada a cabo por un servicio de terceros.
Kanta, M., Šimko, M., & Bieliková, M. (2012). Trend-Aware User Modeling with Location-Aware Trends on Twitter. Semantic and Social Media Adaptation and Personalization (SMAP), 2012 Seventh International Workshop on (pp. 23–28). Luxemburg: IEEE Computer Society’s Conference Publishing Services. doi:10.1109/SMAP.2012.20
No comments:
Post a Comment