Friday, May 3, 2013

Method of Recommend Microblogging Based on User Model

La herramienta se trata de un sistema que recomienda micro-blogs en base a un perfil de usuario. El primer paso que se realiza consiste en el pre-procesamiento de datos en el que se segmentan las palabras en chino, se marca la naturaleza de las palabras y se eliminan las que menos información aportan (stop words).

Debido a lo corto de los mensajes del medio, se emplea SAM (Spreading Activation Model) para expandir la semántica de las palabras. SAM se divide en una red de activación extendida y una expansión del mecanismo de activación. La primera es similar a una red semántica ya que contiene enlaces y nodos, los nodos son los conceptos y los enlaces su relación semántica. La segunda parte es un proceso que ajusta las entradas, extiende las clases, calcula y da los resultados y extiende todo hasta el final. Un ejemplo de la expansión semántica se muestra a continuación:

image

El SEM (Semantic Expansion Method) indica que si el nodo se encuentra en la distancia extendida y su valor de activación es mayor al del umbral (threshold), entonces el nodo es activado. Se hace un ejemplo partiendo de una estructura original que consiste en Milan, Football y Ball, con un umbral de 0.1 y una distancia de 1. El resultado se muestra a continuación:

image

La representación del modelo de usuario se lleva a cabo mediante vectores y la similitud se calcula con coseno. La propagación de los mensajes hace que se tome en cuenta los comentarios y los forwards de cada mensaje para medir su popularidad. La siguiente figura muestra una ilustración de la propagación:

image

El proceso general es:

  • Pre-procesar los micro-blogs y representarlos en un espacio vectorial.
  • Expandir la semántica mediante SEM.
  • Calcular la similitud entre el usuario y el micro-blog.
  • Obtener el factor de los comentarios y forwards.
  • Si la suma del factor y la similitud es mayor a cierto umbral, recomendar el micro-blog, de lo contrario pasarlo por alto.

Los experimentos se llevan a cabo sobre 19894 micro-blogs obtenidos del API de Sina con distintos temas como finanzas, deportes, entretenimiento, temas militares, turismo, educación, etc. Se hacen pruebas sobre 12 usuarios a quienes se les encuestó sobre las recomendaciones del sistema. Se hicieron 5 pruebas de recomendación que fueron: usando el factor, usando palabras claves, factor con palabras clave, similitud semántica y por último similitud semántica con el factor. La siguiente tabla muestra la satisfacción de los usuarios con las recomendaciones:

image

Al final se concluye que SEM puede ser una solución al problema de poco contexto pero se deben ajustar los parámetros empleados en los temas.

Mei, K., Zhang, B., Zheng, J., Zhang, L., & Wang, M. (2012). Method of Recommend Microblogging Based on User Model. 2012 IEEE 12th International Conference on Computer and Information Technology (pp. 1056–1060). Ieee. doi:10.1109/CIT.2012.216

No comments:

Post a Comment