Friday, May 31, 2013

User Modelling Ecosystems: A User-centred Approach

En el contexto del artículo, un ecosistema de UM es usado para referirse a múltiples frameworks de UM y sus componentes, interactuando entre sí y formando una sola unidad.

En el artículo se presentan un módulo de sincronización entre el servidor de UM Personis y el cliente PersonisJ para Android.

El ecosistema Personis (servidor y cliente) provee un mecanismo para representar el contenido del modelo de usuario y mecanismo de razonamiento para derivar suposiciones sobre los usuarios. La representación está basada en el modelo de acreción/resolución, en el que la evidencia es recolectada y almacenada en un modelo jerárquico de contextos y componentes. El razonamiento se lleva a cabo mediante reglas de inferencia sobre la evidencia.

Dentro de las características para usuarios finales, se tiene la posibilidad de modificar manualmente partes del modelo de usuario y poder pasarlo a dispositivos móviles para ser utilizado por las aplicaciones que se encuentren ahí. Se tiene en cuenta una sincronización manual y automática dependiendo de cómo lo configure el usuario.

Se condujo un estudio con 8 participantes para determinar qué características del ecosistema UM son importantes para ellos. El estudio les permitió interactuar con el modelo de usuario directamente y no como tradicionalmente se tiene como trasfondo de una aplicación. El estudio consta de un cuestionario de conocimientos previos, un tutorial de 5 a 10 minutos de modelos de usuario, una serie de tareas conducidas bajo el método think aloud y finalmente otro cuestionario sobre la importancia de las características del UM en una escala de 7 puntos. La tabla con los resultados del último cuestionario se muestra a continuación:

image

Los resultados muestran que los usuarios creen que es importante poder acceder sus modelos, que algunos usuarios (pero no todos) prefieren que su modelo sea almacenado en la red y no localmente, los usuarios quieren tener la propiedad total (no compartida) de sus modelos, la importancia de permitir a los usuarios inspeccionar sus modelos y de esa forma entender por qué se encuentra dicha información en el modelo, los usuarios quieren control total sobre su modelo, y no tienen problemas con que la información se guarde a lo largo del tiempo.

Wasinger, R., Fry, M., Kay, J., & Kummerfeld, B. (2012). User modelling ecosystems: a user-centred approach. UMAP’12 Proceedings of the 20th international conference on User Modeling, Adaptation, and Personalization (pp. 334–339). doi:10.1007/978-3-642-31454-4_31

Developing a Semantic User and Device Modeling Framework that supports UI Adaptability of Web 2.0 Applications for People with Special Needs

El panorama de las aplicaciones en web ha cambiado de ser un grupo de páginas estáticas a aplicaciones corriendo en un sandbox a lo que se conoce hoy en día como Web 2.0. Una de las características más notorias de la nueva arquitectura se centra en la personalización de la experiencia del usuario a través de la interfaz.

La arquitectura del sistema está determinada por la diversidad de ambientes en el proyecto I2Web. La siguiente figura muestra la arquitectura del framework:

image

El objetivo de la arquitectura del framework se basa en cubrir el ciclo de vida entero en el desarrollo para entregar una aplicación web moderna. El proceso de autoría incluye desde los desarrolladores empleando IDEs complejos hasta simples usuarios que suben información.

Una de las principales aportaciones del artículo es la incursión de un modelo de tecnología web. De esta forma se tienen las siguientes ventajas:

  • Permite la expresión de las capacidades de los dispositivos tanto en componentes de hardware como de software.
  • Permite la expresión de las preferencias del usuario.
  • Simplifica la expresión de reglas (matching rules) para la adaptabilidad con diversas granularidades desde componentes de alto nivel (imágenes, películas, etc.) hasta elementos de bajo nivel (elementos HTML, CSS, etc.).

El modelo de dispositivo que emplean se divide en plataforma de hardware, hardware, plataforma de software y software.

El modelo de usuario está orientado a un mapeo eficiente entre las capacidades del dispositivo y las preferencias del usuario. El modelo soporta cuatro medios de remodelación de la interfaz de usuario: supresión, inserción, substitución y reorganización.

Los modelos anteriores deben ser integrados en una aplicación. En el caso del artículo, se emplean elementos semánticos de HTML5 y anotaciones de WAI-ARIA. De esta manera se generan reglas de inferencia para desplegar los contenidos personalizados para los usuarios.

Las pruebas quedan pendientes y se menciona que se estaban realizando al momento de escribir el artículo.

Ackermann, P., Velasco, C. A., & Power, C. (2012). Developing a semantic user and device modeling framework that supports UI adaptability of web 2.0 applications for people with special needs. Proceedings of the International Cross-Disciplinary Conference on Web Accessibility - W4A ’12 (p. 1). New York, New York, USA: ACM Press. doi:10.1145/2207016.2207018

Beyond Cumulated Gain and Average Precision: Including Willingness and Expectation in the User Model

En la rama de IR (Information Retrieval) se emplean comúnmente dos métricas por separado: un criterio de paro y la satisfacción del usuario. Hasta la fecha de este artículo, no habían sido usadas a la vez.

Asumiendo que el usuario observe la lista de resultados que obtiene de manera secuencial, se sabe que al ver cada resultado en orden parará o continuará. La métrica del artículo está definida sobre este par de acciones.

Se hace la suposición de que el detenerse en un resultado depende de dos factores: cuánto esfuerzo está dispuesto el usuario a emplear antes de encontrar un nuevo documento relevante, y cuanto esfuerzo espera gastar antes de encontrar un nuevo documento relevante. Estos dos se encuentran influenciados por otros factores como cuánta información relevante ha visto el usuario hasta el momento, el esfuerzo que debe gastar para obtener los siguientes resultados, cuánta información relevante está presente en el listado, etc.

La disposición del usuario depende sobre cuántos documentos más espera el usuario encontrar y por lo tanto se relaciona con el número total de documentos (recall). El esfuerzo (disposición) debe ser una función decreciente de la estimación del usuario sobre el número de documentos relevantes en el ranking (lista).

Según las métricas que analizan, esperan que haga paros continuos a medida que disminuye la precisión (expectativa) y cuando el número de documentos relevantes faltantes baja (disposición).

Se lleva a cabo una reinterpretación de la precisión promedio para los resultados. Los resultados indican que si se llega a un rango k, el usuario siempre continúa si el documento no es relevante y se detiene con una probabilidad que es inversamente proporcional al número de documentos relevantes dentro o después del rango k.

Los resultados al momento son interpretaciones y no se respaldan con datos duros.

Piwowarski, B., Dupret, G., & Lalmas, M. (2012). Beyond Cumulated Gain and Average Precision: Including Willingness and Expectation in the User Model. arXiv preprint arXiv:1209.4479, 2–5. Information Retrieval. Retrieved from http://arxiv.org/abs/1209.4479

Tuesday, May 21, 2013

Social awareness and user modeling to improve objects intelligence

La mayoría de aplicaciones que busca tomar en cuenta el contexto para llevar a cabo un modelado, no toma en consideración el aspecto social de los individuos.

Definen a los contextos sociales como si fuesen similares a los grupos sociales, identificados por un grupo de personas en un lugar dado, enlazados por relaciones que determinan su naturaleza y se caracterizan por rasgos específicos como sexo, edad o preferencias.

Las principales características de los agentes socialmente inteligentes que crearon son:

  • Detección de usuarios y las conexiones entre ellos.
  • Acceso a los datos del usuario.
  • Inferencia del contexto social de acuerdo a las estructuras de las redes de los usuarios, sus preferencias y rasgos.
  • Inferencia de objetivos sociales de acuerdo al contexto social y al modelo de usuario.
  • Coordinar su comportamiento.
  • Producir una salida enfocada al contexto.

Proponen que los contextos sociales pueden ser derivados de la estructura de las redes sociales. Las redes sociales se encuentran representadas por grafos dirigidos en los que cada nodo es un usuario y los arcos son sus conexiones sociales.

El modelo de ontologías creado para el sistema se divide en:

  • Ontología de objetos – Representa los objetos, sus propiedades y relaciones. Los objetos auto-conscientes (self-aware) son capaces de evaluar su naturaleza y tomar decisiones de acuerdo a sus propiedades o pertenencia a una clase definida por la ontología.
  • Ontología de contexto social – Representa todos los elementos de las redes que deben ser tomados en cuenta para describir un contexto social.
  • Ontología de objetivos sociales – Contiene dos clases: objetivos individuales y objetivos de grupo.

Para el modelo de usuario emplearon GUMO (General User Model Ontology) junto con FOAF (Friend Of A Friend). GUMO contiene las bases y conceptos generales para representar los rasgos principales de los usuarios en entornos ubicuos.

El modelo de grupo también se hace dentro de una ontología e incluye datos como: edad promedio, género mayoritario, distribución y variación, presencia de niños, presencia de un líder de opinión y preferencias y aversiones del grupo.

Se emplea network-driven reasoning para llevar a cabo la clasificación de los grupos. Por otra parte, para la clasificación de objetivos sociales se hace uso de una serie de heurísticas propuestas por los autores.

Biamino, G., & Cena, F. (2011). Social Awareness and User Modeling to Improve Objects Intelligence. 2011 IEEE/WIC/ACM International Conferences on Web Intelligence and Intelligent Agent Technology (pp. 118–121). Ieee. doi:10.1109/WI-IAT.2011.260

Fuzzy-Based Clustering Genetic Group Model of Project Practice Teaching

La aplicación está pensada en la creación de grupos para los proyectos de una escuela. Se menciona que el problema de crear grupos para proyectos es NP completo.

El método difuso de agrupamiento (clustering) de estudiantes se basa en:

  • Transacción de la estandarización de datos
  • Creación de matrices de similitud equivalente
  • Clustering
  • Agrupación genética

Cada individuo en la población representa una posible asignatura. En el encodeo empleado, cada carácter representa el número de identificación único de un estudiante y se usa el 0 para delimitar las filas de grupos. La siguiente figura muestra un ejemplo:

image

La función de aptitud agrega un valor a cada individuo en la población, lo que indica la calidad de la asignación. Para la selección, mutación y cruce, se decidió emplear el método de weighted roulette wheel. La condición de paro reside en la convergencia del algoritmo con un límite de 1000 iteraciones.

En las pruebas, se usaron a 16 estudiantes con sus respectivas calificaciones. En la siguiente tabla se muestra el resultado de la estandarización de datos:

image

Las matrices de relación son las siguientes:
image

image

Los resultados convergen en un conjunto que puede ser mejorado aún más haciendo que los estudiantes sobresalientes se encuentren en grupos separados. El grupo resultante es: B={{ p4, p13, p7, p2},{p1, p5, p11, p12}, {p0, p9, p10, p6 },{p15, p3, p8, p14}}, pero después de llevar a cabo el ajuste se obtienen: B={{ p4, p13, p1, p5 },{ p7, p2, p11, p12 },{ p0 , p9, p10, p6 },{p15, p3, p8, p14 }}.

Se menciona que esta aplicación puede ser implementada para dominios distintos al propuesto.

Conference, I., & Science, C. (2009). Fuzzy-based clustering genetic group model of project practice teaching. 2009 4th International Conference on Computer Science & Education (pp. 1484–1487). Ieee. doi:10.1109/ICCSE.2009.5228570

The Research of User Model Based on Hierarchical Semantic Context for Digital Library

El contexto se define como cualquier información que describe la situación o el estado de una entidad. En este caso, se describen tres modelos de contexto semántico que son:

  • Jerarquía de interfaz de usuario – se encarga de llevar los registros de actividad de cada usuario.
  • Jerarquía de administración del contexto – Se encarga de recolectar el contexto del usuario.
  • Jerarquía de recursos – Se encarga de colectar el recurso y calcular la similitud entre los documentos del recurso y el modelo de contexto semántico de los usuarios para recomendar el documento con mayor similitud.

La estructura general del modelo de usuario se muestra en la siguiente figura:

image

Se hace uso de un diccionario especializado en un dominio para construir la ontología que representa al usuario, debido a que las ontologías comúnmente se encuentran asociadas a un tema.

Las acciones registradas de los usuarios son las mostradas en la siguiente tabla:

image

Cada que el usuario lleva a cabo una consulta, su modelo es actualizado de acuerdo a los términos de la búsqueda presentada. El modelo también es actualizado por la constante interacción del usuario con el sistema.

Song, W. (2011). The research of user model based on hierarchical semantic context for digital library. 2011 International Conference on Computer Science and Service System (CSSS) (pp. 882–885). IEEE. doi:10.1109/CSSS.2011.5974768

Thursday, May 9, 2013

Inferring User Personality in Social Networks: A Case Study in Facebook

La manera tradicional de obtener la personalidad de un usuario consiste en pedirle que conteste una serie de cuestionarios, esto se vuelve una tarea tediosa ya que normalmente se requiere de una gran cantidad de preguntas para obtener un perfil correcto. Mientras que se han hecho otros estudios para intentar inferir la personalidad del usuario, en este artículo se hace en base a las interacciones que tiene dentro de las redes sociales.

La personalidad de un individuo puede ser definida como el conjunto de características que inducen una tendencia en el comportamiento del individuo, esta tendencia se mantiene estable a través del tiempo y de las situaciones que se presentan.

Emplearon el método de Alternative Five para clasificar las personalidades de las personas mediante el ZKPQ-50-cc. Además de las se agregaron 10 preguntas del ZKPQ original que determinan la necesidad de un individuo de ser aceptado (un alto grado en esta sección puede significar que el usuario intenta ser aceptado y por ende no respondió con sinceridad el resto de las preguntas).

Se creó una aplicación en Facebook (TP2010) que consiste básicamente en el cuestionario y en poder comparar sus resultados con amigos. La aplicación alcanzó los 65000 usuarios después de cuatro semanas de haber sido lanzada. Los parámetros recolectados se muestran a continuación:

image

Después de la limpieza de datos, se decidieron a utilizar una base de 11148 usuarios.

Con los rasgos seleccionados se hacen las siguientes consideraciones:

Los rasgos tienen poca o nula correlación entre ellos.

Es posible que no todos los rasgos sean relevantes para todas las aplicaciones adaptivas.

En ningún caso el valor de un rasgo debe ser inferido del valor de otro ya que se supone que no se conoce nada sobre la personalidad del usuario.

Más que los valores exactos, se consideran tendencias para el clasificador que crearon para predecir la personalidad de los usuarios. Se emplearon varias técnicas pero como todos los resultados eran similares se quedaron con el que ofrecía una representación más clara, por ello usaron la implementación J48 del algoritmo C4.5. Se emplearon 3 y 5 escalas para los resultados que se presentan a continuación:

image

image

Por otra parte, mencionan la posibilidad de existir sistemas que no tengan gran diferencia entre la adaptabilidad de algo muy bajo y algo bajo solamente, por ello hacen la misma serie de pruebas con 5 clasificaciones sin considerar los errores entre vecinos dando los siguientes resultados:

image

En general es un enfoque interesante aunque falta mucho trabajo ya que la precisión de la predicción se considera un tanto baja.

Ortigosa, A., Quiroga, J. I., & Carro, R. M. (2011). Inferring user personality in social networks: A case study in Facebook. 2011 11th International Conference on Intelligent Systems Design and Applications (pp. 563–568). Ieee. doi:10.1109/ISDA.2011.6121715

Combining Linguistic Values and Semantics to Represent User Preferences

Se provee una herramienta para formalizar el conocimiento del usuario a través de técnicas de web semántica y valores lingüísticos y así llevar a cabo razonamiento sobre el mismo.

El uso de perfiles ontológicos de usuarios permite realizar inferencias para descubrir intereses que no fueron directamente observados o explícitamente expresados. Se hace uso de un modelo de usuario semántico (FOAF) pero se extendió debido a que no fue diseñado para representar pesos y preferencias contextualizadas.

Los siguientes esquemas fueron utilizados para extender a FOAF:

  • RELATIONSHIP schema
  • W3C SWAP Personal Information Markup
  • Ontología con pesos de interés
  • Geonames dataset
  • W3C Basic Geo
  • Modelo de habilidades

La siguiente figura muestra el modelo FOAF extendido:

image

La siguiente figura es una representación en RDF del personaje John Doe en la película Terminator.

image

Por otra parte el modelo de habilidades está descrito por:

image

El uso de valores lingüísticos como “joven” o “barato” junto a un grado de pertenencia permite procesar el valor del significado como es percibido por el usuario y no sólo como un valor. Se propone un método y ontología (FuSOR) para representar conjuntos difusos y valores lingüísticos. El método propuesto puede ser adherido a cualquier ontología OWL-DL para transformar sus valores en valores difusos. La siguiente figura muestra la estructura del modelo FuSOR:

image

El ejemplo mostrado dice que un usuario está buscando un restaurante. El usuario tiene su percepción de moderadamente costoso para un restaurante y sobre la distancia que está dispuesto a caminar para llegar. La función se encarga de encontrar un lugar que satisfaga ambos requerimientos como se muestra en la siguiente figura:

image

Se menciona que el uso de valores lingüísticos junto con sistemas de recomendación basados en conocimiento semántico no ha sido explorado para la parte de modelado de usuario.

Groues, V., Naudet, Y., & Kao, O. (2011). Combining Linguistic Values and Semantics to Represent User Preferences. 2011 Sixth International Workshop on Semantic Media Adaptation and Personalization (pp. 27–32). Ieee. doi:10.1109/SMAP.2011.21

Discovering Similar User Models Based on Interest Tree

La comparación de intereses entre dos modelos de usuario se lleva a cabo tradicionalmente sobre una serie de vectores. Sin embargo, recientemente los modelos de usuario se expresan mediante una estructura de árbol por lo que las medidas tradicionales de comparación no se adaptan por completo. El artículo propone una forma de llevar a cabo la comparación entre las estructuras de árbol de los modelos de usuario.

El modelo de usuario basado en árboles contiene la siguiente información:

  • Tema de interés del usuario
  • Grado de interés en distintos temas
  • Relaciones jerárquicas entre los temas de interés

La siguiente figura es un ejemplo de un árbol de interes.

image

Se llevan a cabo varios tipos de cálculos para comparar los intereses de dos usuarios, el primero es el cálculo de similitud de la estructura. El cálculo de similitud en la estructura de nodos se refiere a las diferencias en la estructura entre los modelos de usuario. Para determinar esto se toman en cuenta los siguientes tres casos:

  1. Similitud estructural del nodo hoja
  2. Similitud estructural entre el nodo hoja y los nodos que no son hojas
  3. Similitud estructural entre los nodos que no son hojas

El segundo cálculo que se lleva a cabo es sobre la similitud de tema de interés. Ya que no sólo se conocen los intereses del usuario sino también el grado con el que están relacionados al usuario, se lleva a cabo la comparación entre los valores de dos usuarios. El valor es originalmente determinado por el comportamiento y tiempo de navegación sobre el elemento.

Se lleva a cabo otro cálculo que se denomina como similitud comprensiva. Esta es la suma de las similitudes anteriores multiplicadas por un peso.

Los experimentos se llevan a cabo sobre 10 modelos usuarios y a su vez sobre 10 temas de interés. Para desplegar los resultados, sólo se incluyeron a 3 modelos que se despliegan a continuación:

image

image

image

image

Como conclusiones proponen que su medida comprensiva (CIS) muestra resultados más reales que usar las dos medidas de manera separada. Sin embargo no se sabe contra que están comparadas estas similitudes para validar el tipo de cálculos que llevan a cabo.

Zhang, L., Zhang, B., Zheng, J., Weng, X., Wang, M., & Mei, K. (2012). Discovering Similar User Models Based on Interest Tree. 2012 IEEE 12th International Conference on Computer and Information Technology (pp. 1046–1050). Ieee. doi:10.1109/CIT.2012.214

Fluid User Models for Personalized Mobile Apps

Se presenta una manera de construir y administrar los modelos de usuario durante su interacción con los medios. Debido a la escasez de información, en varias aplicaciones se han empleado suposiciones que ayudan a poblar el modelo de usuario como lo son:

  • Si dos usuarios han mostrado un mismo interés, es posible que con cierta probabilidad compartan un grado de interés en el futuro.
  • Si a un usuario le agrada un objeto, es probable que le agrade un objeto razonablemente similar en un futuro.

La investigación presentada se centra sobre el problema de media augmentation. Como ejemplo se da un video que se muestra en una pantalla y en otra se dan detalles sobre lo que aparece en la primera. La siguiente figura es una ilustración de este proceso:

image

Según algunos de los estudios citados por el artículo, las personas no pueden predecir su propio comportamiento. Debido a esto, si el sistema debe predecir lo que el usuario quiere escuchar en un lugar y tiempo determinados, se debe llevar a cabo en tiempo real sobre diversas fuentes de información. Esto es debido a que en muchos casos, el significado, la relevancia y el valor intrínseco de interés por algún fragmento de un medio es una función de interpretación hecha por el usuario a la hora de verlo.

Que el modelo se le considere altamente fluido es el resultado de inferir las preferencias del usuario en tiempo real sobre una serie de variables que incluyen el nivel de atención, contexto y la historia reciente.

La siguiente figura muestra la arquitectura del sistema propuesto:

image

El sistema monitorea y computa la atención del usuario basado en reglas de inferencia y otras entradas como su nivel de multi-tareas, su actividades durante los días anteriores, etc. También se calcula el nivel de interés que presente en distintos contenidos en diversos puntos en el tiempo y otros más son calculados empleando la historia reciente del usuario y sus actividades.

El sistema decide qué cosas son las que interesan al usuario y el tiempo apropiado en que deben ser mostradas en base al contenido del material que se encuentra viendo. La siguiente tabla es una muestra de los datos y las descripciones del material en base a los que se llevan a cabo las decisiones de mostrar o no las anotaciones:

image

El artículo se encuentra basado en un trabajo en progreso y falta más detalle sobre los métodos con los que obtuvieron la información.

Loeb, S. (2013). Fluid user models for personalized mobile apps Overview of the BrightNotesTM system. 2013 IEEE 10th Consumer Communications and Networking Conference (CCNC) (pp. 705–708). Ieee. doi:10.1109/CCNC.2013.6488530

Friday, May 3, 2013

A Framework for Personalized Management of Domain Ontologies

Las ontologías de dominio son una representación formal del conocimiento. Debido a su popularidad y reusabilidad, aumentan su tamaño constantemente para incluir todos los conceptos correspondientes a su dominio. Sin embargo, no todas las aplicaciones requieren acceso a la ontología completa sino sólo a partes de ella. En el artículo se propone una personalización de la ontología dependiendo del uso que se requiere.

Para lograr dividir una ontología se debe hacer de acuerdo a su similitud semántica y se deben detectar y resolver la heterogeneidad. Las ontologías pueden ser divididas en módulos gracias a su representación como grafos, rompiendo los enlaces entre los nodos. Sin embargo, se menciona que los módulos resultantes siguen siendo de un tamaño demasiado grandes.

La siguiente figura muestra la arquitectura propuesta:

image

El modelo consiste en emplear las técnicas de descomposición en módulos para la ontología de dominio y luego en tiempo de ejecución elegir dinámicamente los módulos que requiere el usuario y se le brinda una vista personalizada.

Con el modelo se pueden representar los intereses del usuario que además suelen cambiar conforme al tiempo. En la implementación se emplea un modelo de distancia de declive para modelar los intereses personalizados de un usuario por medio de etiquetas en una línea de tiempo. Las etiquetas recientes tienen una mayor probabilidad de ser usadas por el usuario que las que llevan un tiempo en el sitio, es por esto que las recientes tienen un declive menor a las antiguas.

La creación de vistas personalizadas se muestra en la siguiente figura:

image

Primero se lleva a cabo la descomposición de acuerdo a su nivel de conectividad procurando crear módulos con alta cohesión. Después, según las características del usuario se lleva a cabo una selección de los módulos. Se detecta si existe heterogeneidad entre los módulos, se juzga si son suficientes para el usuario y si se encuentran incompletos. El último paso consiste en combinar los módulos para presentar la vista personalizada.

Liu, R., Wang, P., & Zheng, S. (2012). A Framework for Personalized Management of Domain Ontologies. 2012 IEEE/ACIS 11th International Conference on Computer and Information Science (pp. 411–415). Ieee. doi:10.1109/ICIS.2012.6

Proposal of User Modeling Method and Recommender System based on Personal Values

El valor de juicio de un usuario se refiere al criterio para juzgar en qué atributos se enfoca el usuario al evaluar los objetos. El método propuesto en el artículo no evalúa las preferencias sino la relación entre el rating de cada atributo y los objetos. Esto permite encontrar el atributo que contribuye mayormente al rating de un objeto.

Los modelos de usuario son generados basados en la tasa de influencia de los ratings de cada atributo hacia los ratings de los objetos. La influencia está definida por el RMRate (Rating Machine Rate). Mientras mayor RMRate tenga, mayor prioridad se asignará a los atributos. La siguiente tabla muestra un ejemplo de ratings de dos productos, seguido por el cálculo del RMRate de la primera tabla.

image

image

La arquitectura del sistema se encuentra basada en tres módulos y se muestra un diagrama a continuación:

image

Los módulos son:

  • Obtención de polaridad – Se encarga de extraer las polaridades de los objetos y de cada atributo y almacenarlas en una base de datos.
  • Modelado de usuario – Toma la base de datos de polaridad y en base al RMRate construye una base de modelos de usuario de m-dimensiones.
  • Recomendación – Basado en el modelo de usuario, se toman los objetos con mayor RMRate.

Los experimentos se hicieron sobre 942 reseñas de 78 usuarios. Los resultados se muestran a continuación:

image

El número de atributos con un RMRate de más de 0.7 por usuario es de 2.68 mientras que al tenerlo por más de 0.8 es de 1.68. Dado esto, se puede deducir que los usuarios ponen prioridades distintas en los atributos. Como primer acercamiento queda como factible la posibilidad de realizar un modelo de usuario en base a este tipo de valores.

Hattori, S., Mao, Z., & Takama, Y. (2012). Proposal of user modeling method and recommender system based on personal values. The 6th International Conference on Soft Computing and Intelligent Systems, and The 13th International Symposium on Advanced Intelligence Systems (pp. 1720–1723). Ieee. doi:10.1109/SCIS-ISIS.2012.6505151

Method of Recommend Microblogging Based on User Model

La herramienta se trata de un sistema que recomienda micro-blogs en base a un perfil de usuario. El primer paso que se realiza consiste en el pre-procesamiento de datos en el que se segmentan las palabras en chino, se marca la naturaleza de las palabras y se eliminan las que menos información aportan (stop words).

Debido a lo corto de los mensajes del medio, se emplea SAM (Spreading Activation Model) para expandir la semántica de las palabras. SAM se divide en una red de activación extendida y una expansión del mecanismo de activación. La primera es similar a una red semántica ya que contiene enlaces y nodos, los nodos son los conceptos y los enlaces su relación semántica. La segunda parte es un proceso que ajusta las entradas, extiende las clases, calcula y da los resultados y extiende todo hasta el final. Un ejemplo de la expansión semántica se muestra a continuación:

image

El SEM (Semantic Expansion Method) indica que si el nodo se encuentra en la distancia extendida y su valor de activación es mayor al del umbral (threshold), entonces el nodo es activado. Se hace un ejemplo partiendo de una estructura original que consiste en Milan, Football y Ball, con un umbral de 0.1 y una distancia de 1. El resultado se muestra a continuación:

image

La representación del modelo de usuario se lleva a cabo mediante vectores y la similitud se calcula con coseno. La propagación de los mensajes hace que se tome en cuenta los comentarios y los forwards de cada mensaje para medir su popularidad. La siguiente figura muestra una ilustración de la propagación:

image

El proceso general es:

  • Pre-procesar los micro-blogs y representarlos en un espacio vectorial.
  • Expandir la semántica mediante SEM.
  • Calcular la similitud entre el usuario y el micro-blog.
  • Obtener el factor de los comentarios y forwards.
  • Si la suma del factor y la similitud es mayor a cierto umbral, recomendar el micro-blog, de lo contrario pasarlo por alto.

Los experimentos se llevan a cabo sobre 19894 micro-blogs obtenidos del API de Sina con distintos temas como finanzas, deportes, entretenimiento, temas militares, turismo, educación, etc. Se hacen pruebas sobre 12 usuarios a quienes se les encuestó sobre las recomendaciones del sistema. Se hicieron 5 pruebas de recomendación que fueron: usando el factor, usando palabras claves, factor con palabras clave, similitud semántica y por último similitud semántica con el factor. La siguiente tabla muestra la satisfacción de los usuarios con las recomendaciones:

image

Al final se concluye que SEM puede ser una solución al problema de poco contexto pero se deben ajustar los parámetros empleados en los temas.

Mei, K., Zhang, B., Zheng, J., Zhang, L., & Wang, M. (2012). Method of Recommend Microblogging Based on User Model. 2012 IEEE 12th International Conference on Computer and Information Technology (pp. 1056–1060). Ieee. doi:10.1109/CIT.2012.216

Trend-Aware User Modeling with Location-Aware Trends on Twitter

Las decisiones de los usuarios se encuentran influidas por el contexto en el que se encuentran. Es por esto que acceden documentos web que contienen cosas, temas o eventos que se relacionan o que ocurren frecuentemente en su localidad. Dado esto, los autores toman la conciencia sobre el lugar (location awareness) como una forma de mejorar los modelos de usuario.

Se modelan las características de las tendencias usando el tiempo en que se dio y el lugar en el que se encontraban los usuarios para suponer que otros usuarios pueden ser influenciados por dicha tendencia si se encuentran en ese lugar y tiempo. Para dar pesos a la localidad y temporalidad se hace uso de TF-IDF y t-TF-IDF.

Se contribuye al problema del inicio en frío puesto que se tendría un panorama general del perfil de los usuarios en cierta locación.

El modelo de usuario se encuentra basado en regiones jerárquicas. El pesado de los conceptos se lleva a cabo por cada región. La siguiente figura es una muestra de este proceso:

image

La figura del árbol generado se parece al mapa de la población global y se muestra en la siguiente figura:

image

Para el procesamiento de los mensajes se empleó el servicio OpenCalais para obtener información semántica sobre los mensajes empleados. Para la parte de geolocalización se usó una combinación del API de twitter con el servicio de Geobatch. En la parte de enlaces de los mensajes, se usó el servicio SemanticProxy (una extensión de la iniciativa Calais).

De los mensajes usados de la base de datos sólo el 66% contienen algún tipo de referencia para la geolocalización. Se tomaron sólo las regiones que contienen 20 usuarios cortando el máximo en 100. Se obtuvieron 53 regiones en total. Para las pruebas se usaron 962 usuarios y la siguiente tabla muestra las opciones empleadas:

image

Algunos de los resultados al probar 160 combinaciones de parámetros muestran que el parámetro más determinante para dar una recomendación es la influencia de la tendencia. El modelo basado en intereses del usuario es 8 veces mejor que cuando sólo se emplean las tendencias. Basarse en entidades es al menos dos veces mejor que hacerlo en temas. La siguiente figura muestra el f-measure de las pruebas:

image

La siguiente prueba consistió en comparar el modelo empleando conciencia sobre el lugar contra un modelo global, dando como resultado lo siguiente:

image

En general los resultados muestran una mejoría al tomar la localidad como contexto a la hora de desarrollar un modelo de usuario. La parte de reconocimiento de entidades es llevada a cabo por un servicio de terceros.

Kanta, M., Šimko, M., & Bieliková, M. (2012). Trend-Aware User Modeling with Location-Aware Trends on Twitter. Semantic and Social Media Adaptation and Personalization (SMAP), 2012 Seventh International Workshop on (pp. 23–28). Luxemburg: IEEE Computer Society’s Conference Publishing Services. doi:10.1109/SMAP.2012.20

Adaptive Updating Algorithm of User Model Based on Interest Cycle

Los intereses de un usuario se mantienen estables por cierto tiempo pero no son completamente invariables. Respecto a la memoria humana, los intereses pueden ser olvidados y luego desaparecer, algunos otros se reactivarán después de estar en un sueño profundo pasando a un estado activo y un nuevo interés puede sustituir a uno viejo.

Las investigaciones sobre psicología muestran que la atenuación y la activación se producen en ciclos de tiempo. Para los intereses de largo término, los ciclos comprenden de uno a varios meses y las fluctuaciones del valor de interés no son muy grandes. Las noticias actuales por otra parte, pueden tener un ciclo muy corto y hasta ser olvidadas por completo con el paso del tiempo.

Se siguen los siguientes pasos:

  • Se tiene un arreglo con los intereses en un tema, el valor del interés y la fecha de creación.
  • Se dividen los intereses del usuario de acuerdo al tamaño de la ventana de tiempo.
  • Se ajustan los puntos de interés cuando no hay valores durante la ventana de tiempo (función de olvido).
  • Se calcula el interés del usuario y los ciclos para los temas.

De acuerdo a su experimento, los intereses de largo plazo tienen un ciclo de 80 o más días. Por otro lado, los intereses de corto plazo quedan con 20 días como máximo en su ciclo. Todo los que se ubiquen entre más de 20 y menos de 80 quedan considerados como intereses a medio término.

La función evolutiva del ciclo de interés se basa en una ecuación de olvido adaptivo. Por otra parte, esto queda complementado con una forma que da incentivos sobre los nuevos intereses que aparecen para el usuario sobre un nodo.

Los experimentos se basaron en comparar el sistema con otros que no tienen contemplados los ciclos de tiempo para cada tipo de memoria (largo, mediano y corto término). Los resultados se muestran a continuación:

image

image

image

En general consideran que quedó cubierto el propósito de simular de manera más fiel el proceso de interés humano al incorporar los ciclos. Se considera que se debe mejorar el método de clasificación y cómo aprovechar los términos que resultaron.

Wang, M., Zhang, B., Zheng, J., Mei, K., & Zhang, L. (2012). Adaptive Updating Algorithm of User Model Based on Interest Cycle. 2012 IEEE 12th International Conference on Computer and Information Technology (pp. 1051–1055). Ieee. doi:10.1109/CIT.2012.215