Tesis Doctoral Aram

Tuesday, May 21, 2013

Fuzzy-Based Clustering Genetic Group Model of Project Practice Teaching

La aplicación está pensada en la creación de grupos para los proyectos de una escuela. Se menciona que el problema de crear grupos para proyectos es NP completo.

El método difuso de agrupamiento (clustering) de estudiantes se basa en:

Transacción de la estandarización de datos
Creación de matrices de similitud equivalente
Clustering
Agrupación genética

Cada individuo en la población representa una posible asignatura. En el encodeo empleado, cada carácter representa el número de identificación único de un estudiante y se usa el 0 para delimitar las filas de grupos. La siguiente figura muestra un ejemplo:

La función de aptitud agrega un valor a cada individuo en la población, lo que indica la calidad de la asignación. Para la selección, mutación y cruce, se decidió emplear el método de weighted roulette wheel. La condición de paro reside en la convergencia del algoritmo con un límite de 1000 iteraciones.

En las pruebas, se usaron a 16 estudiantes con sus respectivas calificaciones. En la siguiente tabla se muestra el resultado de la estandarización de datos:

Las matrices de relación son las siguientes:

Los resultados convergen en un conjunto que puede ser mejorado aún más haciendo que los estudiantes sobresalientes se encuentren en grupos separados. El grupo resultante es: B={{ p4, p13, p7, p2},{p1, p5, p11, p12}, {p0, p9, p10, p6 },{p15, p3, p8, p14}}, pero después de llevar a cabo el ajuste se obtienen: B={{ p4, p13, p1, p5 },{ p7, p2, p11, p12 },{ p0 , p9, p10, p6 },{p15, p3, p8, p14 }}.

Se menciona que esta aplicación puede ser implementada para dominios distintos al propuesto.

Conference, I., & Science, C. (2009). Fuzzy-based clustering genetic group model of project practice teaching. 2009 4th International Conference on Computer Science & Education (pp. 1484–1487). Ieee. doi:10.1109/ICCSE.2009.5228570

The Research of User Model Based on Hierarchical Semantic Context for Digital Library

El contexto se define como cualquier información que describe la situación o el estado de una entidad. En este caso, se describen tres modelos de contexto semántico que son:

Jerarquía de interfaz de usuario – se encarga de llevar los registros de actividad de cada usuario.
Jerarquía de administración del contexto – Se encarga de recolectar el contexto del usuario.
Jerarquía de recursos – Se encarga de colectar el recurso y calcular la similitud entre los documentos del recurso y el modelo de contexto semántico de los usuarios para recomendar el documento con mayor similitud.

La estructura general del modelo de usuario se muestra en la siguiente figura:

Se hace uso de un diccionario especializado en un dominio para construir la ontología que representa al usuario, debido a que las ontologías comúnmente se encuentran asociadas a un tema.

Las acciones registradas de los usuarios son las mostradas en la siguiente tabla:

Cada que el usuario lleva a cabo una consulta, su modelo es actualizado de acuerdo a los términos de la búsqueda presentada. El modelo también es actualizado por la constante interacción del usuario con el sistema.

Song, W. (2011). The research of user model based on hierarchical semantic context for digital library. 2011 International Conference on Computer Science and Service System (CSSS) (pp. 882–885). IEEE. doi:10.1109/CSSS.2011.5974768

Thursday, May 9, 2013

Inferring User Personality in Social Networks: A Case Study in Facebook

La manera tradicional de obtener la personalidad de un usuario consiste en pedirle que conteste una serie de cuestionarios, esto se vuelve una tarea tediosa ya que normalmente se requiere de una gran cantidad de preguntas para obtener un perfil correcto. Mientras que se han hecho otros estudios para intentar inferir la personalidad del usuario, en este artículo se hace en base a las interacciones que tiene dentro de las redes sociales.

La personalidad de un individuo puede ser definida como el conjunto de características que inducen una tendencia en el comportamiento del individuo, esta tendencia se mantiene estable a través del tiempo y de las situaciones que se presentan.

Emplearon el método de Alternative Five para clasificar las personalidades de las personas mediante el ZKPQ-50-cc. Además de las se agregaron 10 preguntas del ZKPQ original que determinan la necesidad de un individuo de ser aceptado (un alto grado en esta sección puede significar que el usuario intenta ser aceptado y por ende no respondió con sinceridad el resto de las preguntas).

Se creó una aplicación en Facebook (TP2010) que consiste básicamente en el cuestionario y en poder comparar sus resultados con amigos. La aplicación alcanzó los 65000 usuarios después de cuatro semanas de haber sido lanzada. Los parámetros recolectados se muestran a continuación:

Después de la limpieza de datos, se decidieron a utilizar una base de 11148 usuarios.

Con los rasgos seleccionados se hacen las siguientes consideraciones:

Los rasgos tienen poca o nula correlación entre ellos.

Es posible que no todos los rasgos sean relevantes para todas las aplicaciones adaptivas.

En ningún caso el valor de un rasgo debe ser inferido del valor de otro ya que se supone que no se conoce nada sobre la personalidad del usuario.

Más que los valores exactos, se consideran tendencias para el clasificador que crearon para predecir la personalidad de los usuarios. Se emplearon varias técnicas pero como todos los resultados eran similares se quedaron con el que ofrecía una representación más clara, por ello usaron la implementación J48 del algoritmo C4.5. Se emplearon 3 y 5 escalas para los resultados que se presentan a continuación:

Por otra parte, mencionan la posibilidad de existir sistemas que no tengan gran diferencia entre la adaptabilidad de algo muy bajo y algo bajo solamente, por ello hacen la misma serie de pruebas con 5 clasificaciones sin considerar los errores entre vecinos dando los siguientes resultados:

En general es un enfoque interesante aunque falta mucho trabajo ya que la precisión de la predicción se considera un tanto baja.

Ortigosa, A., Quiroga, J. I., & Carro, R. M. (2011). Inferring user personality in social networks: A case study in Facebook. 2011 11th International Conference on Intelligent Systems Design and Applications (pp. 563–568). Ieee. doi:10.1109/ISDA.2011.6121715

Combining Linguistic Values and Semantics to Represent User Preferences

Se provee una herramienta para formalizar el conocimiento del usuario a través de técnicas de web semántica y valores lingüísticos y así llevar a cabo razonamiento sobre el mismo.

El uso de perfiles ontológicos de usuarios permite realizar inferencias para descubrir intereses que no fueron directamente observados o explícitamente expresados. Se hace uso de un modelo de usuario semántico (FOAF) pero se extendió debido a que no fue diseñado para representar pesos y preferencias contextualizadas.

Los siguientes esquemas fueron utilizados para extender a FOAF:

RELATIONSHIP schema
W3C SWAP Personal Information Markup
Ontología con pesos de interés
Geonames dataset
W3C Basic Geo
Modelo de habilidades

La siguiente figura muestra el modelo FOAF extendido:

La siguiente figura es una representación en RDF del personaje John Doe en la película Terminator.

Por otra parte el modelo de habilidades está descrito por:

El uso de valores lingüísticos como “joven” o “barato” junto a un grado de pertenencia permite procesar el valor del significado como es percibido por el usuario y no sólo como un valor. Se propone un método y ontología (FuSOR) para representar conjuntos difusos y valores lingüísticos. El método propuesto puede ser adherido a cualquier ontología OWL-DL para transformar sus valores en valores difusos. La siguiente figura muestra la estructura del modelo FuSOR:

El ejemplo mostrado dice que un usuario está buscando un restaurante. El usuario tiene su percepción de moderadamente costoso para un restaurante y sobre la distancia que está dispuesto a caminar para llegar. La función se encarga de encontrar un lugar que satisfaga ambos requerimientos como se muestra en la siguiente figura:

Se menciona que el uso de valores lingüísticos junto con sistemas de recomendación basados en conocimiento semántico no ha sido explorado para la parte de modelado de usuario.

Groues, V., Naudet, Y., & Kao, O. (2011). Combining Linguistic Values and Semantics to Represent User Preferences. 2011 Sixth International Workshop on Semantic Media Adaptation and Personalization (pp. 27–32). Ieee. doi:10.1109/SMAP.2011.21

Discovering Similar User Models Based on Interest Tree

La comparación de intereses entre dos modelos de usuario se lleva a cabo tradicionalmente sobre una serie de vectores. Sin embargo, recientemente los modelos de usuario se expresan mediante una estructura de árbol por lo que las medidas tradicionales de comparación no se adaptan por completo. El artículo propone una forma de llevar a cabo la comparación entre las estructuras de árbol de los modelos de usuario.

El modelo de usuario basado en árboles contiene la siguiente información:

Tema de interés del usuario
Grado de interés en distintos temas
Relaciones jerárquicas entre los temas de interés

La siguiente figura es un ejemplo de un árbol de interes.

Se llevan a cabo varios tipos de cálculos para comparar los intereses de dos usuarios, el primero es el cálculo de similitud de la estructura. El cálculo de similitud en la estructura de nodos se refiere a las diferencias en la estructura entre los modelos de usuario. Para determinar esto se toman en cuenta los siguientes tres casos:

Similitud estructural del nodo hoja
Similitud estructural entre el nodo hoja y los nodos que no son hojas
Similitud estructural entre los nodos que no son hojas

El segundo cálculo que se lleva a cabo es sobre la similitud de tema de interés. Ya que no sólo se conocen los intereses del usuario sino también el grado con el que están relacionados al usuario, se lleva a cabo la comparación entre los valores de dos usuarios. El valor es originalmente determinado por el comportamiento y tiempo de navegación sobre el elemento.

Se lleva a cabo otro cálculo que se denomina como similitud comprensiva. Esta es la suma de las similitudes anteriores multiplicadas por un peso.

Los experimentos se llevan a cabo sobre 10 modelos usuarios y a su vez sobre 10 temas de interés. Para desplegar los resultados, sólo se incluyeron a 3 modelos que se despliegan a continuación:

Como conclusiones proponen que su medida comprensiva (CIS) muestra resultados más reales que usar las dos medidas de manera separada. Sin embargo no se sabe contra que están comparadas estas similitudes para validar el tipo de cálculos que llevan a cabo.

Zhang, L., Zhang, B., Zheng, J., Weng, X., Wang, M., & Mei, K. (2012). Discovering Similar User Models Based on Interest Tree. 2012 IEEE 12th International Conference on Computer and Information Technology (pp. 1046–1050). Ieee. doi:10.1109/CIT.2012.214

Fluid User Models for Personalized Mobile Apps

Se presenta una manera de construir y administrar los modelos de usuario durante su interacción con los medios. Debido a la escasez de información, en varias aplicaciones se han empleado suposiciones que ayudan a poblar el modelo de usuario como lo son:

Si dos usuarios han mostrado un mismo interés, es posible que con cierta probabilidad compartan un grado de interés en el futuro.
Si a un usuario le agrada un objeto, es probable que le agrade un objeto razonablemente similar en un futuro.

La investigación presentada se centra sobre el problema de media augmentation. Como ejemplo se da un video que se muestra en una pantalla y en otra se dan detalles sobre lo que aparece en la primera. La siguiente figura es una ilustración de este proceso:

Según algunos de los estudios citados por el artículo, las personas no pueden predecir su propio comportamiento. Debido a esto, si el sistema debe predecir lo que el usuario quiere escuchar en un lugar y tiempo determinados, se debe llevar a cabo en tiempo real sobre diversas fuentes de información. Esto es debido a que en muchos casos, el significado, la relevancia y el valor intrínseco de interés por algún fragmento de un medio es una función de interpretación hecha por el usuario a la hora de verlo.

Que el modelo se le considere altamente fluido es el resultado de inferir las preferencias del usuario en tiempo real sobre una serie de variables que incluyen el nivel de atención, contexto y la historia reciente.

La siguiente figura muestra la arquitectura del sistema propuesto:

El sistema monitorea y computa la atención del usuario basado en reglas de inferencia y otras entradas como su nivel de multi-tareas, su actividades durante los días anteriores, etc. También se calcula el nivel de interés que presente en distintos contenidos en diversos puntos en el tiempo y otros más son calculados empleando la historia reciente del usuario y sus actividades.

El sistema decide qué cosas son las que interesan al usuario y el tiempo apropiado en que deben ser mostradas en base al contenido del material que se encuentra viendo. La siguiente tabla es una muestra de los datos y las descripciones del material en base a los que se llevan a cabo las decisiones de mostrar o no las anotaciones:

El artículo se encuentra basado en un trabajo en progreso y falta más detalle sobre los métodos con los que obtuvieron la información.

Loeb, S. (2013). Fluid user models for personalized mobile apps Overview of the BrightNotesTM system. 2013 IEEE 10th Consumer Communications and Networking Conference (CCNC) (pp. 705–708). Ieee. doi:10.1109/CCNC.2013.6488530

Friday, May 3, 2013

A Framework for Personalized Management of Domain Ontologies

Las ontologías de dominio son una representación formal del conocimiento. Debido a su popularidad y reusabilidad, aumentan su tamaño constantemente para incluir todos los conceptos correspondientes a su dominio. Sin embargo, no todas las aplicaciones requieren acceso a la ontología completa sino sólo a partes de ella. En el artículo se propone una personalización de la ontología dependiendo del uso que se requiere.

Para lograr dividir una ontología se debe hacer de acuerdo a su similitud semántica y se deben detectar y resolver la heterogeneidad. Las ontologías pueden ser divididas en módulos gracias a su representación como grafos, rompiendo los enlaces entre los nodos. Sin embargo, se menciona que los módulos resultantes siguen siendo de un tamaño demasiado grandes.

La siguiente figura muestra la arquitectura propuesta:

El modelo consiste en emplear las técnicas de descomposición en módulos para la ontología de dominio y luego en tiempo de ejecución elegir dinámicamente los módulos que requiere el usuario y se le brinda una vista personalizada.

Con el modelo se pueden representar los intereses del usuario que además suelen cambiar conforme al tiempo. En la implementación se emplea un modelo de distancia de declive para modelar los intereses personalizados de un usuario por medio de etiquetas en una línea de tiempo. Las etiquetas recientes tienen una mayor probabilidad de ser usadas por el usuario que las que llevan un tiempo en el sitio, es por esto que las recientes tienen un declive menor a las antiguas.

La creación de vistas personalizadas se muestra en la siguiente figura:

Primero se lleva a cabo la descomposición de acuerdo a su nivel de conectividad procurando crear módulos con alta cohesión. Después, según las características del usuario se lleva a cabo una selección de los módulos. Se detecta si existe heterogeneidad entre los módulos, se juzga si son suficientes para el usuario y si se encuentran incompletos. El último paso consiste en combinar los módulos para presentar la vista personalizada.

Liu, R., Wang, P., & Zheng, S. (2012). A Framework for Personalized Management of Domain Ontologies. 2012 IEEE/ACIS 11th International Conference on Computer and Information Science (pp. 411–415). Ieee. doi:10.1109/ICIS.2012.6