La primera tarea a la que se dedica esta investigación se centra en obtener los datos de las redes sociales para crear los perfiles de los usuarios. Se emplea un framework que integra aprendizaje supervisado (por medio de clasificación), aprendizaje no supervisado (clustering) y semántica. La siguiente figura ilustra la estructura general:
Las cinco fases en las que se divide son:
- User-generated Content Retrieval – Se encarga de buscar y recolectar información del usuario sobre asuntos relacionados al tema de aprendizaje. Es dependiente de la red social que se desee utilizar.
- Semantically Enriched Classification Model – Se emplea aprendizaje supervisado para clasificar qué información es relevante y cual es sólo ruido.
- Semantic Driven Individual User Profiling – Se construye un perfil social basado en los datos recolectados y se representa como un vector.
- Group Clustering Model – Se hace uso de aprendizaje no supervisado para crear grupos en base a la similitud de los vectores de los usuarios individuales.
- Group Profiling – Se crean los grupos de perfiles en base a los conceptos relevantes extraídos y la distribución estadística de los datos demográficos de los autores.
Utilizando el framework en un caso específico, se proporciona el ejemplo de Youtube siguiendo entrevistas de trabajo como tema.
- Selección de video – Se buscan videos sobre entrevistas de trabajo ya sea en base a un experto del dominio o a palabras clave.
- Recopilación de comentarios – Se toman todos los comentarios públicos en los videos seleccionados.
- Filtración de comentarios ruidosos – Los comentarios ruidosos son los que tienen pocos conceptos relacionados a entrevistas de trabajo, son totalmente irrelevantes para el tema o son spam o mensajes de ese tipo.
- Recopilación de perfiles de usuario de Youtube – Se buscan el perfil de cada autor de los comentarios y luego se obtienen sus datos demográficos para crear los grupos.
- Generación de perfiles basado en clustering y basado en datos demográficos – Se llevan a cabo ambos procedimientos para crear grupos en base a las dos opciones.
La representación de los comentarios se hace en base a palabras que son semánticamente relevantes, por lo tanto se elimina el resto como se muestra en la siguiente figura:
Las pruebas se hicieron sobre el mismo tema de entrevistas de trabajo, las características del conjunto de datos se muestran en la siguiente tabla:
Un ejemplo de los conjuntos generados de acuerdo al perfil se muestra en la siguiente figura:
Por otra parte, un ejemplo de las agrupaciones por datos demográficos se muestra a continuación:
En conclusión, el sistema permite obtener características de los grupos de una manera automática basado en los perfiles y comentarios que se hacen sobre redes sociales, todo enfocado a un solo tema. La apreciación e interpretación de cada uno de los conjuntos generados se debe hacer de manera manual.
Ammari, A., Lau, L., & Dimitrova, V. (2012). Deriving group profiles from social media to facilitate the design of simulated environments for learning. Proceedings of the 2nd International Conference on Learning Analytics and Knowledge - LAK ’12 (pp. 198–207). New York, New York, USA: ACM Press. doi:10.1145/2330601.2330650
No comments:
Post a Comment