El estudio trata de mostrar el impacto de los patrones públicos de estado de ánimo afectan en lo macroscópico los indicadores económicos y sociales entre el 1 de agosto y el 20 de diciembre de 2008. Se emplea un corpus de 9,664,952 mensajes. Estos datos son complementados con una línea de tiempo de los sucesos políticos, culturales, sociales, económicos y naturales ocurridos en el mismo periodo de tiempo. La distribución de la información se muestra a continuación:
Por medio de una herramienta psicométrico (Profile of Mood States POMS), se mapea el estado de ánimo de los usuarios dentro de 6 categorías que son: Tensión, Depresión, Enojo, Vigor, Fatiga y Confusión. La herramienta original consta de 65 adjetivos medidos a través de un cuestionario pero fue modificada para incluir 793 términos para que hubiera una mayor posibilidad de encajar con lo encontrado en los mensajes.
Se lleva a cabo una normalización previa a la clasificación del estado de ánimo de los mensajes por medio de los siguientes pasos:
- Separación de los términos individuales según sus fronteras definidas por espacios en blanco.
- Borrado de todos los símbolos no alfanuméricos (comas, puntos, guiones, etc.)
- Conversión de todos los términos a minúsculas.
- Eliminación de 214 palabras comunes.
- Lematización de los términos restantes.
Se llevan a cabo unas series de tiempo para analizar el progreso de los estados conforme transcurren los días. Se observó que la variación (o desviación) era inversamente proporcional al número de mensajes que se captaban por día como se muestra en la siguiente figura:
Dentro de los eventos observados (elección presidencial de Estados Unidos, colapso de bancos a nivel internacional, precio elevado del petróleo, inicio de la recesión económica), se pudieron mapear a una emoción en concreto aunque hubo situaciones en las que se traslapaban las situaciones, afectando los resultados.
Hacen varias interpretaciones de las cadenas de emociones y de cómo es que se van acumulando. Queda como hipótesis el decir que Twitter afecta los estados de ánimo haciendo que las corrientes se desplieguen entre las redes de conocidos.
El estudio tiene también un enfoque de ser una alternativa al uso de aprendizaje automático para llevar a cabo análisis de sentimientos o minería de opiniones. Se usa a Twitter como una fuente de información sin tomar en cuenta aspectos específicos de la red social. Falta una comparativa general frente a otro tipo de técnicas (incluidos los análisis mediante aprendizaje automático).
Bollen, J., Pepe, A., & Mao, H. (2011). Modeling public mood and emotion: Twitter sentiment and socio-economic phenomena. Proceedings of the Fifth International AAAI Conference on Weblogs and Social Media, 450–453. Retrieved from http://www.aaai.org/ocs/index.php/ICWSM/ICWSM11/paper/viewFile/2826/3237
No comments:
Post a Comment