Thursday, August 30, 2012

Earthquake Shakes Twitter Users: Real-time Event Detection by Social Sensors

Se habla de las características de Twitter como un sitio microblogging, el uso que se le da para reportar eventos como tormentas, incendios, congestionamiento de tráfico, revueltas, etc. A diferencia de los blogs personales que son actualizados pocas veces por semana, los usuarios de Twitter tienden a hacer posts varias veces al día.

Se dice que debido a su naturaleza, encontrar información en tiempo real de un desastre o evento como un terremoto sucederá primero en esta red social que en medios tradicionales y antes que el reporte de las autoridades.

El uso de palabras clave para detectar eventos es importante, sin embargo se debe tomar en cuenta el contexto de las oraciones para no malinterpretarlo ya que las mismas palabras se pueden encontrar en mensajes que quieran transmitir mensajes completamente distintos.

Los eventos los definen con las siguientes características:

  • Son a gran escala (una gran cantidad de usuarios experimentan el evento).
  • Influyen de manera particular en la vida diaria de los usuarios (debido a ello, se ven impulsados a mandar tweets relacionados al evento).
  • Están definidos por una región tanto temporal como espacial (así la estimación del lugar en tiempo real puede ser llevada a cabo).

Por estas características, los eventos no se encuentran reducidos a un tipo y pueden incluir eventos sociales, deportivos, políticos, accidentes, desastres naturales, etc.

Para clasificar los tweets en cuanto a su contenido, se hace uso de Support Vector Machines (SVM) definiendo 3 características:

  • El número de palabras en un tweet y la posición de la palabra clave en el mensaje.
  • Las palabras en un tweet.
  • Las palabras encontradas antes y después de la palabra clave.

Se considera a cada usuario como un posible sensor y a sus mensajes como lecturas del sensor. Por ejemplo, si se esta buscando información correspondiente a un terremoto, si un usuario difunde un mensaje refiriéndose al tema, ese usuario como sensor de terremoto devuelve un valor positivo. Se clasifican a los usuarios como sensores de eventos en específico porque pueden existir eventos en los que no participen o no puedan hacerlo por lo que no debe considerárseles en dichos casos. Se asume lo siguiente:

  • Se considera a cada usuario de Twitter como un sensor. Un sensor detecta un evento y lleva a cabo un reporte probabilístico.
  • Cada tweet se encuentra asociado a un tiempo y lugar.

Los mensajes difundidos sobre un evento se incrementan de manera considerable durante la duración del mismo y hasta un tiempo después de ocurrido debido a que en ocasiones las personas que están viviendo el evento no pueden comunicarlo de manera inmediata. Un ejemplo se puede apreciar en la siguiente figura:

image

La clasificación se probó con las palabras “earthquake” y “shaking” dando como resultado que usando su primer criterio o todos juntos dieron el mejor desempeño. La siguiente figura muestra los resultados:

image

Se hizo un mapeo de la red de difusión de los mensajes respecto a los eventos. Este mapeo permite seguir de cierta forma la manera en que la información se difunde por la red. Un ejemplo de la prueba que hicieron con un evento de terremoto se presenta en la siguiente figura:

image

Otra característica que probaron fue la estimación del lugar en que sucedieron los eventos. Por ejemplo en el terremoto utilizaron los datos de espacio de cada mensaje. El ejemplo del terremoto se ilustra en la siguiente figura:

image

Queda mostrada como una herramienta interesante y planteado como trabajo a futuro el utilizarlo en otro tipo de eventos y ver su efectividad. Se usó Kalman filtering y particle filtering para llevar a cabo las estimaciones de las posiciones de la trayectoria del tifón y para el epicentro del terremoto. También queda planteada la necesidad de mejorar los queries con los que obtienen la información relevante de los tweets.

Sakaki, T., Okazaki, M., & Matsuo, Y. (2010). Earthquake shakes Twitter users. Proceedings of the 19th international conference on World wide web - WWW  ’10 (p. 851). New York, New York, USA: ACM Press. doi:10.1145/1772690.1772777

No comments:

Post a Comment