Wednesday, August 15, 2012

Rumor Analysis Framework in Social Media

Mientras que el uso de redes sociales puede ser productivo y completamente útil en situaciones como los desastres naturales (en el artículo se utiliza el terremoto del 11 de marzo de 2011 en Japón como ejemplo), existe también el riesgo de provocar situaciones adversas si la información es falsa y solo contribuye al terror y la incertidumbre en el momento.

Ante este posible resultado, resulta deseable y necesario, contar con un mecanismo que permita medir de cierta manera la confiabilidad de la información circulando en las redes sociales.

Para iniciar se define a los rumores como lo siguiente:

  • El rumor se encuentra relacionado a problemas como la influenza, desastres naturales, etc.
  • La información del rumor se esparce de forma rápida.
  • No existen fuentes confiables (noticieros, periódicos, etc.) con información al respecto antes del surgimiento del rumor.
  • La información del rumor puede afectar el comportamiento de las personas (escapar a otro sitio, escases de recursos, etc.)

El mismo ejemplo del desastre ocurrido en Fukushima contó con varios de estos efectos al producirse escases de alimentos, movilizaciones por el pánico y otras situaciones causadas por rumores surgidos en las redes sociales.

El sistema general consiste de los siguientes pasos:

  • Crawling
    • Esta parte del sistema se encarga de conseguir los mensajes correspondientes a cierto tema (el terremoto del 11 de marzo de 2011 en este caso). Un ejemplo de los mensajes recolectados en este paso se muestra en la siguiente figura:
      image
       
       
  • Language Processing
    • Utilizando los mensajes obtenidos en el paso previo como entrada, aquí mediante un análisis morfológico se obtienen las palabras claves divididas en sustantivos, verbos, adjetivos y adverbios. Después se calcula el valor de cada palabra clave empleando RIDF (Residual IDF), LSA (Latent Semantic Analysis) y tf-idf (Team Frequency-Inverse Document Frecuency). Según sus resultados, RIDF parece ser el método adecuado. La siguiente figura muestra un ejemplo del resultado de este paso:
      image
       
  • Graph Transformation
    • Este paso construye un grafo dirigido que muestra la estructura de la información del rumor. El grafo muestra relaciones de relevancia de hiperónimos de las palabras claves de cada documento. Para crear un grafo de concepto, los documentos son extraídos de acuerdo a ciertas palabras claves y luego las palabras relacionadas son extraídas. Las relaciones de hiperónimos de las palabras relacionadas son obtenidas usando frecuencias de co-ocurrencia. Un ejemplo se muestra en la siguiente figura:
      image
       
  • Visualization
    • Es la visualización del grafo generado en el paso anterior. Se pueden llevar a cabo determinaciones como resultado de la información mostrada, en este caso que existe un gran grupo de personas discutiendo sobre gasolina, posiblemente la falta de gasolina. Otra sección muestra interés en Okinawa (zona al sur de Japón), un posible lugar para huir del desastre. Por último se da el ejemplo de los teléfonos móviles que resultan ser la herramienta más útil en un siniestro como el acontecido.
      image
    • image
  • Graph Edit Distance Calculation
    • Para detectar la información de rumor se utiliza la distancia basada en la topología del grafo para medir el cambio en la topología a través del tiempo. La distancia de edición es el costo de las operaciones de edición para transformar un grafo en otro.
      image
  • Rumor Information Detection
    • De acuerdo a la definición de rumor dada anteriormente, el proceso de extracción de información del rumor consiste en los siguientes pasos:
      • Detectar cambios mayores en la estructura del grafo de concepto. Cuando la estructura del grafo crece, se muestra la rápida diseminación de un tema. Dicho tema se convierte en candidato a ser un rumor.
      • Se busca en medios confiables la existencia de información de cada posible rumor. Se calcula la posibilidad de que la información sea parte de un rumor.
      • Para medir el impacto en el mercado, se examinan los datos como el volumen de cargamentos para los productos apropiados.

El sistema parte de un trabajo previo de los mismos autores basado en marketing y se puede observar la estructura general en la siguiente figura:

image

Queda como trabajo a futuro comprobar la capacidad del framework para detectar rumores en otras situaciones. También se propone el investigar un método que permita identificar subgrafos para extraer de manera automática los rumores.

Hashimoto, T., Kuboyama, T., & Shirota, Y. (2011). Rumor analysis framework in social media. TENCON 2011 - 2011 IEEE Region 10 Conference, 133–137. doi:10.1109/TENCON.2011.6129078

No comments:

Post a Comment