Thursday, September 13, 2012

Building Earthquake Semantic Network by Mining Human Activity from Twitter

El objetivo del artículo se basa en poder presentar a las personas que se encuentran o encontraron en un siniestro una serie de patrones de acciones para llevar a cabo. Para empezar se define a una actividad como los siguientes cinco atributos: actor, acción, objeto, tiempo y lugar. Estos atributos deben encontrarse en los mensajes aunque algunas oraciones contienen una estructura más compleja además de anomalías como errores gramaticales y palabras inexistentes.

Debido a que se enfocan a las transiciones y causas entre las actividades, se etiquetan como Siguiente (Next) y Debido A (BecauseOf) respectivamente. La siguiente figura es un ejemplo de los atributos y relaciones entre actividades derivados de una oración de actividad.

image

Para extraer las actividades humanas de cada oración, se crea automáticamente su propio conjunto de aprendizaje (self-supervised learning) y utiliza CRF (linear-chain control random field) como modelo de aprendizaje.

La arquitectura general del sistema se compone de un Self-Supervised Learner (SEL) y un Extractor de Actividades. Primero, SEL utiliza 8 patrones básicos de sintaxis de japonés para seleccionar las oraciones analizables. Posteriormente se emplea un parser lingüístico profundo para extraer los atributos de la actividad y sus relaciones. Usando la acción y objeto extraídos como palabras clave, se utiliza el API de Google Blogs para recolectar nuevas oraciones de actividades que contengan atributos confiables. Después, SEL combina los resultados extraídos para crear su conjunto de entrenamiento de manera automática. Por último, utiliza CRF y un archivo de plantilla para crear un modelo de dichos datos de entrenamiento. El Extractor no despliega el parser lingüístico sino que se basa en el modelo obtenido para predecir atributos en cada oración obtenida de Twitter. La siguiente figura muestra el esquema general:

image

La red semántica del terremoto (ESN) se define como una inteligencia colectiva de actividades humanas que ocurren durante un terremoto. Se expresa mediante un grafo dirigido cuyos nodos son conceptos de atributos de actividades y los arcos son las relaciones entre los conceptos. La siguiente figura muestra un ejemplo:

image

Como en su trabajo anterior, decidieron utilizar N3 para la definición de la red semántica quedando de la siguiente manera:

image

image

El proceso de la creación de la red semántica inicia con la búsqueda en Twitter de las palabras clave (en este caso el hashtag #jishin) para obtener las oraciones de actividad. Posteriormente se extraen los atributos y se convierte a RDF/N3. El proceso se ilustra a continuación:

image

La elección de CRF se basó en la existencia de aprendizaje generativo representado comúnmente por modelo oculto de Markov (HMM) y el aprendizaje discriminativo donde se encuentra CRF, el modelo de máxima entropía de Markov (MEMM) y máquinas de soporte vectorial (SVM). Dado que en trabajos previos encontraron que CRF rebasa el desempeño de HMM y MEMM en la tarea de etiquetado secuencial (sequencial labeling task) decidieron comparar CRF con SVM. La siguiente figura muestra los resultados en los que se basaron para emplear CRF:

image

Las computadoras pueden recomendar un curso de acción a tomar basadas en patrones de otros encontrados dentro de la ESN. Por ejemplo si en una determinada hora, la mayoría de personas siguieron el conjunto { accion1, accion2 } para llegar al centro de evacuación A desde cierto punto. La computadora puede recomendar realizar dichas acciones para llegar al centro de evacuación para un usuario cercano al área inicial. El ejemplo se ilustra en la siguiente figura:

image

A diferencia de otros artículos mencionados, no se depende enteramente de una ontología previamente definida por lo que se puede aplicar a diversos siniestros y situaciones.

Nguyen, T.-M., Koshikawa, K., Kawamura, T., Tahara, Y., & Ohsuga, A. (2011). Building earthquake semantic network by mining human activity from Twitter. 2011 IEEE International Conference on Granular Computing, 496–501. doi:10.1109/GRC.2011.6122647

No comments:

Post a Comment