Wednesday, July 4, 2012

Best route and traffic determination through tweets

Twitter se ha convertido en un sitio que permite obtener información en tiempo real de diversas fuentes y diversos temas. Debido a ello, en los recientes años se ha puesto énfasis en las aplicaciones que pueden tener como fuente de alimentación tanto a Twitter como al resto de las redes sociales.

En este caso se hace énfasis a la recolección de datos sobre el tráfico urbano en base a los mensajes publicados en Twitter. La arquitectura global se basa en un modelo multi-agente del tipo cliente-servidor. Los clientes se encargan de hacer la recolección de los mensajes y los envía al servidor que los parsea y mapea los datos.

Los roles de los agentes se definen como lo siguiente:

  • Parser – Identifica las palabras clave dentro de los mensajes y les da un significado.
  • Drawer – Dibuja las calles y rutas acorde a la información recibida del agente encargado del parseo.
  • Planner – Planea la mejor ruta enfocándose en el tiempo que se tardará en recorrerla.

A pesar de haber logrado que el parseo de los datos en las cuentas analizadas se haga de forma aceptable, surge otro problema en que en ocasiones los nombres de las calles se escriben de manera incompleta. Para disminuir los errores introducidos por este tipo de secuencias siguieron un algoritmo de local sequence alignment (empleado originalmente para secuencias de proteínas y genomas) y que permite determinar si dos cadenas de caracteres pueden hacer referencia al mismo objeto aun cuando no se encuentran escritas de la misma manera.

Debido al poco soporte para las necesidades de este artículo por parte del API de Google Maps, decidieron emplear Open Street Maps (OSM). La siguiente imagen muestra una ruta propuesta por el sistema y mostrada en OSM.

image

Se emplea un algoritmo J48 alimentado con los datos de tráfico por día, hora y días de pago obtenidos para predecir su comportamiento.

En los resultados, para rutas cortas entre calles se logra dar una precisión del 80% en los tweets pintados mientras que para calles más grandes la precisión se reduce hasta el 30%. Se acreditan los problemas de precisión tanto a los nombres de las calles como a la estructura de nodos manejada nativamente por OSM. Otro problema presenta por la estructura misma de la ciudad de México ya que existen calles que tienden a cambiar de nombre conforme se avanza sobre ellas agregando complejidad al mapeo.

Como trabajo a futuro queda propuesto trabajar en la parte léxica, el parser y el analizador semántico para mejorar el desempeño del sistema. También se menciona que los mapas del OSM necesitan más revisiones y correcciones ortográficas aunque es difícil predecir cuando se les brindará soporte por ser un proyecto de código abierto.

Hernández , M. T., Martínez , A. A., Villalobos, J., & Tapia, J. A. (n.d.). Best traffic and rout determination through tweets.

No comments:

Post a Comment