En general Twitter mantiene dos APIs generales (REST y Streaming) para acceder a su información y uno específico para búsquedas (SEARCH). Mientras que en general ambos permiten llevar a cabo búsquedas, filtros, ver perfiles, etc., pero se trabaja de una manera distinta.
REST API de Twitter permite hacer consultas a la red social (parece ser que es mediante HTTP Requests) y se inicia y termina una conexión cada que se lleva a cabo una petición. Se tiene un límite (me parece que es por hora) del número de peticiones que pueden ser llevadas a cabo. El proceso en general lo muestra la siguiente figura:
El Streaming API de Twitter mantiene una conexión abierta con el servidor. Las consultas HTTP se hacen de manera independiente. La ventaja que ofrece es el tener acceso a información en tiempo real y poder llevar a cabo parseo, filtros y otros procesos antes almacenar los resultados. La arquitectura general se muestra en la siguiente figura:
Por último el Search API se enfoca directamente a las búsquedas sobre el índice en tiempo real de tuits recientes. Sin embargo se tienen las siguientes limitaciones:
- No se busca en todos los tuits sino en el índice de mensajes recientes que incluye mensajes de entre 6 y 9 días de antigüedad.
- No se puede utilizar el API para buscar mensajes de más de una semana de antigüedad.
- Si el query es muy complejo arrojará un error.
- No se soporta autenticación, todos los queries son anónimos.
- Esta búsqueda se basa en relevancia y no completitud. Esto significa que algunos tuits pueden faltar. Si se requiere completitud se recomienda usar el Streaming API.
- No se puede usar el operador near, se debe usar la geo-localización.
- Los queries están limitados a 1,000 caracteres (incluyendo a operadores).
- Al realizar consultas basadas en geo-localización, solo se consideran 1,000 subregiones distintas al evaluar el query.
- Se tiene un límite en cuanto a complejidad y frecuencia en las consultas que se hacen.
No comments:
Post a Comment