La información en gran cantidad y variada que se presenta en los medios sociales que se propaga a través de las comunidades presentes en la red, presentan una oportunidad de aprovechar tal cantidad de datos para conseguir predicciones sin tener que usar mecanismos de marketing tradicionales.
En el caso de este artículo, se ha decido mostrar la capacidad de llevar a cabo predicciones sobre las ventas en taquilla de películas empleando las charlas encontradas en Twitter. El entorno de prueba fue elegido debido a que el tema de las películas se considera de interés en las redes sociales, caracterizándose por tener una gran cantidad de usuarios discutiendo el tema con opiniones variadas. El segundo punto tomado en cuenta para la elección radica en que es fácil obtener el valor total de las ventas en taquilla una vez exhibida la película.
Para las pruebas, utilizando el API de Twitter, se extrajeron los mensajes conteniendo el timestamp, autor y su texto. En total se extrajeron 2.89 millones de mensajes (de 1.2 millones de usuarios) para 24 películas distintas que se estrenaron en un periodo de 3 meses.
Los tiempos tomados en cuenta para cada película inician desde una semana antes del estreno, en el punto en que las campañas de marketing se encuentran a tope promocionándola, hasta dos semanas después de su estreno cuando su popularidad se desvanece y las opiniones de las personas ya fueron esparcidas. En la siguiente figura se muestran las películas empleadas para el artículo:
La relación entre la cantidad de mensajes por hora sobre cierta película, aumenta claramente en el fin de semana en que se estrenó e inevitablemente se va reduciendo con el tiempo. En la siguiente figura se muestra esta relación:
Para medir la atención y popularidad en el lapso de tiempo indicado se buscó dividirlo en los siguientes puntos:
- Efecto del material promocional (URLs y Retweets): En la semana previa al estreno de una película, las campañas promocionales y la información generada en Twitter se caracteriza por ser referencias URL (fotos, cortos, etc.), mientras que los retweets, sirven como otro medio para difundir información sobre la película. Al momento de sacar la correlación del éxito en taquilla contra la cantidad de URLs y retweets, se concluyó que no tenían un gran impacto en las cifras como se muestra en la siguiente figura:
- Razón de menciones en tweets: Se observa que la cantidad de menciones en tweets cambia radicalmente dependiendo de la película que se habla. En promedio, la correlación dio una cifra positiva del 0.90 en las 24 películas. El número de menciones muestra la atención que los posibles espectadores brindan a cada película, por ejemplo Transylmania tuvo la menor cantidad de presencia en su semana crítica y también fue la que menor dinero recaudo a diferencia de otras como Avatar.
Los resultados arrojados fueron puestos a prueba contra el índice HSX (Hollywood Stock Exchange). El sitio www.hsx.com tiende a predecir de manera precisa el resultado final de la recaudación en taquillas. La siguiente figura contiene los resultados que como se puede apreciar son muy aproximados a lo predicho por el índice HSX:
Comparándolo contra otro trabajo que buscaba hacer las predicciones de las ventas en taquilla en base a lo proyectado en los medios, su precisión era mucho menor con una razón de 0.788.
Ya demostrado el impacto que puede tener las menciones en las redes sociales, se propusieron a analizar la influencia de los sentimientos que puede provocar una película en particular. Utilizando el paquete de análisis lingüístico LingPipe. Se emplearon trabajadores del Amazon Mechanical Turk para que manualmente clasificaran los mensajes de Twitter para entrenar el clasificador empleado. Al final, quedaron tres clasificaciones: positiva, negativa y neutral.
Se esperaba que los mensajes contaran con una mayor subjetividad (tendiesen a ser positivos o negativos) no en la semana critica sino en las posteriores al estreno. Se calculó la subjetividad como la razón de los mensajes negativos y positivos sobre los neutrales. Los valores comprobaron la hipótesis planteada y los resultados se encuentran plasmados en la siguiente figura:
Por otra parte se calculó lo que se denominó polaridad. Esta es la razón entre los mensajes positivos sobre los negativos. Mientras que el número de menciones positivas supera en todos los casos a las negativas, la variación en la razón de polaridad muestra la variación en ventas que va teniendo cada filme. Por ejemplo se plantea la película Blind Side con un índice inicial de 5.02 y que pasó a 9.65 después de su estreno y esto se vio reflejado en sus ventas contando con 34 millones en su estreno pero recaudando 40.1 en su siguiente semana. La figura que muestra esta razón se presenta a continuación:
En conclusión se pudo mostrar como la cantidad de datos (casi 3 millones) considerados fueron suficientes para lograr predecir las ventas en taquilla de las películas. Mientras que el número de menciones influye directamente en las ventas iniciales, la polaridad muestra el cambio que pueden tener cuando gente que ha visto los filmes opina sobre ellos y su influencia sobre sus seguidores.
Asur, S., & Huberman, B. a. (2010). Predicting the Future with Social Media. 2010 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology, 492–499. doi:10.1109/WI-IAT.2010.63
No comments:
Post a Comment