Blog

Introducción al "sentiment analysis"

08/07/2014

Aunque el título pueda parecer relacionado con la psicología, en realidad, desde el enfoque del análisis de datos, no se trata más que de una clasificación de palabras o frases. El análisis de sentimientos o sentiment analysis consiste en el estudio de las opiniones, sentimientos o emociones expresadas mediante texto. En los últimos años se ha puesto mucho énfasis en el estudio de las opiniones de clientes/usuarios especialmente en redes sociales. Por ejemplo, los comentarios vertidos en Facebook, Twitter, Linkedin, Instagram,… pueden ser muy representativos a la hora de observar la popularidad de una empresa , un producto, un evento deportivo o incluso de un político.

Tras la extracción de la información, por ejemplo de Twitter, si el conjunto de datos es pequeño se podría hacer un análisis de este tipo en local. Pero, dado que el volumen de datos que se maneja actualmente es excesivamente grande, la mejor opción es utilizar herramientas de Big Data específicamente diseñadas para esta tarea. Un ejemplo es el uso de Apache Hadoop junto con Hive, y combinado finalmente con un software de análisis de datos. Aquí se puede observar un ejemplo sobre la popularidad de la película Iron Man. En casos más complicados, en los que se necesitan más clases, en lugar de hacer un simple recuento de las palabras (positivas y negativas) se pueden utilizar métodos más complejos como Naive Bayes o Support Vector Machine.

El resultado final de este tipo de análisis será la distribución de frecuencias de la opinión generalizada del público/clientes y se pude reflejar mediante una clasificación (positivo, negativo, contento, triste, …) en función del tiempo, del país, del sexo, etc. Se suelen utilizar también representaciones gráficas que resultan más intuitivas que los resultados numéricos. Algunas de las más comunes son redes o mapas de palabras, que representan los términos más frecuentes y relacionados con el de interés; gráficos de barras, mostrando la frecuencia o porcentajes; y mapas de datos, en los que se observa la opinión sobre cada una de las localizaciones especificadas.

El gran problema del análisis de las emociones mediante texto es que no se pueden captar muchos matices como la ironía, doble sentido o el sarcasmo. Veremos cómo soluciona estos inconvenientes el machine learning en los próximos años.

En otro post: aplicación del análisis de sentimientos con el software R  😉

También te puede gustar…

Caso de éxito: Binfluencer

Caso de éxito: Binfluencer

Binfluencer es otra de las empresas que ha confiado en ASPgems. En este caso de éxito te contamos nuestra colaboración con ellos.

ASPgems icon
C/ Sextante, 9
28023 Madrid,
España

Hablemos.

A %d blogueros les gusta esto: