Artículo Data & AI

Museo Van Gogh: Aprovechando la IA con Modelos Lingüísticos

Los últimos avances en el procesamiento del lenguaje natural (PLN) y los pipelines de aprendizaje automático de programación sin código han abierto la puerta a muchas organizaciones para realizar una amplia gama de nuevas tareas relacionadas con el lenguaje e integrarlas en su actividad principal. Microsoft Azure Language Services, por ejemplo, ofrece soporte lingüístico completo en una gran variedad de idiomas, y puede integrarse con otros servicios Azure para crear potentes soluciones para tareas relacionadas con el lenguaje. La sencilla interfaz hace que sea fácil de utilizar incluso para las organizaciones con poca o ninguna experiencia en el PLN.

Análisis de la experiencia del visitante en el Museo Van Gogh

Nuestra colaboración con el Museo Van Gogh en Ámsterdam es un buen ejemplo de cómo utilizar y poner en práctica estas herramientas. El museo pone la vida y obra de Vincent Van Gogh y el arte de su época al alcance del gran público y se esfuerza por inspirar y enriquecer las vidas del mayor número posible de personas. Cada año, el museo recibe más de 1,6 millones de visitantes de todo el mundo, lo que lo convierte en uno de los 25 museos de arte más visitados del mundo.

El museo recoge sistemáticamente las opiniones de los visitantes para conocer en profundidad su experiencia y su apreciación, con el fin de mejorar ambas. Dado el público internacional del museo, las opiniones se introducen en varios idiomas. Cada mes se examinan y analizan unos 1.500 comentarios anónimos para extraer información útil sobre lo que se puede mejorar y potenciar en el museo. Para extraer esta información es necesario clasificar manualmente los comentarios en función del sentimiento y de más de 15 temas generales. Se trata de una tarea larga y tediosa.

Con nuestra ayuda, el museo puede ahora entrenar un modelo lingüístico de IA en Microsoft Azure Language Services, utilizando reseñas pasadas etiquetadas manualmente como datos de entrenamiento, para permitir la clasificación automática de los comentarios por diferentes temas y sentimientos. Tras el entrenamiento inicial, el modelo de sentimiento alcanzó un impresionante 89% de puntuación F1 (una medida de la exactitud basada en la precisión y la recuperación), y el modelo de tema alcanzó una media del 77% de puntuación F1 en unos 20 temas diferentes, lo que hace que la automatización de la futura clasificación de comentarios sea fiable y factible. Automatizar el costoso proceso manual con un alto grado de confianza en la validez de los resultados permite al museo liberar un tiempo valioso para extraer información de alto nivel sobre la experiencia de los visitantes. Si deseas obtener más información sobre la puntuación F1, consulte nuestro artículo sobre la diferencia entre exactitud, precisión y recuperación.

En nuestra colaboración con el museo, hemos comprobado que, a pesar de la interfaz fácil de usar de Microsoft Azure Language Services, se necesitaba experiencia en la preparación de datos para convertir las opiniones de los visitantes en un formato que pudiera utilizarse en la formación y la evaluación. El formato original de las opiniones etiquetadas y analizadas de los clientes era un archivo Excel de gran tamaño, elegido para facilitar el acceso y el uso compartido dentro del museo. Con nuestra ayuda, las opiniones individuales y sus etiquetas de sentimiento y tema se separaron y convirtieron en archivos de texto para introducirlos en Microsoft Azure Language Services.

Para garantizar que el entrenamiento del modelo y la futura automatización de la clasificación de las opiniones se realizaran sin problemas, ayudamos al museo a crear un canal en el que se preparasen los datos para entrenar el análisis de opiniones y los modelos de predicción de temas. Además, compartimos nuestra experiencia y debatimos con ellos su elección de despliegue e inferencia de modelos para automatizar la clasificación de comentarios de los visitantes a escala, lo que permitió al museo desplegar el modelo de IA entrenado e integrarlo en su proceso de conocimiento de los visitantes.

Eraneos Analytics reduciendo las lagunas del pipeline de Data

Nuestra experiencia con el Museo Van Gogh nos ha enseñado que los usuarios con conocimientos limitados de aprendizaje automático pueden utilizar una tecnología innovadora de procesamiento del lenguaje natural. Pero, aunque esta herramienta permite utilizar análisis de texto precisos, también requiere conocimientos de programación en Python, y experiencia en estructuras de datos y preprocesamiento, aprendizaje automático y procesamiento del lenguaje natural, así como en despliegue de modelos. Esto significa que los servicios lingüísticos de Microsoft Azure aún no se ofrecen de una forma fluida y totalmente sin código como cabría esperar.

Si estás interesado en obtener ayuda para aprovechar el potencial de Microsoft Azure Language Services, estaremos encantados de ayudarte en todos los pasos en los que esta útil herramienta aún no esté bien integrada dentro de un proceso general de ETL (extracción, transformación y carga) de datos, en tu solución de almacén y en los módulos posteriores de aprendizaje automático y análisis. También podemos impartir la experiencia y el asesoramiento necesario en el proceso de toma de decisiones en el paso de modelización. Concretamente en cómo traducir un problema empresarial en una solución eficaz de aprendizaje automático y cómo garantizar que el rendimiento del modelo mejore con cada iteración del entrenamiento del modelo.