Avance en el desarrollo de inteligencia artificial

Imagen alusiva a la inteligencia artificial

Imagen alusiva a la inteligencia artificial

25 de Enero - Si bien los agentes de inteligencia artificial (IA) se han vuelto cada vez más hábiles para comunicarse con los humanos, todavía luchan con varios aspectos del lenguaje, incluida la semántica compleja. El término semántica se refiere al área de la lingüística que se relaciona con el significado asociado con palabras específicas o conexiones lógicas entre diferentes conceptos.

Hace unos años, los investigadores del Allen Institute for AI desarrollaron un juego llamado Iconary, que está diseñado para mejorar la capacidad de las técnicas de IA para comunicarse y establecer conexiones entre diferentes objetos. En un artículo reciente publicado previamente en arXiv y presentado en la conferencia ENMLP del año pasado, los investigadores introdujeron una versión más avanzada del juego y entrenaron algoritmos de aprendizaje automático para jugar entre ellos o con humanos.

"Nuestro artículo se basa en un proyecto en AI2 destinado a entrenar modelos para jugar Iconary, un juego basado en Pictionary que creamos, donde un jugador tiene que adivinar qué está dibujando otro jugador", Christopher Clark, uno de los investigadores que llevó a cabo el estudio, le dijo a TechXplore. "El proyecto comenzó hace un par de años, pero el documento se publicó recientemente y se presentó en una conferencia, y describe una versión más desafiante del juego utilizando métodos modernos de aprendizaje automático".

El objetivo general del trabajo reciente de Clark y sus colegas era crear un juego que pudiera usarse como banco de pruebas para los agentes de IA, de manera similar a cómo los investigadores usaron los juegos de go y ajedrez en el pasado. Sin embargo, en lugar de crear un juego en el que los jugadores compitan entre sí, los investigadores querían mejorar la capacidad de los agentes artificiales para cooperar con los humanos y comprender la comunicación visual (es decir, imágenes y dibujos).

Iconary se parece al renombrado juego Pictionary, en el que un jugador trata de transmitir un objeto o idea específica a través de dibujos, mientras que otros jugadores intentan adivinar de qué se trata. El juego creado por Clark y sus colegas funciona de manera muy similar, con un jugador, apodado el 'adivinador', necesita adivinar qué está dibujando otro jugador, 'el cajón'.

"Inicialmente, el dibujante ve una frase corta (como 'sosteniendo un libro de texto') y luego tiene que dibujar esa frase seleccionando íconos para una lista de íconos y luego organizándolos en un lienzo", dijo Clark. "Cuando terminan, al adivinador se le muestra el dibujo y trata de adivinar la frase inicial".

Al igual que en Pictionary, si un adivino que juega Iconary se da cuenta de lo que el dibujante estaba tratando de transmitir, su equipo gana. Sin embargo, si su suposición es incorrecta, puede elegir si seguir adivinando o darse por vencido. Si se da por vencido, el dibujante puede cambiar su dibujo, teniendo en cuenta las suposiciones del otro jugador, luego el ciclo se repite. Si después de 4 minutos el adivino no pudo adivinar el significado detrás del dibujo, el equipo pierde la ronda.

"Lo que hace que Iconary sea difícil es que muchos sustantivos y verbos no tendrán íconos que los representen directamente, por lo que los dibujantes tienen que encontrar formas de indicarlos indirectamente al adivinador", explicó Clark. "Por ejemplo, no hay un ícono de 'libro de texto', por lo que los dibujantes deben indicar esa palabra indirectamente, por ejemplo, combinando un libro y un ícono de autobús escolar. Esto hace que comprender los dibujos de Iconary sea muy diferente de comprender las imágenes fotográficas".

En lugar de representar literalmente una escena, los dibujos producidos mientras se juega a Iconary tienen significados implícitos y no son tan fáciles de interpretar para las IA. Se basan en estrategias semánticas como metáforas visuales (p. ej., un libro y un autobús escolar para transmitir 'libro de texto'), anotaciones (p. ej., una flecha y una puerta para transmitir 'manija de la puerta'), ejemplos canónicos de referencia (p. ej., mostrar una bombilla encendida y una apagada para transmitir 'apagar'), y otras estrategias de comunicación indirecta.

Si bien la comunicación visual y el procesamiento semántico complejo son habilidades innatas para los humanos, los agentes de IA suelen tener dificultades con ellos. Iconary es una plataforma valiosa para probar si las IA pueden aprender estas habilidades con el tiempo.

"Iconary también tiene algunos elementos de juego interesantes, ya que los buenos jugadores deben ajustar sus enfoques para adivinar/dibujar en función de cómo se comporta el otro jugador, por ejemplo, ajustando los dibujos para evitar los conceptos erróneos que tiene un adivinador o mirando qué clave cambios que está haciendo el cajón para averiguar en qué concentrarse", dijo Clark.

Como parte de su estudio reciente, los investigadores entrenaron algoritmos de IA en más de 55 000 rondas Iconary entre jugadores humanos. Posteriormente, cuando probaron el rendimiento de los algoritmos, obtuvieron resultados prometedores. No obstante, los jugadores humanos a menudo superaron a las IA, particularmente en su capacidad para transmitir objetos o ideas a través de dibujos.

"Un desafío particular para nuestra configuración es que probamos el modelo con frases que contenían palabras que el modelo no vio en los juegos humanos/humanos que usamos como datos de entrenamiento, lo que significa que los modelos no podrían jugar el juego simplemente reutilizando/ reconocer las estrategias de dibujo observadas durante el entrenamiento", dijo Clark. "En general, pudimos demostrar que podemos entrenar IA que eran razonablemente buenas para comprender los dibujos creados por humanos, aunque no tan buenos como los humanos expertos".

En el futuro, Iconary podría resultar un banco de pruebas útil para los algoritmos de IA, lo que permitiría a los investigadores evaluar su capacidad para conectar semánticamente textos y dibujos. Hasta ahora, Clark y sus colegas descubrieron que los agentes de IA son significativamente mejores para adivinar conceptos comunicados implícitamente que para transmitirlos a través de dibujos.

"Construir IA de cajón fue más difícil, pero vimos algunos casos en los que nuestro modelo pudo construir dibujos efectivos que eran novedosos, lo que significa que eran diferentes a los observados en los datos de entrenamiento", dijo Clark. "Esto demuestra que las IA podrían aplicar el conocimiento del mundo a la tarea de dibujar y comprender el dibujo a un nivel más profundo que simplemente memorizar las estrategias de dibujo que los humanos usaron en los datos de entrenamiento. Los resultados del cajón me parecieron más interesantes porque creo que dibujar requiere más creatividad y es un tarea más novedosa que adivinar".

Hoy en día, los humanos usan la comunicación visual en varios contextos diferentes, por ejemplo, para interpretar letreros de calles, instrucciones para construir muebles o emojis. Por lo tanto, Iconary también podría ser una herramienta valiosa para crear sistemas de inteligencia artificial que sean mejores para comprender estas formas visuales cotidianas de comunicación.

"Actualmente no estoy trabajando en trabajos de seguimiento, pero creo que entrenar modelos para que sean mejores dibujantes es un desafío muy interesante", dijo Clark. "Nuestros cajones de IA siguen siendo significativamente peores que los cajones humanos".



Esta nota ha sido leída aproximadamente 1946 veces.



Noticias Recientes:

Comparte en las redes sociales


Síguenos en Facebook y Twitter