Amazon crea una nueva plataforma de simulación centrada en el usuario para desarrollar agentes de IA incorporados

Crédito: Gao et al.

Amazon crea una nueva plataforma de simulación centrada en el usuario para desarrollar agentes de IA incorporados

Los robots impulsados ​​por IA generalmente se entrenan en entornos de simulación antes de probarlos e introducirlos en entornos del mundo real. Estos entornos permiten a los desarrolladores probar de manera segura sus técnicas de aprendizaje automático en una variedad de robots y en numerosos escenarios posibles, sin tener que comprar hardware, ensamblar robots y luego llevarlos a ubicaciones remotas o comprometer la seguridad real de los sistemas implementados.

Amazon Alexa AI creó recientemente una nueva plataforma de simulación específicamente para la investigación de IA incorporada, el campo especializado en el desarrollo de robots autónomos. Esta plataforma, denominada Alexa Arena, se presentó en un documento publicado previamente en arXiv y está disponible públicamente en GitHub .

«Nuestro objetivo principal era desarrollar un marco de IA incorporado interactivo para catalizar la creación de agentes de IA incorporados de próxima generación», dijo a Tech Xplore Govind Thattai, científico principal de la plataforma Arena. «Se han propuesto varias plataformas de simulación de IA incorporada en los últimos años (por ejemplo, AI2Thor, Habitat, iGibson). Estas plataformas admiten escenas simuladas, donde los agentes incorporados pueden navegar e interactuar con objetos, pero la mayoría de ellos no están diseñados para que los humanos interactúen. con agentes debido a la falta de centrarse en el usuario», dijo Qiaozi Gao, quien co-desarrolló el marco Arena.

Como la mayoría de las plataformas de simulación disponibles no están centradas en el usuario para recopilar datos para las interacciones entre humanos y robots, los desarrolladores a menudo necesitan realizar experimentos del mundo real, lo que suele ser costoso y requiere mucho tiempo. Alternativamente, algunos equipos optan por desarrollar el llamado «motor de inferencia», una herramienta computacional que permite a los humanos interactuar directamente con un entorno simulado, pero esto también requiere tiempo y esfuerzos de investigación adicionales.

Los agentes encarnados necesitan interactuar constantemente con sus entornos, al mismo tiempo que aprenden y se adaptan a otros agentes o humanos de una manera segura y efectiva. Mientras que las plataformas de simulación actuales se centran en la descomposición de tareas y la navegación, Arena intenta completar las piezas faltantes que inevitablemente entrarían en juego durante la implementación y la evaluación en tiempo real de los robots colaborativos.

Arena se amplía con funciones centradas en el usuario no solo para reforzar el desarrollo y la evaluación de los agentes de EAI, sino también para cerrar la brecha entre la fase de desarrollo y la de implementación. Esto se logra al convertir a los humanos en una parte indispensable del proceso de desarrollo y evaluación de EAI.

«Para abordar estos desafíos, creamos Alexa Arena», dijo Suhaila Shakiah, desarrolladora de componentes Arena ML. «Nuestra plataforma ofrece un marco con capacidades centradas en el usuario, como imágenes fluidas durante la navegación del robot, animaciones y sonidos de fondo continuos, puntos de vista en las habitaciones para simplificar la navegación entre habitaciones y sugerencias visuales integradas en la escena que ayudan a los usuarios humanos. para generar instrucciones adecuadas para la finalización de tareas. Estas características mejoran la usabilidad y la experiencia del usuario , lo que permite el desarrollo y la evaluación de la IA incorporada por humanos en el circuito».

En la plataforma Alexa Arena, los desarrolladores pueden desarrollar y probar diferentes agentes de IA incorporados con capacidades multimodales. Estos agentes pueden interactuar con los objetos o áreas relevantes en el entorno simulado en función de las solicitudes específicas de los usuarios, una capacidad conocida como puesta a tierra visual. También pueden aprender a seguir las instrucciones del usuario en lenguaje natural, que es un aspecto vital de la interacción entre humanos y robots.

«Alexa Arena supera los límites de la interacción humano-robot», explicó Xiaofeng Gao, un desarrollador de Arena. «Ofrece un marco interactivo centrado en el usuario, que permite crear tareas y misiones robóticas que implican navegar en entornos simulados de varias habitaciones y manipular objetos en tiempo real. En un entorno similar a un juego, los usuarios pueden interactuar con robots virtuales a través de diálogos en lenguaje natural, brindando comentarios invaluables y ayudando a los robots a aprender y completar sus tareas».

A diferencia de otras plataformas de simulación existentes, Alexa Arena tiene una interfaz muy simplificada tanto para desarrolladores como para usuarios finales. Los usuarios pueden crear tareas y misiones específicas para los robots en el entorno de simulación utilizando sugerencias integradas y características que amplían los límites de la interacción humano-computadora y la IA incorporada. Esto también ayuda a recopilar datos de interacción humano- robot de manera más fácil y eficiente, al mismo tiempo que entrena a los robots para que aborden de manera efectiva tareas interactivas utilizando una variedad de objetos y herramientas diferentes.

La plataforma centrada en el usuario pronto podría ser utilizada por desarrolladores e investigadores de todo el mundo para desarrollar agentes de IA incorporados de alto rendimiento y robots inteligentes. Mientras tanto, el equipo planea mejorar aún más Alexa Arena, agregando nuevas funciones y escenarios simulados.

«Ahora continuaremos mejorando la plataforma Arena para admitir mejores y más altos rendimientos de tiempo de ejecución, más escenas, una colección más rica de objetos y una gama más amplia de interacciones», agregó Govind. «También continuaremos invirtiendo en el campo general de la IA incorporada, mediante el desarrollo de robots inteligentes de próxima generación que puedan completar tareas del mundo real y participar en la comunicación natural con los humanos».

Más información: Qiaozi Gao et al, Alexa Arena: una plataforma interactiva centrada en el usuario para la IA incorporada, arXiv (2023). DOI: 10.48550/arxiv.2303.01586

Información de la revista: arXiv 

© 2023 Ciencia X Red

Autor del Post