Gemini Robotics ayuda a superar la brecha escurridiza entre software y hardware
Las compañías mejoran el hardware robótico, pero desarrollar software de IA que realmente dé vida a estas máquinas ha sido un objetivo escurridizo. Ahora, el laboratorio de investigación de IA de Google se acerca más que nunca a cerrar esta brecha.
El Gran Panorama
Mientras las compañías continúan mejorando el hardware robótico, desarrollar software de IA que realmente dé vida a estas máquinas ha sido un objetivo elusivo. Esto es especialmente decepcionante dada la asombrosa mejora de los modelos de lenguaje 'inteligentes'. Ahora, el laboratorio de investigación de IA de Google se ha acercado más que nunca a cerrar esta brecha.
Presentación de Gemini Robotics
DeepMind ha presentado Gemini Robotics, una evolución de su poderoso modelo de lenguaje Gemini 2.0 que podría desbloquear nuevas capacidades para robots.
Capacidades y Objetivos de Gemini Robotics
El objetivo de Gemini Robotics es crear un sistema de IA generalizado capaz de controlar directamente robots y ayudarles a dominar la flexibilidad, la interacción y la destreza. Así, los robots podrían adaptarse a situaciones nuevas, responder naturalmente a los humanos y su entorno, y realizar tareas físicas complejas.
Progreso de Gemini Robotics
Y están haciendo un progreso constante. Mira este video de ALOHA 2, un robot de dos brazos de DeepMind, demostrando sus habilidades. No solo puede doblar una figura de origami de manera precisa, sino que también puede improvisar cuando las cosas no salen como se esperaba, como cuando el investigador movió el contenedor en el que se suponía que debía colocar frutas.
Instrucciones Simples y Versatilidad
Lo mejor es que lo logra con instrucciones simples como 'dobla un zorro de origami'. Los investigadores no tuvieron que programar esa habilidad manualmente: el robot simplemente aprovechó su comprensión del origami y cómo doblar papel para completar la tarea.
¿Qué Significa Esto para el Futuro?
DeepMind afirma que Gemini Robotics representa un avance significativo en las tres habilidades clave robóticas en comparación con sus trabajos anteriores. El modelo de IA más que duplicó su rendimiento en puntos de referencia de tareas generales en comparación con otros sistemas de última generación.
Colaboración con Apptronik
Para realizar este potencial, Google también está colaborando con una empresa llamada Apptronik. Apptronik se encargará del hardware construyendo robots humanoides de próxima generación impulsados por Gemini.
Seguridad y Evaluación
Los robots del mundo real impulsados por IA avanzada plantean importantes preocupaciones de seguridad. DeepMind dice que adopta un enfoque 'holístico' inspirado en las leyes de la robótica de Asimov y está desarrollando estándares de evaluación a través de un nuevo conjunto de datos 'ASIMOV'. El objetivo es probar si los modelos de IA comprenden las consecuencias más amplias de las acciones robóticas, más allá del daño físico.Gemini Robotics de Google representa un avance en la integración de software de IA avanzada con hardware robótico. Esta tecnología permitirá a los robots adaptarse mejor a situaciones del mundo real y realizar tareas complejas sin necesidad de entrenamiento específico para cada escenario. A pesar de las preocupaciones de seguridad, la colaboración con empresas líderes promete un futuro emocionante para la robótica.