23 diciembre 2013

Un robot que aprende de su contacto con humanos


Los robots industriales convencionales de hoy en día, como los de las cadenas de montaje de automóviles, no integran nada similar a ser llamado cerebro; sólo tienen memoria. Un operador programa el robot para que realice los pasos necesarios para la acción deseada; entonces, el robot puede repetir exactamente los mismos pasos cada vez que se le presenta el mismo trabajo.

Pero fuera de la cadena de montaje, las cosas se complican: Un robot personal que trabaje en un hogar tiene que manejar los huevos con mayor suavidad que las latas de conservas. Si tiene que coger y usar un cuchillo de cocina afilado, debe ser lo bastante inteligente como para mantener la hoja alejada de las personas de su entorno.

El equipo de Ashutosh Saxena y Ashesh Jain, de la Universidad Cornell en Ithaca, Nueva York, Estados Unidos, decidió enseñar a un robot humanoide y lo bastante inteligente a trabajar de cajero en un supermercado. Los experimentos no se hicieron en un supermercado abierto al público, sino en una sala habilitada como supermercado pero con acceso restringido.

El robot escogido fue uno del modelo Baxter, creado por la empresa Rethink Robotics de Boston. Este modelo está diseñado para trabajar en una cadena de montaje de una fábrica, pero los robotistas de la Universidad Cornell lo modificaron para adecuarlo mejor a su nuevo oficio.

Al robot se le puede enseñar a hacer cosas de la manera que es tradicional en la robótica: Programándolo mediante software a fin de que mueva sus brazos del modo deseado para que haga un determinado trabajo manual.

Pero también es posible enseñarle a hacer cosas de una manera comparable a cómo un humano podría enseñarle a otro. El robot dispone de una modalidad de aprendizaje en la que un humano puede por ejemplo tomar su mano robótica y guiarla en el movimiento adecuado, cuando el robot ha comenzado a hacer algo y lo está haciendo mal. Esto permite a cualquier humano, sin necesidad de ser robotista ni de tener un conocimiento profundo sobre el robot, enseñarle de manera muy directa cómo debe y cómo no debe hacer algo. El robot por su parte memoriza la corrección y la aplica. Por ejemplo, si el robot coge un cuchillo blandiéndolo con la hoja hacia su entorno y moviéndolo deprisa podría herir accidentalmente a alguien que estuviera cerca. En su trabajo como cajero, eso podría ocurrir si un cliente compra un cuchillo de cocina y el robot lo coge para contabilizar su precio y luego al ir a dejarlo al otro lado lo acerca peligrosamente al cliente. Si alguien le enseña al robot que un cuchillo o cualquier objeto con forma parecida debe ser movido despacio, alejado lo más posible de las personas de su entorno y con la hoja vuelta hacia él en vez de hacia los humanos, el robot lo hará así a partir de entonces.

La opción que permite corregir al robot y hacer que aprenda se basa en lo que los investigadores llaman modo de “gravedad cero”, en el que el robot mantiene sus brazos en posición pero sin ofrecer resistencia cuando el operador los mueve. A medida que el robot ejecuta sus movimientos, el operador puede intervenir, guiando los brazos para corregir la trayectoria. La primera corrección puede que no sea la mejor, pero sí un poco mejor. El algoritmo de aprendizaje con que los investigadores dotaron al robot le permite aprender de forma incremental, perfeccionando su trayectoria un poco más cada vez que el humano le corrige. Incluso con correcciones incompletas pero en su conjunto cada vez más cerca del ideal buscado, el robot logra finalmente realizar un movimiento óptimo en la situación de interés.

Con esa y otras estrategias parecidas, estos robotistas están ayudando a los robots (y también a los humanos que deban trabajar con robots) a colaborar juntos del mejor modo posible, en una estrategia llamada “aprendizaje coactivo”.

El robot aprende a asociar una trayectoria particular con cada tipo de objeto. Un movimiento rápido aunque sea algo rudo puede ser perfecto para mover una caja de cereales y aprovechar así mejor el tiempo, pero no lo sería para una docena de huevos. Como los huevos son frágiles, al robot se le enseña que debe cogerlos y moverlos con suavidad y despacio. Asimismo, el robot aprende que los objetos afilados como el cuchillo no se deben mover cerca de personas ni de forma abrupta; debe moverlos despacio, mantenerlos cerca de él mientras los mueve, y en el caso del cuchillo tener la hoja vuelta hacia él en vez de hacia las personas.

En las pruebas con usuarios que no formaban parte del equipo de investigación, la mayoría de ellos entrenaron con éxito al robot en una tarea particular con sólo cinco correcciones de realimentación. Los robots fueron capaces de generalizar lo que habían aprendido de los humanos.

No hay comentarios:

Publicar un comentario