Ensinar um robô novas habilidades usadas para exigir experiência em codificação. Mas uma nova geração de robôs poderia aprender com praticamente qualquer pessoa.
Os engenheiros estão projetando ajudantes robóticos que podem “aprender com a demonstração”. Essa estratégia de treinamento mais natural permite que uma pessoa lidere um robô por meio de uma tarefa, normalmente de uma das três maneiras: via controle remoto, como operar um joystick para manobrar remotamente um robô; movendo fisicamente o robô através dos movimentos; ou executando a tarefa enquanto o robô observa e imita.
Robôs de aprendizagem de fazer geralmente treinam apenas em uma dessas três abordagens de demonstração. Mas os engenheiros do Instituto de Tecnologia de Massachusetts (MIT) agora desenvolveram uma interface de treinamento de três em um que permite que um robô aprenda uma tarefa através de qualquer um dos três métodos de treinamento. A interface está na forma de uma ferramenta de mão equipada com sensores, que pode se conectar a muitos braços robóticos colaborativos comuns. Uma pessoa pode usar o anexo para ensinar um robô para realizar uma tarefa, controlando remotamente o robô, manipulando -o fisicamente ou demonstrando a tarefa – qualquer estilo que preferir ou melhor se adequar à tarefa em questão.
A equipe do MIT testou a nova ferramenta, que eles chamam de “interface de demonstração versátil”, em um braço robótico colaborativo padrão. Os voluntários com experiência em fabricação usaram a interface para executar duas tarefas manuais que geralmente são realizadas em pisos de fábrica.
Os pesquisadores dizem que a nova interface oferece maior flexibilidade de treinamento que pode expandir o tipo de usuários e “professores” que interagem com os robôs. Também pode permitir que os robôs aprendam um conjunto mais amplo de habilidades. Por exemplo, uma pessoa poderia treinar um robô remotamente para lidar com substâncias tóxicas, enquanto mais abaixo a linha de produção que outra pessoa poderia mover fisicamente o robô através dos movimentos de boxe um produto e, no final da linha, alguém poderia usar o anexo para desenhar um logotipo da empresa enquanto o robô vigia e aprende a fazer o mesmo.
“Estamos tentando criar colegas de equipe altamente inteligentes e qualificados que possam trabalhar efetivamente com os seres humanos para realizar trabalhos complexos”, disse Mike Hagenow, um pós -doutorado no MIT no Departamento de Aeronáutica e Astronáutica. “Acreditamos que as ferramentas de demonstração flexíveis podem ajudar muito além do piso de fabricação, em outros domínios, onde esperamos ver um aumento da adoção de robôs, como ambientes domésticos ou cuidados”.
Hagenow apresentará um papel detalhando a nova interfacena conferência IEEE Intelligent Robots and Systems (IROs) em outubro. Os co-autores do MIT do artigo são Dimosthenis Kontogiorgos, um pós-doutorado no MIT Ciência da Computação e Laboratório de Inteligência Artificial (CSAIL); Yanwei Wang PhD ’25, que recentemente obteve um doutorado em engenharia elétrica e ciência da computação; e Julie Shah, professora do MIT e chefe do Departamento de Aeronáutica e Astronáutica.
O dispositivo portátil desenvolvido pelo MIT que pode ser usado para ensinar novas habilidades a um robô. | Crédito: MIT
Treinamento juntos
O grupo de Shah no MIT designs robôs que podem trabalhar ao lado de humanos no local de trabalho, em hospitais e em casa. O foco principal de sua pesquisa é o desenvolvimento de sistemas que permitem que as pessoas ensinem robôs novas tarefas ou habilidades “no trabalho”, por assim dizer. Tais sistemas, por exemplo, ajudariam um trabalhador de piso de fábrica de forma rápida e naturalmente a ajustar as manobras de um robô para melhorar sua tarefa no momento, em vez de fazer uma pausa para reprogramar o software do robô do zero – uma habilidade que um trabalhador pode não ter necessariamente.
O novo trabalho da equipe baseia -se em uma estratégia emergente no aprendizado de robôs chamado “Aprendendo com a demonstração”, ou LFD, no qual os robôs são projetados para serem treinados de maneiras mais naturais e intuitivas. Ao examinar a literatura da LFD, Hagenow e Shah encontraram métodos de treinamento em LFD desenvolvidos até agora, geralmente se enquadram nas três categorias principais de teleoperação, treinamento cinestésico e ensino natural.
Um método de treinamento pode funcionar melhor do que os outros dois para uma pessoa ou tarefa em particular. Shah e Hagenow se perguntaram se eles poderiam projetar uma ferramenta que combina todos os três métodos para permitir que um robô aprenda mais tarefas de mais pessoas.
“Se pudéssemos reunir essas três maneiras diferentes pelas quais alguém pode querer interagir com um robô, isso pode trazer benefícios para tarefas diferentes e pessoas diferentes”, disse Hagenow.

O MIT desenvolveu uma interface portátil que permite ensinar novas habilidades a um robô, usando qualquer uma das três abordagens de treinamento: ensino natural (canto superior esquerdo), treinamento cinestésico (meio) e teleoperação. | Crédito: MIT
Tarefas em mãos
Com esse objetivo em mente, a equipe projetou uma nova interface de demonstração versátil (VDI). A interface é um acessório portátil que pode caber no braço de um braço robótico colaborativo típico. O anexo está equipado com uma câmera e marcadores que rastreiam a posição e os movimentos da ferramenta ao longo do tempo, juntamente com os sensores de força para medir a quantidade de pressão aplicada durante uma determinada tarefa.
Quando a interface é anexada a um robô, todo o robô pode ser controlado remotamente e a câmera da interface registra os movimentos do robô, que o robô pode usar como dados de treinamento para aprender a tarefa por conta própria. Da mesma forma, uma pessoa pode mover fisicamente o robô através de uma tarefa, com a interface anexada. O VDI também pode ser destacado e mantido fisicamente por uma pessoa para executar a tarefa desejada. A câmera registra os movimentos do VDI, que o robô também pode usar para imitar a tarefa quando o VBI for recolocado.
Para testar a usabilidade do apego, a equipe trouxe a interface, juntamente com um braço robótico colaborativo, para um centro de inovação local, onde os especialistas em fabricação aprendem e testam a tecnologia que pode melhorar os processos de piso de fábrica. Os pesquisadores criaram um experimento em que pediram aos voluntários no centro que usassem o robô e todos os três métodos de treinamento da interface para concluir duas tarefas comuns de fabricação: ajuste de imprensa e moldagem. No ajuste da imprensa, o usuário treinou o robô para pressionar e encaixar pinos em buracos, semelhante a muitas tarefas de fixação. Para moldagem, um voluntário treinou o robô para empurrar e rolar uma substância de borracha e massa uniformemente ao redor da superfície de uma haste central, semelhante a algumas tarefas de termomoldagem.
Para cada uma das duas tarefas, os voluntários foram solicitados a usar cada um dos três métodos de treinamento, primeiro teleoperando o robô usando um joystick, depois manipulando cineesticamente o robô e, finalmente, destacando o apego do robô e o uso para “naturalmente” executar a tarefa como o robô registrou o anexo e os movimentos do anexo.
Os pesquisadores descobriram que os voluntários geralmente preferiam o método natural ao longo da teleooperação e do treinamento cinestésico. Os usuários, todos especialistas em fabricação, ofereceram cenários nos quais cada método poderia ter vantagens sobre os outros. A teleooperação, por exemplo, pode ser preferível no treinamento de um robô para lidar com substâncias perigosas ou tóxicas. O treinamento cinestésico pode ajudar os trabalhadores a ajustar o posicionamento de um robô encarregado de mover pacotes pesados. E o ensino natural pode ser benéfico para demonstrar tarefas que envolvem manobras delicadas e precisas.
“Imaginamos usar nossa interface de demonstração em ambientes de fabricação flexíveis, onde um robô pode ajudar em uma série de tarefas que se beneficiam de tipos específicos de demonstrações”, disse Hagenow, que planeja refinar o design do anexo com base no feedback do usuário e usaremos o novo design para testar o aprendizado de robôs. “Vemos este estudo como demonstrando como uma maior flexibilidade nos robôs colaborativos pode ser alcançada através de interfaces que expandem as maneiras pelas quais os usuários finais interagem com os robôs durante o ensino”.
Nota do editor: Este artigo foi republicado de MIT News.