Home » A Universidade de Cornell ensina robôs novas tarefas a partir de vídeos em apenas 30 minutos

A Universidade de Cornell ensina robôs novas tarefas a partir de vídeos em apenas 30 minutos

by Daniel Carvalho

Um robô equipado com rima pegando uma caneca de um balcão. | Fonte: Cornell University

Os pesquisadores da Universidade de Cornell desenvolveram uma nova estrutura robótica alimentada pela inteligência artificial. A rima-recuperação para imitação híbrida sob execução incompatível-permite que os robôs aprendam tarefas assistindo a um único vídeo de instruções.

Os robôs podem ser aprendizes mecânicos, disse a equipe da Columbia. Historicamente, eles exigiam instruções precisas e passo a passo para concluir tarefas básicas. Eles também tendem a desistir quando as coisas saem do escrito, como depois de soltar uma ferramenta ou perder um parafuso. No entanto, a rima pode acelerar o desenvolvimento e a implantação de sistemas robóticos, reduzindo significativamente o tempo, a energia e o dinheiro necessários para treiná-los, afirmaram os pesquisadores.

“Uma das coisas irritantes de trabalhar com robôs é coletar tantos dados sobre o robô fazendo tarefas diferentes”, disse Kushal Kedia, estudante de doutorado no campo da ciência da computação. “Não é assim que os seres humanos realizam tarefas. Nós consideramos outras pessoas como inspiração.”

Kedia apresentará o artigo, “Imitação de um tiro sob execução incompatível”No próximo mês, no Instituto de Engenheiros Elétricos e Eletrônicos (IEEE) Conferência Internacional sobre Robótica e Automação (ICRA) em Atlanta.

Pavimentando o caminho para robôs domésticos

A equipe da Universidade disse que os assistentes de robôs domésticos ainda estão muito longe, porque não têm o juízo para navegar no mundo físico e suas inúmeras contingências.

Para acelerar os robôs, pesquisadores como a Kedia os estão treinando com vídeos de instruções-demonstrações humanas de várias tarefas em um ambiente de laboratório. Os pesquisadores de Cornell disseram que esperam que essa abordagem, um ramo do aprendizado de máquina chamado “Aprendizagem de imitação”, permitirá que os robôs aprendam uma sequência de tarefas mais rapidamente e possam se adaptar aos ambientes do mundo real.

“Nosso trabalho é como traduzir francês para inglês – estamos traduzindo qualquer tarefa de humano para robô”, disse o autor sênior Sanjiban ChoudhuryProfessor Assistente de Ciência da Computação.

Essa tarefa de tradução ainda enfrenta um desafio mais amplo: os seres humanos se movem com muita fluidez para um robô rastrear e imitar, e os robôs de treinamento exigem muito vídeo. Além disso, demonstrações em vídeo de, digamos, pegar um guardanapo ou empilhar pratos de jantar devem ser executados lenta e sem falhas. Qualquer incompatibilidade em ações entre o vídeo e o robô historicamente soletra a destruição do aprendizado de robôs, disseram os pesquisadores.

“Se um humano se move de uma maneira diferente de como um robô se move, o método imediatamente se desfaz”, disse Choudhury. “Nosso pensamento era: ‘Podemos encontrar uma maneira de lidar com essa incompatibilidade entre como os humanos e os robôs realizam tarefas?'”

Cornell Rhyme ajuda os robôs a aprender tarefas de várias etapas

A rima é a resposta da equipe – uma abordagem escalável que torna os robôs menos mecânicos e mais adaptáveis. Ele permite que um sistema robótico use sua própria memória e conecte os pontos ao executar tarefas que ele visualizou apenas uma vez, desenhando vídeos que viu.

Por exemplo, um robô equipado com rima mostrou um vídeo de um humano buscar uma caneca do balcão e colocá-lo em uma pia próxima penteará seu banco de vídeos e se inspirará em ações semelhantes, como agarrar um copo e diminuir um utensílio.

A equipe disse que a Rhyme abre o caminho para os robôs aprenderem sequências de várias etapas, reduzindo significativamente a quantidade de dados de robôs necessários para o treinamento. A rima requer apenas 30 minutos de dados do robô; Em um ambiente de laboratório, os robôs treinados usando o sistema alcançaram um aumento de mais de 50% no sucesso da tarefa em comparação com os métodos anteriores, disseram os pesquisadores de Cornell.

“Este trabalho é um afastamento de como os robôs estão programados hoje. O status quo dos robôs de programação é milhares de horas de teleooperação para ensinar o robô a fazer tarefas. Isso é impossível”, Choudhury declarado. “Com a rima, estamos nos afastando disso e aprendendo a treinar robôs de uma maneira mais escalável”.


Anúncio do site para o registro de 2025 Robotics Summit.
Registre -se agora para não perder!


Link original