Home » Roboticistas do MIT debatem o futuro da robótica, dados e computação

Roboticistas do MIT debatem o futuro da robótica, dados e computação

by Daniel Carvalho

Linha superior (da esquerda para a direita): Nancy M. Amato, Seth Hutchinson e Ken Goldberg. Linha inferior (esquerda para a direita): Animesh Garg, Aude Billard, Russ Tedrake e Frank Park. | Fonte: Science Robotics

Desde a sua criação, a indústria de robótica trabalhou para criar máquinas que poderiam lidar com tarefas complexas, combinando modelos matemáticos com computação avançada. Agora, a comunidade se vê dividida em como melhor atingir esse objetivo.

Um grupo de roboticistas de todo o mundo investigou essa divisão na Conferência Internacional do IEEE sobre Robótica e Automação (ICRA) no início deste ano. O show fechou com um debate entre seis líderes roboticistas:

  • Daniela Rus, diretora da CSAIL e Andrew (1956) e Erna Viterbi Professor de Engenharia Elétrica e Ciência da Computação. Rus também digitou o Robotics Summit & Expo no início deste ano.
  • Russ Tedrake, professor da Toyota da CSAIL, EECS e o Departamento de Aeronáutica e Astronáutica.
  • Leslie Kaelbling, que é professora da Panasonic de Ciência e Engenharia da Computação no MIT.
  • Aude Billard, professor da Escola de Engenharia do Instituto Federal Suíço de Tecnologia em Lausanne (EPFL).
  • Frank Park, professor de engenharia mecânica da Universidade Nacional de Seul.
  • Animesh Garg, um professor assistente de Stephen Fleming em alta carreira na Escola de Computação Interativa da Georgia Tech.

Ken Goldberg, da UC Berkeley, moderou o debate, enquadrando a discussão com a pergunta: “O futuro da robótica será escrito em código ou em dados?”

O argumento para uma abordagem de dados primeiro

Daniela Rus na Robotics Summit & Expo.

Daniela Rus dando uma palestra na Robotics Summit & Expo.

Rus e Tedrake argumentaram que as abordagens orientadas a dados, particularmente aquelas alimentadas pelo aprendizado de máquina em larga escala, são fundamentais para desbloquear a capacidade dos robôs de funcionar de maneira confiável no mundo real.

“A física nos dá modelos limpos para ambientes controlados, mas no momento em que saímos, essas suposições entram em colapso”, disse Rus. “As tarefas do mundo real são imprevisíveis e centradas em humanos. Os robôs precisam de experiência para se adaptar, e isso vem de dados.”

Na CSAIL, o laboratório de robótica distribuído de Rus adotou esse pensamento. A equipe está construindo conjuntos de dados multimodais de seres humanos executando tarefas diárias, desde cozinhar e derramar até entregar objetos. Rus disse que essas gravações capturam as sutilezas da ação humana, desde trajetórias manuais e torques conjuntos para olhar e forçar as interações, fornecendo uma rica fonte de dados para o treinamento de sistemas de IA.

O objetivo não é apenas fazer com que os robôs repliquem ações, mas permitir que eles generalizem entre tarefas e se adaptem quando as condições mudarem.

Na cozinha da cozinha, a CSAIL, por exemplo, a equipe da RUS equipa os voluntários com sensores enquanto eles cortam vegetais, despejam líquidos e montam refeições. Os sensores registram não apenas movimentos articulares e musculares, mas também pistas sutis, como olhar ocular, pressão da ponta dos dedos e interações de objetos.

Os modelos de IA treinados nesses dados podem executar as mesmas tarefas em robôs com precisão e robustez, aprendendo a recuperar quando os ingredientes escorregam ou ferramentas desalinhando. Esses conjuntos de dados do mundo real permitem que os pesquisadores capturem cenários de “cauda longa”-ocorrências raras, mas críticas, que a programação baseada em modelos sozaria.

https://www.youtube.com/watch?v=W-L90BHFDFO

Dados em escala podem transformar a manipulação

Tedrake discutiu como os dados de dimensionamento transformam a manipulação do robô. Sua equipe treinou robôs para executar tarefas hábil, como cortar maçãs, observar resultados diversos e se recuperar de erros.

“Os robôs estão agora desenvolvendo o que parece ser bom senso para tarefas hábil”, disse ele. “É o mesmo efeito que vimos na linguagem e na visão: uma vez que você escala os dados, surge a robustez surpreendente”.

Em um exemplo, ele mostrou um robô bimanual equipado com garras simples que aprenderam a corar e fatiar maçãs. Cada Apple diferiu um pouco em tamanho, firmeza ou forma, mas o robô se adaptou automaticamente, ajustando movimentos de aderência e fatiamento com base na experiência anterior.

Tedrake explicou que, à medida que o conjunto de dados de demonstração se expandiu em várias tarefas, comportamentos de recuperação-uma vez programada manualmente-era de emergir naturalmente, um sinal de que os dados podem codificar o conhecimento de senso comum de alto nível sobre interações físicas.



Modelos matemáticos vêm com um entendimento teórico

Kaelbling, que também falou no evento, argumentou junto com Billard e Park pela importância contínua de modelos matemáticos, primeiros princípios e entendimento teórico.

“Os dados podem mostrar padrões nos EUA, mas os modelos nos dão entendimento”, disse Kaelbling. “Sem modelos, arrisquemos sistemas que funcionam, até que de repente não funcionam. As aplicações críticas de segurança exigem algo mais profundo do que o aprendizado de tentativa e erro”.

Billard disse que a robótica difere fundamentalmente da visão ou do idioma: os dados do mundo real são escassos, as simulações permanecem limitadas e as tarefas envolvem variabilidade infinita. Embora grandes conjuntos de dados tenham impulsionado o progresso na percepção e no entendimento da linguagem natural, ela alertou que escalar cegamente os dados sem uma estrutura subjacente corre o risco de criar sistemas quebradiços.

Park enfatizou a riqueza de vieses indutivos da física e da biologia-princípios de movimento, força, conformidade e controle hierárquico-que os métodos orientados por dados sozinhos não podem capturar completamente. Ele observou que modelos cuidadosamente projetados podem orientar a coleta e interpretação de dados, ajudando a garantir segurança, eficiência e robustez em tarefas complexas.

Encontrando meio termo

Enquanto isso, Garg articulou os benefícios de combinar aprendizado orientado a dados com modelos estruturados. Ele enfatizou que, embora grandes conjuntos de dados possam revelar padrões e comportamentos, os modelos são necessários para generalizar essas idéias e torná -los acionáveis.

“O melhor caminho a seguir pode ser uma abordagem híbrida”, disse ele, “onde aproveitamos a escala de dados, respeitando as restrições e insights que os modelos fornecem”.

Garg ilustrou isso com exemplos de tarefas colaborativas de manipulação, onde os robôs treinados puramente em dados brutos lutavam com casos de borda que um modelo informado pela física poderia antecipar.

O debate também atraiu paralelos históricos. A humanidade frequentemente adquiriu “know-how” antes de “saber por que”. Desde navios de vela e motores de combustão interna a aviões e computadores iniciais, os engenheiros confiaram em observação empírica muito antes de entender completamente os princípios científicos subjacentes.

Rus e Tedrake argumentaram que a robótica moderna está seguindo uma trajetória semelhante: os dados permitem que os robôs adquiram experiência prática em ambientes confusos e imprevisíveis, enquanto os modelos fornecem a estrutura necessária para interpretar e generalizar essa experiência. Essa combinação é essencial, disseram eles, para passar de experimentos ligados ao laboratório para robôs capazes de operar em residências, hospitais e outras configurações do mundo real.

A diversidade no pensamento é uma força na robótica

Durante o debate, os participantes do painel enfatizaram a diversidade do próprio campo de robótica. Embora o aprendizado profundo tenha transformado as tarefas de percepção e idioma, a robótica envolve muitos desafios. Isso inclui controle de alta dimensão, ambientes humanos variáveis, interação com objetos deformáveis ​​e restrições críticas à segurança.

Tedrake observou que a aplicação de grandes modelos pré-treinados da linguagem diretamente a robôs é insuficiente; O sucesso requer aprendizado multimodal e a integração de sensores que capturam forças, movimento e feedback tátil.

A RUS acrescentou que a construção de grandes conjuntos de dados em várias plataformas de robôs é crucial para a generalização. “Se queremos que os robôs funcionem em diferentes casas, hospitais ou fábricas, devemos capturar a variedade e a imprevisibilidade do mundo real”, disse ela.

“Resolver a robótica é uma agenda de longo prazo”, refletiu Tedrake. “Pode levar décadas. Mas o debate em si é saudável. Significa que estamos testando nossas suposições e aprimorando nossas ferramentas. A verdade é que provavelmente precisaremos de dados e modelos – mas que assumem a liderança e quando permanecem inquietos”.

https://www.youtube.com/watch?v=pfvctjompk8

Link original