- Pesquisadores do MIT CSail (Massachusetts Institute of Technology Computer Science and Artificial Intelligence Laboratory) e do Toyota Research Institute desenvolveram o método “steerable scene generation”, que usa busca em árvore de Monte Carlo para criar ambientes virtuais realistas para treinar robôs, em cozinhas e salas de estar.
- O sistema gera cenas físicas e complexas, coleta dados úteis para o treinamento e evita erros comuns de gráficos 3D, como objetos que se sobrepõem, garantindo, por exemplo, que um garfo não atravesse uma tigela.
- Foi treinado com mais de 44 milhões de ambientes 3D e permite criar interações que simulam o cotidiano, aumentando a diversidade de cenários para os robôs.
- A abordagem permite personalização por meio de comandos diretos, com precisão de 98% na geração de prateleiras de despensa e 86% em mesas de café da manhã, e usa aprendizado por reforço para desenvolver cenários mais variados.
- Os autores apontam que o estudo é uma prova de conceito; o próximo passo é criar objetos e cenas totalmente novos, incluir objetos articulados e construir uma comunidade de usuários para ampliar o conjunto de dados.
Pesquisadores do MIT CSAIL e do Toyota Research Institute desenvolveram um novo método chamado “steerable scene generation”, que utiliza a busca em árvore de Monte Carlo para criar ambientes virtuais realistas. Essa técnica visa treinar robôs em cenários variados, como cozinhas e salas de estar, permitindo que os robôs interajam com objetos de forma mais fiel à realidade.
O novo sistema é capaz de gerar cenas físicas e complexas, coletando dados úteis para o treinamento de robôs. O método é treinado com mais de 44 milhões de ambientes 3D e permite a criação de interações que imitam o cotidiano. Ele evita erros comuns em gráficos 3D, como a sobreposição de objetos, garantindo que, por exemplo, um garfo não atravesse uma tigela.
Inovação e Aplicações
A abordagem de steerable scene generation não apenas cria ambientes, mas também permite a personalização através de comandos diretos, como solicitar uma cozinha com itens específicos. Os pesquisadores afirmam que o sistema teve uma taxa de precisão de 98% ao gerar prateleiras de despensa e 86% em mesas de café da manhã, superando métodos anteriores.
Além disso, a técnica incorpora aprendizado por reforço, permitindo que o modelo aprenda a criar cenários mais variados através de tentativa e erro. Isso possibilita a geração de cenas nunca vistas antes, aumentando a diversidade dos dados de treinamento para robôs, que precisam de ambientes ricos e realistas para aprimorar suas habilidades.
Futuro do Treinamento de Robôs
Os autores do estudo, incluindo o doutorando Nicholas Pfaff, destacam que este trabalho é apenas um prova de conceito. O próximo passo envolve a criação de objetos e cenas totalmente novos, além de incorporar objetos articulados que os robôs possam manipular. A intenção é construir uma comunidade de usuários que contribuirá para um vasto conjunto de dados, essencial para o aprendizado de robôs em cenários do mundo real.
Com essa inovação, a expectativa é que o treinamento de robôs se torne mais eficiente e alinhado com as exigências práticas do dia a dia, facilitando sua implementação em ambientes domésticos e industriais.