A Microsoft apresenta um sistema de detecção tátil para superar as principais limitações dos robôs

Fonte Cryptopolitan

A Microsoft Research lançou, no final de janeiro de 2026, um novo sistema de controle de robôs que permite que as máquinas trabalhem com as mãos enquanto processam comandos de voz e feedback físico. O sistema, chamado Rho-alpha, marca a entrada da empresa em modelos básicos projetados para robôs que usam dois braços simultaneamente.

A tecnologia chegará a grupos selecionados por meio de um Programa de Acesso Antecipado, antes de a Microsoft disponibilizá -la forma mais ampla em sua plataforma Foundry. As empresas poderão então adaptar o sistema às suas necessidades específicas, utilizando seus próprios dados.

Adicionando tato à inteligência robótica

Fábricas e armazéns buscam robôs capazes de lidar com condições variáveis, em vez de repetir indefinidamente os mesmos movimentos programados. Ambientes hospitalares necessitam de máquinas que se adaptem a diferentes situações. Linhas de produção onde os itens variam de lote para lote criam problemas que a automação tradicional não consegue resolver com eficiência. A Microsoft desenvolveu o Rho-alpha para atender a essa necessidade, processando o que os robôs veem e ouvem, além do que eles sentem fisicamente por meio de sensores.

A maioria dos sistemas robóticos atuais depende de câmeras e microfones para entender o ambiente ao seu redor e receber instruções. O Rho-alpha adiciona uma camada extra, tratando o tato como igualmente importante. Quando uma garra robótica possui sensores de pressão integrados, o sistema obtém informações que as câmeras não conseguem captar. Isso é crucial ao tentar conectar algo a uma tomada ou encaixar peças, situações em que a visão sozinha não fornece detalhes suficientes para determinar se tudo está alinhado corretamente.

A Microsoft demonstrou essas capacidades usando dois braços robóticos UR5e da Universal Robots equipados com sensores que detectam pressão e contato. Durante testes com um conjunto de tarefas chamado BusyBox, os usuários instruíam o robô a realizar ações como colocar uma bandeja dentro de uma caixa de ferramentas e fechar a tampa. O sistema transformava esses comandos em movimentos coordenados entre os dois braços e fazia ajustes com base nas informações captadas pelos sensores. Quando as tentativas de inserir um plugue falhavam na primeira tentativa, um operador humano podia guiar o robô usando um dispositivo de entrada 3D, e o sistema aprendia com essas correções.

Obter dados de treinamento suficientes continua sendo o maior desafio na construção de robôs capazes. Modelos de linguagem podem aprender com grandes quantidades de texto disponíveis online, mas o treinamento de robôs requer demonstrações físicas reais, que demandam tempo e dinheiro para serem gravadas. A Microsoft resolveu esse problema treinando o Rho-alpha com três tipos de informação: gravações de demonstrações físicas reais, tarefas práticas simuladas e grandes conjuntos de dados de imagens com perguntas e respostas da internet. A empresa utiliza o Nvidia Isaac Sim, executado em servidores Azure, para criar cenários sintéticos realistas por meio de um processo de aprendizado por reforço.

Essa configuração de simulação produz situações práticas fisicamente precisas que complementam as demonstrações reais. A abordagem combinada permite que o modelo simule casos incomuns e situações de falha que, de outra forma, exigiriam milhares de horas de operação no mundo real para serem capturadas.

O método de treinamento segue padrões utilizados por outras empresas de robótica O sistema Gemini Robotics do Google DeepMind, o modelo Helix da Figure AI para robôs humanoides e o Pi-Zero da Physical Intelligence adotam abordagens semelhantes para contornar o problema da escassez de dados. A técnica ajuda esses sistemas a aprender habilidades gerais de manipulação sem a necessidade de demonstrações específicas para cada tarefa que possam enfrentar.

Competir num mercado em processo de maturação

A Microsoft entra para robótica , que cresceu consideravelmente no último ano e meio. A Nvidia lançou o GR00T N1.6 , voltado para robôs humanoides, com foco no controle de todo o corpo e na compreensão do contexto. O Google DeepMind expandiu o Gemini para a robótica, com habilidades que vão desde dobrar papel em origami até manipular cartas de baralho. A Physical Intelligence apresenta o Pi-zero como um sistema multifuncional treinado para diferentes tipos de robôs.

O Rho-alpha se destaca de três maneiras . Primeiro, a ênfase na percepção tátil resolve situações em que sistemas que dependem apenas da visão encontram dificuldades. Segundo, o modelo deriva da série Phi da Microsoft, que a empresa otimizou para funcionar de forma eficiente em hardware de consumo comum. Essa experiência sugere que ele pode ser executado em dispositivos locais sem a necessidade de conexão constante com servidores na nuvem. Terceiro, o foco no aprendizado a partir de correções humanas durante a operação real o diferencia de modelos que precisam de um re-treinamento completo para adquirir novos comportamentos.

A abordagem comercial da Microsoft também difere da concorrência . A empresa planeja oferecer o Rho-alpha por meio de sua plataforma Foundry como infraestrutura que fabricantes e integradores de sistemas podem personalizar com suas próprias informações proprietárias. Isso reflete a abordagem da empresa com o Azure OpenAI Service e visa organizações que desejam criar versões especializadas em vez de usar um modelo genérico.

Para fabricantes e empresas de logística, a oportunidade reside na identificação de tarefas repetitivas de manuseio onde a automação atual apresenta limitações. Estações de inspeção de qualidade, operações de montagem de kits de itens e linhas de produção de pequenos lotes representam situações em que a combinação de compreensão de linguagem e sensor de toque do Rho-alpha poderia reduzir os requisitos de programação.

O programa de acesso antecipado anunciado pela Microsoft oferece às organizações uma maneira de testar se o sistema atende às suas necessidades antes de investir na infraestrutura de implantação. As empresas devem participar dessas avaliações prevendo que a supervisão humana será necessária e devem planejar fluxos de trabalho nos quais os operadores corrijam e orientem os robôs durante os períodos iniciais de aprendizado.

A IA física representa uma mudança de paradigma, transformando robôs de ferramentas programadas em colaboradores flexíveis. Essa transição levará anos, e não meses, mas os modelos fundamentais da Microsoft, Nvidia e Google estabelecem os padrões básicos que definirão defi robótica empresarial pelos próximos dez anos.

Junte-se a uma comunidade premium de negociação de criptomoedas gratuitamente por 30 dias - normalmente US$ 100/mês.

Isenção de responsabilidade: Apenas para fins informativos. O desempenho passado não é indicativo de resultados futuros.
placeholder
Mercados em 2026: Ouro, Bitcoin e o Dólar voltarão a fazer história? — Veja o que pensam as principais instituiçõesApós um ano turbulento, o que esperar dos mercados de commodities, forex e criptomoedas em 2026?
Autor  Mitrade Team
25 dez. 2025
Após um ano turbulento, o que esperar dos mercados de commodities, forex e criptomoedas em 2026?
placeholder
O ouro permanece próximo do pico histórico em meio a fluxos de refúgio seguro, dólar americano fraco e antecipando a decisão do FedO ouro (XAU/USD) atrai novos compradores após a retração no final do dia anterior, a partir de níveis acima da marca de US$ 5.100, ou a máxima histórica, e mantém a tendência positiva pelo sétimo dia consecutivo nesta terça-feira.
Autor  FXStreet
1 Mês 27 Dia Ter
O ouro (XAU/USD) atrai novos compradores após a retração no final do dia anterior, a partir de níveis acima da marca de US$ 5.100, ou a máxima histórica, e mantém a tendência positiva pelo sétimo dia consecutivo nesta terça-feira.
placeholder
Forex Hoje: Fed mantém postura hawkish, dólar americano continua sob pressãoO Índice do Dólar Americano (DXY) recuperou acima de 96,60 na quarta-feira, depois que o secretário do Tesouro da Casa Branca, Scott Bessent, afirmou que os EUA têm uma política de dólar forte, sugerindo que os fundamentos corretos estão em vigor. Bessent também negou que os EUA estivessem intervindo nos mercados cambiais para apoiar o iene japonês.
Autor  FXStreet
Ontem 02: 00
O Índice do Dólar Americano (DXY) recuperou acima de 96,60 na quarta-feira, depois que o secretário do Tesouro da Casa Branca, Scott Bessent, afirmou que os EUA têm uma política de dólar forte, sugerindo que os fundamentos corretos estão em vigor. Bessent também negou que os EUA estivessem intervindo nos mercados cambiais para apoiar o iene japonês.
placeholder
Ouro amplia sequência recorde com a persistência da demanda por ativos segurosO ouro (XAU/USD) prolonga sua alta recorde pelo nono dia consecutivo e avança mais de 3% na quinta-feira, subindo para cerca de US$ 5.600 durante o pregão asiático.
Autor  FXStreet
Ontem 05: 52
O ouro (XAU/USD) prolonga sua alta recorde pelo nono dia consecutivo e avança mais de 3% na quinta-feira, subindo para cerca de US$ 5.600 durante o pregão asiático.
placeholder
Previsão do preço da Solana: SOL se aproxima do suporte crítico, enquanto a perspectiva de baixa persisteA Solana (SOL) está sendo negociada em baixa, com queda de 2% até o momento, alinhando-se com a correção mais ampla do mercado de criptomoedas, já que o Federal Reserve (Fed) dos EUA manteve as taxas de juros inalteradas na quarta-feira.
Autor  FXStreet
Ontem 05: 56
A Solana (SOL) está sendo negociada em baixa, com queda de 2% até o momento, alinhando-se com a correção mais ampla do mercado de criptomoedas, já que o Federal Reserve (Fed) dos EUA manteve as taxas de juros inalteradas na quarta-feira.
goTop
quote