O Instituto de Tecnologia de Massachusetts (MIT, na sigla em inglês) revelou a lista anual de 10 tecnologias inovadoras para 2025. O ranking já tinha sido divulgado no início do ano, mas voltou a chamar atenção durante o SXSW, festival de tecnologia, música, inovação e cultura realizado anualmente em março em Austin, Texas, nos Estados Unidos.
O ranking é elaborado por pesquisadores do MIT a partir de relatórios, conversas com especialistas e acompanhamento de avanços tecnológicos. A instituição foi considerada a melhor universidade do mundo nos últimos 13 anos pelo QS World University Rankings — então, se ela dita tendência, o mundo ouve.
Os fatores principais considerados para definir as tecnologias emergentes são: significância de longo prazo e potencial para se tornarem realidades comerciais, segundo o site Above The Law.
Waymo lidera transformação de robotáxis no mundo (Imagem: :Eli Wilson/iStock)
Observatório Vera C. Rubin: Sediado no Chile, o observatório vai conduzir uma pesquisa de dez anos do céu noturno, criando o mapa digital mais detalhado de todos os tempos, explorando galáxias e buracos negros;
Busca de IA generativa: Talvez o item mais óbvio da lista, mas que reforça a grande mudança na forma como navegamos na internet, com novo estilo de conversação e respostas mais diretas;
Pequenos modelos de linguagem: Sistemas que exigem significativamente menos dados e poder de computação do que os LLMs, tornando tarefas específicas mais eficientes e adaptáveis;
Arrotos de gado: Cientistas estão desenvolvendo suplementos para reduzir a produção de metano a partir dos arrotos de gado, um dos maiores desafios ambientais agrícolas;
Robotáxis: O advento de serviços de IA vai impulsionar cada vez mais a coleta de informações para tornar os táxis autônomos uma realidade em escala global;
Combustível de aviação mais limpo: Novos combustíveis feitos de óleo de cozinha usado, resíduos industriais ou até mesmo gases no ar podem ajudar a alimentar aviões sem combustíveis fósseis;
Startup Stegra constrói primeira usina industrial de aço verde na Suécia (Imagem: Stegra/Divulgação)
Robôs de Aprendizado Rápido: Graças ao boom da IA generativa de hoje, os robôs estão aprendendo novas tarefas mais rápido do que nunca. Estamos nos aproximando de robôs de propósito geral que podem lidar com uma variedade de tarefas em nosso nome;
Medicamentos de prevenção do HIV de ação prolongada: Um novo medicamento de prevenção do HIV ainda em teste descobriu que 100% das mulheres e meninas tratadas estavam protegidas de adquirir infecções pelo HIV. E ele só precisa ser injetado uma vez a cada seis meses;
Green Steel Technologies: A produção de aço é uma das maiores fontes industriais de dióxido de carbono. A primeira usina industrial de aço verde, que usa hidrogênio feito com energia renovável, está sendo construída no norte da Suécia;
Terapias-tronco cultivadas em laboratório: Transplantes experimentais de células feitas em laboratório parecem estar ajudando a tratar duas condições muito diferentes — epilepsia e diabetes tipo 1.
A DeepSeek, uma empresa chinesa de inteligência artificial (IA), surpreendeu os mercados financeiros e grandes empresas de tecnologia dos EUA assim que o ano começou, mas seu sucesso não foi uma surpresa total.
Muitas empresas chinesas têm se destacado por adotar estratégia diferente das gigantes ocidentais, focando em inovação rápida e acessível em vez de depender de marca ou tecnologia exclusiva.
Essas empresas se destacam pela adaptabilidade e velocidade nos negócios, o que as coloca à frente da concorrência. Além da DeepSeek, outras empresas chinesas estão revolucionando a economia global. O The Conversation listou algumas delas. Vamos conhecê-las:
Empresas chinesas de sucesso
DJI Innovations
Fundada em 2006, a DJI é líder no mercado de drones e tecnologia de câmeras, com aplicações em áreas, como agricultura e defesa;
Sua capacidade de produzir tecnologia de ponta a baixo custo e com processos automatizados permitiu rápida expansão global;
Sua tecnologia também foi usada nas filmagens de seriados, como “Better Call Saul” e “Game of Thrones”.
Tecnologia de câmeras da DJI ajudou na filmagens de séries mundialmente famosas, como “Game of Thrones” (Imagem: Divulgação/HBO)
Spin-off da DJI, a Unitree foi fundada em 2016 e é especializada em robôs quadrúpedes e humanoides;
Com ciclos de desenvolvimento rápidos e equipes altamente qualificadas, a empresa se destaca no mercado de robótica com inovações, como robôs capazes de soldar e, até, dançar.
Game Science
Fundada em 2014, a Game Science conquistou grande sucesso com o RPG “Black Myth: Wukong“;
A empresa se diferencia ao integrar elementos culturais chineses em seus jogos;
Além disso, ela procura utilizar análise de dados para atender às preferências globais, superando o modelo tradicional de exportação de versões baratas de jogos ocidentais.
Chinesa Game Science desenvolveu o jogo “Black Myth: Wukong”, que alcançou grande popularidade (Imagem: Divulgação/Overload Games)
Yonyou
Criada em 1988, a Yonyou se tornou líder no mercado de software de negócios e contabilidade na China, expandindo para outros países da Ásia;
Sua abordagem focada em personalizar produtos para as necessidades locais sem aplicar preços premium foi crucial para seu sucesso;
A empresa pretende se tornar dominante também fora da Ásia.
Essas empresas demonstram como a inovação tecnológica e boas estratégias podem levar a avanços significativos, embora fatores geopolíticos possam afetar o futuro do comércio e da economia global.
No entanto, ao continuar explorando seus pontos fortes, elas têm grandes chances de continuar disruptivas no mercado global.
Diariamente, vemos notícias sobre inteligência artificial (IA). Mas essas novidades estão afetando a vida real? Uma pesquisa, liderada pela Universidade de Stanford (EUA) examinou mais de 300 milhões de amostras de texto para descobrir se estamos dependentes da IA para redigir textos.
Os pesquisadores analisaram reclamações de consumidores enviadas ao US Consumer Financial Protection Bureau (CFPB), órgão extinto pela gestão de Donald Trump, entre janeiro de 2022 (ano do lançamento do ChatGPT) e setembro de 2024.
Aplicativos de IA generativa já são amplamente usados nos EUA (Imagem: hapabapa/iStock)
Isso inclui 537.413 comunicados de imprensa corporativos, 304,3 milhões de ofertas de emprego e 15.919 comunicados de imprensa da Organização das Nações Unidas (ONU).
O que a pesquisa sobre nossa dependência da IA descobriu?
18% das reclamações de consumidores financeiros, 24% dos comunicados de imprensa corporativos, até 15% das ofertas de emprego e 14% dos comunicados de imprensa da ONU mostraram sinais de assistência de inteligência artificial durante esse período;
Áreas urbanas mostraram maior adoção geral (18,2% versus 10,9% nas áreas rurais);
Regiões com menor nível educacional usaram ferramentas de escrita de IA com mais frequência (19,9% comparado a 17,4% em áreas de ensino superior).
O estudo destaca que o resultado contradiz os padrões típicos de adoção de tecnologia, onde populações mais educadas adotam novas ferramentas mais rapidamente. Além disso, a pesquisa, provavelmente, representa nível mínimo de uso de inteligência artificial, já que as métricas para detecção desse tipo de material ainda são pouco sofisticadas.
“A dependência excessiva de IA pode resultar em mensagens que não abordam preocupações ou, em geral, divulgam informações menos confiáveis externamente. A dependência excessiva de IA também pode introduzir desconfiança pública na autenticidade das mensagens enviadas por empresas”, alertam os pesquisadores.
Dependência de IA pode gerar desconfiança pública, segundo estudo (Imagem: Supatman/iStock)
O Google DeepMindapresentou nesta quarta-feira (12), dois novos modelos de inteligência artificial (IA) baseados no Gemini 2.0 para tornar a tecnologia útil e prestativa no mundo físico. São eles: o Gemini Robotics, modelo avançado de visão-linguagem-ação (VLA), e o Gemini Robotics-ER, modelo com compreensão espacial avançada.
A big tech também anunciou parceria com a Apptronik para construir a próxima geração de robôs humanoides com o Gemini 2.0. Além disso, a empresa selecionou determinadas empresas para orientar o futuro do Gemini Robotics-ER, como Agile Robots, Agility Robots, Boston Dynamics e Enchanted Tools.
Robô com tecnologia Google Gemini
A equipe definiu três princípios para garantir a aplicabilidade do modelo de IA de seu novo robô: adaptação a diferentes situações; interatividade; e habilidades com mãos e dedos;
O modelo é “intuitivamente interativo”, com capacidade para entender e responder a comandos formulados em linguagem cotidiana, conversacional e em diferentes idiomas;
“Em nosso relatório técnico, mostramos que, em média, a Gemini Robotics mais que dobra o desempenho em um benchmark de generalização abrangente em comparação com outros modelos de visão-linguagem-ação de última geração”, diz o comunicado;
Ele monitora, continuamente, seus arredores, detecta mudanças no ambiente e ajusta suas ações de acordo, o que, segundo o Google, pode “ajudar melhor as pessoas a colaborar com assistentes robôs em uma variedade de configurações, de casa ao local de trabalho”.
Testes foram realizados em três tipos diferentes de robôs (Imagem: Divulgação/Google)
A Gemini Robotics pode lidar com tarefas extremamente complexas e de várias etapas que exigem manipulação precisa, como dobrar origami ou embalar um lanche em um saco Ziploc.
Os treinamentos foram feitos na plataforma robótica de dois braços ALOHA 2 e, também, nos braços Franka, usados em laboratórios acadêmicos. Para personificações mais complexas, a empresa deve seguir como exemplo o robô humanoide Apollo, da Apptronik.
Já o Gemini Robotics-ER foi construído para focar no raciocínio espacial, executando todas as etapas necessárias para controlar um robô imediatamente, incluindo percepção, estimativa de estado, compreensão espacial, planejamento e geração de código.
Modelo aprende capacidades inteiramente novas no momento em que é provocado (Imagem: Divulgação/Google)
O modelo pode desenvolver capacidades inteiramente novas no mesmo momento em que é provocado. “Por exemplo, quando lhe é mostrada uma caneca de café, o modelo pode intuir uma pegada apropriada com dois dedos para pegá-la pela alça e uma trajetória segura para se aproximar dela”, explica a empresa.
A tecnologia se destacou em capacidades de raciocínio incorporado, incluindo detecção de objetos e apontar para partes deles, localização de pontos correspondentes e detecção de itens em 3D.
Todos na área de inteligência artificial (IA) estão falando sobre o Manus – e o Instituto de Tecnologia de Massachusetts (MIT, na sigla em inglês) (EUA) decidiu colocá-lo à prova.
Apesar de o novo agente de IA geral, desenvolvido na China, ter enfrentado alguns travamentos e sobrecarga dos servidores, sua alta intuição e potencial para o futuro dos assistentes de IA chamam a atenção.
Desde o seu lançamento na semana passada, o Manus se espalhou rapidamente pela internet – não apenas na China, onde foi criado pela startup Butterfly Effect, sediada em Wuhan (China), mas, também, globalmente.
Vozes influentes do setor, como o cofundador do Twitter (atual X), Jack Dorsey, e o líder de produtos da Hugging Face, Victor Mustar, elogiaram seu desempenho, chegando a apelidá-lo de “o segundo DeepSeek”, em referência ao modelo anterior que surpreendeu a indústria com capacidades inesperadas e origem peculiar.
IA veio para concorrer com DeepSeek (Imagem: Runrun2/Shutterstock)
Vamos contextualizar:
O que é o Manus?
O Manus é um sistema projetado para executar uma variedade de atividades complexas sem a necessidade de intervenção humana constante.
A novidade tecnológica busca rivalizar com os avanços recentes da DeepSeek e opera por meio da combinação de múltiplos modelos de IA, conferindo-lhe capacidade de adaptação diferenciada dos rivais.
Esta arquitetura multifacetada capacita a IA a conduzir pesquisas, sugerir cardápios para ocasiões específicas e, até, propor destinos turísticos de acordo com o período do ano.
Contudo, suas funcionalidades superam as competências dos bots convencionais, uma vez que o sistema é capaz de iniciar e concluir tarefas sozinho.
Como agente de inteligência artificial, a Manus engloba habilidades de projetar ações, deliberar sobre decisões e absorver conhecimento a partir de suas vivências, o que a posiciona como possível substituta para a força de trabalho humana diversas funções.
Diferente dos agentes de IA focados em setores isolados, como comércio e logística, esta tecnologia promete servir a um leque extenso de áreas, uma vez que adquire dados em tempo real, avalia informações, elabora informes, estrutura e implementa códigos, automatiza processos e mais.
O que a IA totalmente autônoma pode fazer
Demonstrações realizadas por especialistas revelaram a capacidade do Manus de criar e implantar websites com precisão;
Identificar propriedades imobiliárias com base em atributos particulares, e até criar currículos de estudo sobre IA;
O sistema também foi capaz de elaborar aplicativos de vídeo, propor roteiros geográficos, e compilar relatórios por meio de informações extraídas de plataformas digitais;
Adicionalmente, o Manus demonstrou proficiência na seleção de candidatos para postos de emprego por meio da análise de currículos e na justificativa de suas escolhas por meio de tabelas comparativas;
A inteligência artificial exerce, ainda, controle sobre dispositivos ou software, explorando páginas da internet, preenchendo formulários e realizando julgamentos.
E a análise do MIT?
Após obter acesso ao Manus, Caiwei Chen, do MIT, pôde testá-lo pessoalmente e a experiência foi parecida com a de colaborar com um estagiário extremamente inteligente e eficiente.
O agente, embora às vezes não entenda perfeitamente as solicitações, cometa suposições equivocadas ou adote atalhos para agilizar processos, demonstra clareza ao explicar seu raciocínio, adapta-se bem às instruções e melhora significativamente quando recebe feedback detalhado. Em suma, o Manus é promissor – mas ainda longe da perfeição.
Assim como o produto anterior da empresa-mãe – a assistente de IA Monica, lançada em 2023 – o Manus foi pensado para um público global. Com o inglês definido como idioma padrão, sua interface adota um design limpo e minimalista.
IA é promissora para vários tipos de usuários (Imagem: Tada Images/Shutterstock)
Funcionamento e Interface
Para utilizar o Manus, o usuário precisa inserir um código de convite válido. Em seguida, é direcionado para uma página inicial que lembra as interfaces do ChatGPT ou do DeepSeek: à esquerda, ficam registradas as sessões anteriores, e, ao centro, há uma caixa de entrada para o chat.
A página também exibe exemplos de tarefas selecionadas pela equipe, que vão desde o desenvolvimento de estratégias empresariais até sessões interativas de aprendizado e meditações personalizadas em áudio.
Diferentemente de outras ferramentas de IA focadas em raciocínio, como o ChatGPT DeepResearch, o Manus consegue dividir tarefas em etapas e navegar autonomamente pela internet para coletar as informações necessárias.
Seu diferencial é a janela “Computador do Manus”, que permite ao usuário acompanhar, em tempo real, o que o agente está fazendo – e até intervir, se necessário.
Para avaliar seu desempenho, Chen propôs ao Manus três tarefas:
Elaborar lista de repórteres renomados que cobrem tecnologia na China;
Buscar anúncios de apartamentos com dois quartos em Nova York;
Indicar potenciais candidatos para a lista “Innovators Under 35”, elaborada anualmente pela MIT Technology Review.
Tarefa 1: lista de repórteres
Na primeira tentativa, o Manus apresentou apenas cinco nomes, acompanhados de outras cinco “menções honrosas”. Notou-se que ele listava as principais obras de alguns jornalistas, mas não de outros.
Ao questioná-lo, sua resposta foi surpreendentemente simples: ele admitiu ter ficado “com preguiça” por causa das restrições de tempo para agilizar o processo.
Após insistir por maior consistência e profundidade, o Manus forneceu lista completa com 30 nomes, incluindo o veículo atual de cada jornalista e seus trabalhos de destaque.
O jornalista ficou impressionado com sua capacidade de receber sugestões e implementar mudanças, de forma semelhante a um assistente humano.
Embora, inicialmente, tenha deixado de atualizar o status de emprego de alguns repórteres, ao solicitar correções, ele, rapidamente, ajustou as informações. Outro ponto positivo foi a possibilidade de baixar os resultados em formatos Word ou Excel, facilitando a edição e o compartilhamento.
Porém, o Manus encontrou dificuldades ao acessar artigos de notícias protegidos por paywall, esbarrando frequentemente em bloqueios de captcha.
Durante o teste, foi possível intervir nesses momentos, mas muitos sites de mídia continuaram a bloquear a ferramenta por suspeita de atividade irregular.
Aqui, há grande potencial de melhoria – seria ideal se versões futuras do Manus pudessem solicitar ajuda automaticamente ao encontrar esse tipo de restrição.
MIT gostou da IA (Imagem: DIA TV/Shutterstock)
Tarefa 2: busca por apartamentos
Para a pesquisa de imóveis, foi definido um conjunto complexo de critérios, incluindo orçamento, cozinha espaçosa, área externa, proximidade do centro de Manhattan (EUA) e a existência de uma estação de trem importante a no máximo sete minutos a pé.
Inicialmente, o Manus interpretou requisitos vagos, como “algum tipo de espaço externo”, de forma muito literal, eliminando completamente as propriedades sem terraço ou varanda.
Após receber orientações mais detalhadas, ele conseguiu elaborar uma lista mais abrangente, organizando as recomendações em diferentes categorias – por exemplo, “melhor no geral”, “melhor custo-benefício” e “opção de luxo”.
Essa tarefa, mesmo com as várias interações para ajustar os critérios, foi concluída em menos de 30 minutos – bem menos que o tempo gasto para compilar a lista de repórteres, provavelmente por conta da facilidade de acesso e da organização dos anúncios imobiliários disponíveis online.
Tarefa 3: seleção para o Innovators Under 35
Este foi o desafio de maior escala: o repórter pediu ao Manus que indicasse 50 candidatos para a lista “Innovators Under 35” deste ano – processo que, normalmente, envolve a análise de centenas de indicações.
O Manus dividiu a tarefa em etapas: revisou listas anteriores para compreender os critérios de seleção, desenvolveu estratégia de pesquisa para identificar candidatos, compilou nomes e buscou garantir diversidade geográfica e setorial.
A etapa de criação da estratégia de pesquisa foi a mais demorada. Embora o Manus não tenha explicado explicitamente sua abordagem, a janela “Computador do Manus” mostrou o agente rapidamente percorrendo sites de universidades renomadas, anúncios de prêmios de tecnologia e matérias jornalísticas. Ainda assim, ele enfrentou barreiras ao tentar acessar artigos acadêmicos e conteúdos protegidos por paywall.
Após três horas de busca intensiva – durante as quais o Manus pediu, mais de uma vez, que ele restringisse os parâmetros da pesquisa – ele conseguiu apresentar apenas três candidatos com perfis completos. Quando lhe foi solicitado uma lista completa de 50 nomes, ele a gerou, mas com forte super-representação de certas instituições e áreas acadêmicas, sinalizando processo de pesquisa incompleto.
Ao pedir especificamente cinco candidatos da China, ele, finalmente, apresentou lista sólida de nomes, embora os resultados tenham tendido a favorecer celebridades da mídia chinesa.
No fim, foi preciso interromper o processo, pois o sistema alertou que a performance do Manus poderia piorar se continuasse inserindo grandes volumes de texto.
Por enquanto, apenas convidados podem usar a IA (Imagem: Photo For Everything/Shutterstock)
Considerações Finais sobre o Manus
Na opinião de Chen, de modo geral, o Manus se mostrou ferramenta altamente intuitiva, apropriada tanto para usuários com conhecimentos em programação quanto para aqueles sem experiência técnica.
Em duas das três tarefas, os resultados foram superiores aos obtidos com o ChatGPT DeepResearch – embora o tempo de execução tenha sido consideravelmente maior.
O Manus parece ideal para tarefas analíticas que exigem pesquisas aprofundadas na internet, mas dentro de escopo limitado – ou seja, atividades que um estagiário qualificado conseguiria realizar em um dia de trabalho.
Entretanto, nem tudo são flores. O sistema apresenta instabilidade e travamentos frequentes, além de enfrentar dificuldades ao processar grandes quantidades de texto.
Mensagens como “Devido à alta demanda atual, não é possível criar novas tarefas. Por favor, tente novamente em alguns minutos” surgiram em vários momentos, e a janela “Computador do Manus” chegou a travar por longos períodos em determinadas páginas.
Apesar de ter taxa de falhas maior que a do ChatGPT DeepResearch – problema que, segundo o cientista-chefe do Manus, Peak Ji, já está sendo tratado –, a mídia chinesa 36Kr aponta que o custo por tarefa do Manus é de cerca de US$ 2 (R$ 11,65, na conversão direta), apenas um décimo do valor cobrado pelo DeepResearch.
Com infraestrutura de servidores mais robusta, é possível que o Manus se torne a opção preferida para usuários individuais, profissionais de escritório, desenvolvedores independentes e pequenas equipes.
Por fim, vale destacar o aspecto colaborativo e transparente do Manus. Ele faz perguntas durante o processo, retém instruções importantes em sua “memória” para uso futuro e permite experiência altamente personalizável.
Além disso, cada sessão pode ser reproduzida e compartilhada, facilitando o acompanhamento e a revisão das tarefas realizadas.
Em resumo, o jornalista diz que pretende continuar utilizando o Manus para diversas tarefas – tanto na vida pessoal quanto na profissional.
Embora as comparações com o DeepSeek ainda possam ser debatidas, o desempenho do Manus reforça que as empresas chinesas de IA não estão apenas imitando seus equivalentes ocidentais, mas sim moldando, de forma única, a adoção de agentes de IA autônomos.
Ficou curioso para testar o Manus? (Imagem: Photo For Everything/Shutterstock)
Quem pode usar o Manus?
Por ora, o acesso à Manus está restrito a um grupo de avaliadores por meio de convites. Apesar de todo o entusiasmo, somente uma pequena fração dos usuários na lista de espera (menos de 1%) já recebeu um código de convite.
Ainda que o número exato de interessados seja incerto, o fato de o canal do Manus no Discord contar com mais de 186 mil membros evidencia o enorme interesse em torno da ferramenta.
A tecnologia, apesar de poderosa, despertou preocupações em relação à privacidade, ética e segurança. A aptidão do Manus para gerenciar múltiplas contas em redes sociais e a falta de regulação adequada levanta questionamentos sobre o possível uso malicioso da ferramenta.
Apesar da promissora capacidade de automatizar tarefas complexas, a nova IA ainda enfrenta outro obstáculo: a quantidade limitada de testes realizados. Essa restrição levanta dúvidas sobre a verdadeira extensão de suas habilidades e o quão confiáveis podem ser suas performances em cenários variados, apesar deste extenso teste do MIT.
Um estudo recente destacou as limitações de chatbots de IA, como ChatGPT, Gemini e Grok, quando usados para busca de informações factuais. A pesquisa revelou que esses sistemas falham frequentemente em fornecer respostas precisas, errando em mais de 60% das vezes.
Mesmo quando conseguem uma resposta, muitas vezes estão excessivamente confiantes nas informações incorretas.
O estudo, conduzido pelo Tow Center for Digital Journalism, e publicado na Columbia Journalism Review, testou oito chatbots em tarefas simples, como encontrar e fornecer um link para um artigo específico.
Os chatbots testados foram o ChatGPT, Perplexity, Perplexity Pro, DeepSeek, Copilot, Grok-2, Grok-3 e Gemini.
Chatbots falharam em mais das metade das vezes em fornecer respostas precisas – Imagem: TippaPatt – Shutterstock
Embora a tarefa fosse realizável no Google, os chatbots cometeram erros significativos. O Perplexity teve o melhor desempenho, acertando 63% das vezes, enquanto o Grok-3 obteve apenas 6% de acerto.
Os principais problemas observados incluem: os chatbots fornecendo respostas erradas com confiança, ignorando protocolos de exclusão de robôs, fabricando links e citando versões erradas de artigos. Além disso, os chatbots premium (como o Copilot, da Microsoft) eram mais confiantes, mas igualmente imprecisos.
Apple acertou em parceria com o ChatGPT
Apesar disso, a parceria da Apple com o ChatGPT para consultas não respondidas pela Siri é vista como algo positivo.
Embora o desempenho do ChatGPT não tenha sido perfeito na atividade, foi relativamente bem entre os testados.
O estudo confirma que chatbots podem ser úteis para gerar ideias, mas não devem ser confiáveis para respostas factuais.
Parceria da Apple com o ChatGPT é vista como uma escolha inteligente (Imagem: Rokas Tenys/Shutterstock)
O Google DeepMind lançou dois modelos de inteligência artificial (IA): Gemini Robotics e Gemini Robotics-ER. Ambos foram projetados para ajudar robôs a “executar gama mais ampla do que nunca de tarefas no mundo real”.
O Gemini Robotics é um modelo de visão-linguagem-ação capaz de entender situações mesmo sem ter sido treinado para elas, segundo o Google. Já o Gemini-ER (sigla em inglês para raciocínio incorporado) a big tech descreve como um modelo avançado de linguagem visual que pode “entender nosso mundo complexo e dinâmico”, segundo postagem em seu blog.
Novos modelos de IA do Google para robôs usam Gemini
O Gemini Robotics roda Gemini 2.0, a versão mais recente do modelo de IA principal do Google. O novo modelo “aproveita o entendimento multimodal do Gemini sobre o mundo e o transfere para o mundo real, adicionando ações físicas como uma nova modalidade”, disse a diretora sênior e chefe de robótica no Google DeepMind, Carolina Parada, numa coletiva de imprensa, segundo o Verge.
Gemini Robotics avança em interatividade, destreza e generalidade – áreas essenciais para construir robôs úteis (Imagem: Reprodução/Google DeepMind)
O Robotics avança em três áreas consideras essenciais pelo Google DeepMind para construir robôs úteis: generalidade, interatividade e destreza.
Além da capacidade de generalizar novos cenários, o Gemini Robotics é melhor na interação com pessoas e seu ambiente. Também é capaz de executar tarefas físicas mais precisas, como dobrar um pedaço de papel ou remover uma tampa de garrafa.
Sobre o Gemini Robotics-ER, Carolina dá o seguinte exemplo: quando você prepara sua lancheira e tem itens sobre uma mesa à sua frente, é preciso saber onde está cada item, como abrir a lancheira, como pegar os itens e onde colocá-los. Esse é o tipo de raciocínio que o Gemini Robotics-ER deve realizar.
Google DeepMind deixou “testadores confiáveis” usarem o modelo Gemini Robotics-ER (Imagem: Reprodução/Google DeepMind)
O pesquisador do Google DeepMind, Vikas Sindhwani, disse aos repórteres que a empresa desenvolve “abordagem em camadas” no que diz respeito à segurança. Sindhwani acrescentaou que os modelos do Gemini Robotics-ER “são treinados para avaliar se uma ação potencial é segura para ser realizada num determinado cenário”.
A big tech também lançou benchmarks e frameworks para ajudar a pesquisa de segurança na indústria de IA. E deu acesso a “testadores confiáveis” ao seu modelo Gemini Robotics-ER. Entre eles, estão: Agile Robots, Agility Robotics, Boston Dynamics e Enchanted Tools.
Em um mundo onde a tecnologia redefine constantemente os limites da criatividade, a música não poderia ficar de fora. No Spotlight, evento que celebrou os 20 anos do Olhar Digital, Johnny Bolzan, produtor musical, DJ e criador de conteúdo, apresentou uma visão inovadora sobre o uso da inteligência artificial (IA) na música, mostrando como essa tecnologia já está transformando a forma como a música é criada e consumida.
“O que eu vou falar é algo que está no presente, sempre vai estar no futuro, mas também sempre esteve no passado, que é a ressignificação da música”, afirma Johnny, destacando que a IA não é apenas uma ferramenta futurística, mas sim uma evolução natural do processo de criação musical.
Do salão à nuvem: a evolução do consumo musical
Johnny começou traçando um panorama histórico da evolução do consumo musical, desde os salões da nobreza até a era do streaming e da IA generativa. Ele destaca como cada avanço tecnológico, desde a impressão de partituras até a criação de softwares de produção musical, abriu novas possibilidades para a criação e o consumo de música.
“A gente entrou na época do streaming, do algoritmo, cada um está na sua bolha, cada um tem sua playlist feita para você, a música é feita para o streaming hoje em dia, até a gente chegar no momento da inteligência artificial generativa, que você escreve um simples prompt de texto e ela te dá uma música”, explica Johnny, mostrando como a IA generativa representa um novo marco na história da música.
A IA generativa representa um novo marco na história da música. (Imagem: João Neto/Reprodução)
A IA como ferramenta de ressignificação musical
Johnny explora o conceito de ressignificação musical, mostrando como artistas ao longo da história reinterpretaram obras existentes para criar algo novo. Ele cita exemplos como Tom Jobim, que se inspirou em Chopin para criar “Insensatez”, e Daft Punk, que utilizou samples de Eddie Johns em “One More Time”.
(Imagem: João Neto/Reprodução)
“Esse processo acontece desde que a música é música, e a mesma coisa pode ser feita com inteligência artificial”, afirma Johnny, mostrando como a IA pode ser utilizada para ressignificar músicas existentes e criar novas obras originais.
Como funciona o processo criativo com IA
Johnny compartilha o processo de criação de uma música utilizando diversas ferramentas de IA, desde a geração da letra com ChatGPT até a criação da melodia com Suno e a separação dos canais da música com Moisés.
Ele destaca ainda a importância da intervenção humana em cada etapa do processo, desde a engenharia de prompts até a escolha dos samples e a interpretação vocal.
“A grande conclusão que a gente chega é que o futuro da música não é só na inteligência artificial ou na próxima tecnologia que vai vir, mas sim como os artistas, os produtores vão ressignificar o uso dessa plataforma”, explica Johnny, enfatizando que a IA é uma ferramenta que pode ser utilizada para potencializar a criatividade humana.
(Imagem: João Neto/Reprodução)
Johnny destaca ainda a importância da interpretação vocal humana em um contexto de crescente uso de IA na música. Ele explica que, apesar da possibilidade de utilizar clones de voz gerados por IA, ele optou por convidar uma cantora para interpretar a música, buscando trazer nuances e emoções que apenas uma voz humana pode transmitir.
“Quando você começa a trabalhar muito com essas ferramentas generativas, você vê que tudo uma hora fica meio parecido. Parece que é a mesma voz cantando em toda a música”, observa Johnny, ressaltando a importância de preservar a individualidade e a expressividade na música.
Johnny conclui sua apresentação com uma reflexão sobre o futuro da música, destacando que a IA não é uma ameaça à criatividade humana, mas sim uma ferramenta que pode ser utilizada para expandir os horizontes da criação musical. Ele convida os artistas a explorarem as possibilidades da IA, buscando novas formas de ressignificar a música e criar obras inovadoras.
“O futuro da música não é só na inteligência artificial ou na próxima tecnologia que vai vir, mas sim como os artistas, os produtores vão ressignificar o uso dessa plataforma, como eles vão conversar entre plataformas, ter um estudo prévio muito claro do que eles querem, para onde querem chegar, para ressignificar essas ferramentas e trazer algo de fato novo”, finaliza Johnny, convidando a todos a participarem da construção de um futuro musical onde humanos e máquinas se unem em uma sinfonia de criatividade e inovação.
Robôs, agora, vão ter a capacidade de pensar como seres humanos. O método, desenvolvido pela Universidade de Columbia (EUA) e divulgado na Nature, permite que os autômatos desenvolvam raciocínio e adaptação em tempo real.
Os cientistas desenvolveram máquinas com autoconsciência que não dependem de pré-programação para tomar ações. Elas apenas precisam assistir aos próprios movimentos para entender a estrutura e replicá-los.
Robô desenvolvido pela Universidade de Colúmbia (Imagem: Reprodução/YouTube/Columbia Engeneering)
Esse novo estudo aumenta a capacidade de robôs funcionarem de forma independente, reduzindo a necessidade de intervenção humana;
Essas novas inteligências artificiais (IAs) utilizam de informação visual para construir um modelo interno de seu corpo e funcionamento;
A IA observa os movimentos realizados e os armazena por meio de uma câmera;
O método foi desenvolvido se baseando na habilidade humana de assistir aos próprios movimentos para melhorar em determinadas habilidades.
Os pesquisadores desenvolveram algorítimo que utiliza redes neurais para analisar a movimentação dos robôs. Além disso, permite as máquinas detectarem e corrigir falhas em seu funcionamento, tudo isso sem auxílio de humanos.
Essa nova tecnologia promete se tornar essencial para uma nova geração de robôs industriais que vão operar em fábricas e outros ambientes de trabalho. A autoconsciência vai ajudar os autômatos a operar, de maneira eficiente, sem a necessidade de intervenção humana.
Essas máquinas podem reparar os próprios erros e evoluir com base na própria experiência, assim como um ser humano. Até este momento os robôs industriais necessitavam de monitoramento. Agora, com a tecnologia desenvolvida pela Columbia, a interação com pessoas reais será reduzida a quase zero.
Robôs autoconscientes estarão em fábricas em breve. (Imagem: Figure / Divulgação)
Futuro dessa tecnologia
Além da indústria, essa tecnologia pode impactar diversas áreas, como a medicina e a exploração espacial. Robôs cirúrgicos mais autônomos poderiam tornar procedimentos mais precisos, enquanto robôs enviados ao Espaço poderiam se adaptar a ambientes desconhecidos sem depender de controle humano constante.
No entanto, o avanço levanta questões sobre o futuro do trabalho e a segurança desses sistemas. Com máquinas cada vez mais independentes, especialistas debatem os desafios éticos e os limites dessa tecnologia para garantir que ela beneficie a sociedade sem riscos inesperados.
O grupo aeroespacial e de defesa italiano Leonardo vai colocar 38 satélites em órbita para oferecer serviços para fins militares e civis, incluindo IA. A estratégia aumenta as oportunidades de negócios para governos europeus que buscam alternativas à Starlink, de Elon Musk.
A maior parte do investimento militar partirá do Ministério da Defesa da Itália, que vai alocar € 580 milhões (R$ 3,6 bilhões) dos € 900 milhões (R$ 5,7 bilhões) totais previstos para a iniciativa, segundo o jornal The Wall Street Journal.
A primeira-ministra da Itália, Giorgia Meloni, foi pressionada pela oposição ao negociar um acordo de US$ 1,5 bilhão (R$ 9,5 bilhões) com a Starlink, em janeiro, como relata a EuroNews. À época, ela lamentou a falta de “alternativas públicas” à empresa de Musk.
Maior parte do investimento será feito pelo Ministério da Defesa italiano (Imagem: Leonardo/Reprodução)
Um relatório recente da consultoria PwC destacou que as tecnologias de IA terão “papel crucial na reformulação de como as organizações de defesa gerenciam recursos, tomam decisões e executam missões complexas” até 2030.
Os satélites da Leonardo serão lançados entre 2027 e 2028, sendo 18 para uso das Forças Armadas e 20 para aplicações em setores como agricultura e monitoramento de infraestrutura. A previsão faz parte de um plano de cinco anos anunciado pela empresa.
Leonardo também integra projeto para construir caça de sexta geração (Imagem: Leonardo/Reprodução)
O grupo quer aumentar a presença no mercado global por meio de alianças internacionais, incluindo a parceria com a fabricante de armas alemã Rheinmetall e a fabricante turca de drones Baykar Technologies, segundo o jornal.
Além disso, a Leonardo integra o Programa Global de Combate Aéreo, projeto que reúne reúne Itália, Japão e Reino Unido para desenvolver um caça furtivo de sexta geração com conceitos de segurança cibernética, inteligência artificial e tecnologias espaciais até 2035.