Google revela Gemini 2.5: o futuro da inteligência artificial multimodal
O Google anunciou nesta quinta-feira (29) o lançamento do Gemini 2.5, seu modelo de inteligência artificial mais avançado até agora. A revelação aconteceu durante a palestra principal da conferência Google I/O 2026, realizada em Mountain View, Califórnia. O novo modelo promete melhorias significativas em raciocínio multimodal e eficiência, consolidando a posição da empresa na corrida pela liderança em IA.
O que é o Gemini 2.5?
O Gemini 2.5 é a mais recente versão da família de modelos de IA do Google, que combina capacidades de texto, imagem, áudio, vídeo e código em um único sistema. Diferente de modelos anteriores, o Gemini 2.5 foi projetado para processar e raciocinar sobre múltiplos tipos de dados simultaneamente, oferecendo respostas mais precisas e contextuais.
Segundo o Google, o modelo representa um salto qualitativo em relação às versões anteriores, especialmente em tarefas que exigem compreensão profunda de diferentes formatos de informação. A empresa destacou que o Gemini 2.5 é capaz de analisar um vídeo, transcrever seu áudio, identificar objetos nas imagens e gerar um resumo textual coerente — tudo em tempo real.
Melhorias em raciocínio multimodal
Uma das principais novidades do Gemini 2.5 é sua capacidade aprimorada de raciocínio multimodal. Isso significa que o modelo pode integrar informações de diferentes fontes — como texto, imagens e áudio — para tomar decisões mais complexas. Por exemplo, a IA pode ler um gráfico, interpretar uma legenda em áudio e responder a perguntas que exijam a combinação desses dados.
O Google afirma que o Gemini 2.5 supera seus concorrentes em benchmarks de raciocínio multimodal, como o MMLU (Massive Multitask Language Understanding) e o VQAv2 (Visual Question Answering). Embora números exatos não tenham sido divulgados, a empresa sugere que o modelo estabelece um novo padrão de desempenho.
Eficiência energética e computacional
Outro ponto destacado foi a eficiência. O Gemini 2.5 foi treinado com técnicas de otimização que reduzem o consumo de energia e recursos computacionais sem comprometer a qualidade. Isso é particularmente relevante em um momento em que o custo e o impacto ambiental dos modelos de IA estão sob escrutínio.
A Google afirmou que o Gemini 2.5 pode realizar tarefas complexas com menos poder de processamento do que modelos de tamanho similar, o que pode baratear o acesso a IAs avançadas para empresas e desenvolvedores.
Impacto no mercado e próximos passos
O anúncio do Gemini 2.5 ocorre em um contexto de forte concorrência no setor de IA. Empresas como OpenAI, Anthropic e Meta também têm lançado modelos multimodais, mas o Google aposta na integração com seu ecossistema — incluindo Google Search, YouTube e Google Cloud — para se diferenciar.
O modelo estará disponível para desenvolvedores via API a partir de junho de 2026. O Google também planeja integrá-lo a produtos como o Bard e o Google Assistente nos próximos meses. A empresa prometeu ainda uma versão para consumidores finais até o final do ano.
Reações iniciais
Especialistas presentes na conferência receberam o anúncio com otimismo. Embora ainda não tenham sido realizadas demonstrações ao vivo, as especificações técnicas divulgadas sugerem que o Gemini 2.5 pode realmente representar um avanço significativo. A expectativa agora é por análises independentes que possam confirmar as alegações da empresa.
O Google I/O 2026 continua até sexta-feira, com outras revelações relacionadas a Android, hardware e segurança.
