Google revela Gemini 2.5: o futuro da inteligência artificial multimodal

O Google anunciou nesta quinta-feira (29) o lançamento do Gemini 2.5, seu modelo de inteligência artificial mais avançado até agora. A revelação aconteceu durante a palestra principal da conferência Google I/O 2026, realizada em Mountain View, Califórnia. O novo modelo promete melhorias significativas em raciocínio multimodal e eficiência, consolidando a posição da empresa na corrida pela liderança em IA.

O que é o Gemini 2.5?

O Gemini 2.5 é a mais recente versão da família de modelos de IA do Google, que combina capacidades de texto, imagem, áudio, vídeo e código em um único sistema. Diferente de modelos anteriores, o Gemini 2.5 foi projetado para processar e raciocinar sobre múltiplos tipos de dados simultaneamente, oferecendo respostas mais precisas e contextuais.

Segundo o Google, o modelo representa um salto qualitativo em relação às versões anteriores, especialmente em tarefas que exigem compreensão profunda de diferentes formatos de informação. A empresa destacou que o Gemini 2.5 é capaz de analisar um vídeo, transcrever seu áudio, identificar objetos nas imagens e gerar um resumo textual coerente — tudo em tempo real.

Melhorias em raciocínio multimodal

Uma das principais novidades do Gemini 2.5 é sua capacidade aprimorada de raciocínio multimodal. Isso significa que o modelo pode integrar informações de diferentes fontes — como texto, imagens e áudio — para tomar decisões mais complexas. Por exemplo, a IA pode ler um gráfico, interpretar uma legenda em áudio e responder a perguntas que exijam a combinação desses dados.

O Google afirma que o Gemini 2.5 supera seus concorrentes em benchmarks de raciocínio multimodal, como o MMLU (Massive Multitask Language Understanding) e o VQAv2 (Visual Question Answering). Embora números exatos não tenham sido divulgados, a empresa sugere que o modelo estabelece um novo padrão de desempenho.

Eficiência energética e computacional

Outro ponto destacado foi a eficiência. O Gemini 2.5 foi treinado com técnicas de otimização que reduzem o consumo de energia e recursos computacionais sem comprometer a qualidade. Isso é particularmente relevante em um momento em que o custo e o impacto ambiental dos modelos de IA estão sob escrutínio.

A Google afirmou que o Gemini 2.5 pode realizar tarefas complexas com menos poder de processamento do que modelos de tamanho similar, o que pode baratear o acesso a IAs avançadas para empresas e desenvolvedores.

Impacto no mercado e próximos passos

O anúncio do Gemini 2.5 ocorre em um contexto de forte concorrência no setor de IA. Empresas como OpenAI, Anthropic e Meta também têm lançado modelos multimodais, mas o Google aposta na integração com seu ecossistema — incluindo Google Search, YouTube e Google Cloud — para se diferenciar.

O modelo estará disponível para desenvolvedores via API a partir de junho de 2026. O Google também planeja integrá-lo a produtos como o Bard e o Google Assistente nos próximos meses. A empresa prometeu ainda uma versão para consumidores finais até o final do ano.

Reações iniciais

Especialistas presentes na conferência receberam o anúncio com otimismo. Embora ainda não tenham sido realizadas demonstrações ao vivo, as especificações técnicas divulgadas sugerem que o Gemini 2.5 pode realmente representar um avanço significativo. A expectativa agora é por análises independentes que possam confirmar as alegações da empresa.

O Google I/O 2026 continua até sexta-feira, com outras revelações relacionadas a Android, hardware e segurança.

#inteligência artificial#gemini 2.5#google#google io 2026#modelos de ia

Google anuncia Gemini 2.5 na Google I/O 2026: modelo de IA promete avanços em raciocínio multimodal