Radar IA — 04/06/2026

Modelos & Lançamentos

modelos · 03/06/2026

Crítico

★★★★★

Google lança Gemma 4 12B: open-source, multimodal e roda no seu laptop com 16 GB de RAM

O que aconteceu: O Google DeepMind lançou o Gemma 4 12B em 03/06, um modelo open-source com arquitetura unificada — sem encoders separados. Visão e áudio entram diretamente no backbone do LLM. Apache 2.0. Já disponível no Hugging Face e Ollama.

Por que importa: A família Gemma já tem 150 milhões de downloads. O 12B performa perto do Gemma 4 26B MoE com metade da memória. É o primeiro modelo mid-size com áudio nativo da série — e roda offline em MacBooks e PCs comuns.

💡 Insight Prático Todo mundo fala de GPT-5 e Claude Opus como se fossem os únicos. O Google acaba de provar que você consegue rodar um modelo multimodal de ponta sem pagar nada, sem mandar seus dados para nenhum servidor. Se sua empresa lida com dados sensíveis, esse modelo muda o cálculo de privacidade completamente. Baixe agora: ollama run gemma4

blog.google — 03/06/2026

modelos · 02/06/2026

Alto

★★★★★

NVIDIA lança Nemotron 3 Ultra 550B: o modelo open-weight mais forte dos EUA — mas ainda fica atrás dos chineses

O que aconteceu: A NVIDIA lançou o Nemotron 3 Ultra, modelo Mixture-of-Experts de 550 bilhões de parâmetros. Score 48 no Artificial Analysis Intelligence Index — recorde entre open-weights americanos.

Por que importa: O número parece impressionante até você olhar o ranking global: modelos chineses de fronteira ainda ficam à frente no mesmo índice. O "mais poderoso dos EUA" ainda carrega um asterisco. A corrida de capacidade técnica aberta está sendo vencida pelo lado que ninguém esperava.

💡 Insight Prático Para uso corporativo open-source em infraestrutura americana, Nemotron 3 Ultra é agora a nova referência. Para performance máxima sem restrições de origem, o panorama é mais complexo — e vale monitorar os modelos chineses com distribuição no Ocidente.

AI Insiders — 02/06/2026

modelos · 02/06/2026

Alto

★★★★

Opus 4.8 triplica o score do GPT-5.5 no benchmark de raciocínio mais difícil do mercado

O que aconteceu: Resultados publicados mostram o Claude Opus 4.8 com score nos 60s no ARC-AGI-3, enquanto o GPT-5.5 marca nos 20s no mesmo benchmark — a maior diferença registrada entre os dois labs em raciocínio abstrato.

Por que importa: O ARC-AGI-3 é o benchmark mais difícil disponível para medir raciocínio não-memorístico. Uma diferença de 3x não é ruído estatístico — é um gap de capacidade real. Com o IPO da Anthropic se aproximando, esse número vai aparecer no prospecto.

💡 Insight Prático Se você usa IA para tarefas analíticas complexas — diagnóstico, planejamento, resolução de problemas multi-etapas — os benchmarks de reasoning agora têm peso real na escolha de fornecedor. Vale revisar qual modelo está na sua stack.

AI Insiders — 02/06/2026

Impactos

impactos · 01/06/2026

Médio

★★★★

Stanford HAI: dois agentes de IA colaborando ficam PIORES do que um único agente sozinho

O que aconteceu: Pesquisadores da Stanford HAI publicaram estudo mostrando que dois modelos de código IA trabalhando em conjunto performam abaixo de um único modelo operando solo em tarefas de programação.

Por que importa: Expõe uma falha fundamental nas arquiteturas multi-agente — o hype de "mais agentes = resultados melhores" não se sustenta quando você olha os dados. A degradação ocorre por ruído de comunicação, conflito de contexto e ausência de orquestração real.

💡 Insight Prático Antes de escalar sua arquitetura para múltiplos agentes, meça se o ganho é real no seu caso específico. Um agente único bem configurado, com contexto correto e ferramentas certas, bate dois agentes mal coordenados na maioria dos cenários práticos. Simplifique antes de escalar.

Stanford HAI — 01/06/2026

Mercado & Investimentos

mercado · 04/06/2026

Médio

★★★★

DeepSeek vai entrar na corrida global de fundraising — laboratório chinês segue o manual das americanas

O que aconteceu: A Bloomberg reportou hoje que o laboratório chinês DeepSeek está prestes a entrar na frenesi global de captação de recursos, buscando investimento externo em larga escala — seguindo o movimento de Anthropic ($65B) e OpenAI.

Por que importa: O DeepSeek já construiu modelos de fronteira a uma fração do custo das americanas. Com capital externo, a diferença de velocidade de desenvolvimento pode aumentar significativamente — num cenário em que as restrições de exportação de chips americanos estão acelerando a inovação em hardware próprio na China.

💡 Insight Prático O setor de IA passou de duas corridas paralelas (EUA x China) para uma corrida convergente de capital. Empresas que dependem de um único fornecedor de modelos devem diversificar sua avaliação de provedores — incluindo os chineses disponíveis com distribuição no Ocidente.

Bloomberg — 04/06/2026

Radar Rápido

Google Dreambeans: app que transforma sua vida em histórias ilustradas por IA

App iOS/Android que usa Gmail, Calendar, Photos e histórico do YouTube para gerar histórias ilustradas diárias do usuário. Por enquanto só para assinantes Google AI Ultra nos EUA.

TechCrunch · 03/06

Lovable fecha deal multianual com Google Cloud: uso vai crescer 5x

A startup de vibe-coding assinou contrato multianual com Google Cloud que inclui acesso expandido a Claude e Gemini, e integração no Gemini Enterprise Agent Gallery.

TechCrunch · 03/06

NVIDIA Cosmos 3: primeiro modelo open-weight de IA física com modalidade de ação

Cosmos 3 muda o pré-treino em robótica: em vez de coletar dados do zero, equipes agora fazem fine-tuning em cima de um modelo de fundação que já entende o mundo físico e gera ações diretas.

AI Insiders · 02/06

JetBrains Mellum 2 12B MoE: modelo de código IDE-nativo com inferência barata

Modelo MoE de 12B parâmetros desenhado especificamente para completion, tool use e workflows agênticos dentro de IDEs JetBrains. Ativação esparsa reduz custo de inferência significativamente.

AI Insiders · 02/06

xAI/SpaceX: roadshow começa dia 8 para IPO de US$1,75 trilhão no dia 12

Conforme rastreado pelo AI Funding Tracker, a xAI/SpaceX inicia roadshow em 8 de junho mirando o maior IPO de tecnologia da história em 12 de junho, com valuation alvo de US$1,75 trilhão.

AI Funding Tracker · 01/06

Modelos & Lançamentos

Google lança Gemma 4 12B: open-source, multimodal e roda no seu laptop com 16 GB de RAM

NVIDIA lança Nemotron 3 Ultra 550B: o modelo open-weight mais forte dos EUA — mas ainda fica atrás dos chineses

Opus 4.8 triplica o score do GPT-5.5 no benchmark de raciocínio mais difícil do mercado

Ferramentas & Produtos

OpenAI encerra exclusividade Azure: modelos frontier e Codex chegam na AWS

Regulação & Governança

Pioneirismo: UK CMA obriga Google a deixar publishers optarem fora da AI Search — primeiro caso global

Impactos

Stanford HAI: dois agentes de IA colaborando ficam PIORES do que um único agente sozinho

Mercado & Investimentos

DeepSeek vai entrar na corrida global de fundraising — laboratório chinês segue o manual das americanas

Radar Rápido