A startup chinesa DeepSeek lançou em preview o V4, seu modelo mais poderoso até agora: 1,6 trilhão de parâmetros, rodando nativamente em chips Huawei Ascend 950. O preço de inferência é fracionário — e big techs chinesas já estão correndo para garantir os chips Huawei no mercado.
O DeepSeek V4 prova que o ecossistema de IA da China se tornou independente da NVIDIA. Com chips domésticos e preços agressivos, a pressão sobre OpenAI, Anthropic e Google vai aumentar. A guerra de preços de API entrou em nova fase.
Se você usa LLM APIs em produção, compare benchmarks do V4 para tarefas especializadas assim que a versão estável sair. Os preços caíram novamente. Quem paga por token vai sentir no bolso.
A OpenAI abriu o Symphony, especificação open-source para transformar issue trackers (Linear, Jira, GitHub Issues) em sistemas de controle de agentes Codex. O agente trabalha autonomamente no backlog — sem você precisar escrever um prompt a cada tarefa.
A mudança de paradigma é real: antes você "usava IA", agora a IA trabalha no seu roadmap enquanto você dorme. Symphony padroniza como equipes de engenharia escalam agentes autônomos.
Se sua empresa usa Linear ou Jira, vale estudar o Symphony esta semana. A spec é pública — você pode conectar Codex ao seu backlog sem esperar produto acabado da OpenAI.
No Google Cloud Next '26, o Google anunciou a 8ª geração de TPUs: o TPU 8t (treinamento — reduz ciclos de meses para semanas) e o TPU 8i (inferência ultra-rápida, projetado para latência de agentes em produção).
O Google está apostando em chips especializados por função. A separação entre "chip de treino" e "chip de inferência agentica" é uma aposta clara de que agentes vão dominar o consumo de compute em 2026-2027.
Empresas rodando agentes no Google Cloud vão ter acesso a inferência mais barata e rápida assim que esses TPUs forem disponibilizados. Acompanhe a janela de acesso via Cloud Next.
Anthropic e Amazon anunciaram expansão massiva de colaboração: até 5 gigawatts de nova capacidade computacional. Para referência, 5 GW abastece uma cidade de porte médio.
Infraestrutura é o novo moat da IA. Quem controla compute controla quem consegue treinar e servir modelos frontier. A Anthropic está garantindo a escala necessária para competir com o Google e a OpenAI nos próximos 3-5 anos.
Se você usa Claude via API ou AWS Bedrock, isso é boa notícia: mais capacidade significa menos throttling e preços potencialmente menores em 2026-2027.
A Anthropic lançou "Claude for Creative Work" — suite para criar designs, protótipos, slides, one-pagers e mais, diretamente em linguagem natural. Uma extensão do Claude Design (Labs) para uso geral.
A Anthropic deixou de ser "só API de LLM" e entrou em território do Canva e do Figma. Com Claude conhecendo profundamente contexto e intenção, a proposta é: menos cliques, mais entrega criativa.
Para times de marketing e conteúdo: vale testar o Claude for Creative Work para one-pagers e decks de apresentação antes de ir para o Canva. Pode cortar horas de trabalho.
A Cisco lançou kit open-source de proveniência de modelos de IA: verifica se dois modelos de transformers compartilham origem de treinamento. Espécie de "teste de paternidade" para LLMs corporativos.
Com dezenas de modelos no mercado — muitos derivados de outros sem atribuição — as empresas precisam saber exatamente o que estão usando. Compliance, IP e segurança dependem disso.
Se você cuida de govornança de IA, adicione esse toolkit ao seu processo de avaliação de modelos. Especialmente útil para identificar se um "modelo proprietário" é, na verdade, um fine-tune de LLaMA.
O Cursor, startup de 4 anos focada em dev tools com IA, está em negociações avançadas para captar US$2B+ a um valuation pré-money de US$50B. Projeção: ARR acima de US$6B no final de 2026.
US$50B para uma empresa de ferramentas de desenvolvimento é sinal de como o mercado está precificando o futuro do trabalho de engenharia. Para comparação: a Salesforce levou décadas para atingir essa marca.
Se você ainda não usa o Cursor (ou similar), está atrasado. Com esse valuation, espere mais recursos e mais agressividade no produto. A janela de vantagem competitiva para quem adota cedo está se fechando.
A Anthropic anunciou o Glasswing: iniciativa que reúne AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA e Palo Alto Networks para proteger softwares críticos do mundo.
Nunca tantas empresas rivais se reuniram em torno de segurança de software de forma coordenada. Com modelos de IA gerando código em escala, o risco de vulnerabilidades automatizadas aumentou — e a indústria está respondendo.
Se você usa infraestrutura crítica ou tem código gerado por IA em produção, acompanhe o Glasswing. Os padrões de segurança que eles definirão vão virar compliance corporativo.
A OpenAI anunciou o GPT-Rosalind, modelo especializado em life sciences que supera significativamente seus modelos atuais — mas não o está liberando publicamente. O motivo: risco à segurança biológica. A Time reportou que "too dangerous to release" está virando o novo normal na IA.
Estamos num ponto em que os próprios laboratórios reconhecem que seus modelos superam os limites do que é seguro liberar. Isso muda fundamentalmente o debate sobre regulação e acesso a IA de ponta.
Para empresas de saúde, farmácia e biotech: se modelos tão poderosos existem mas não são liberados, o acesso vai ser via parceria direta com os labs. Comece a cultivar essa relação agora.
→ reuters.com
→ phoronix.com
→ anthropic.com/news/anthropic-nec
→ techcrunch.com
→ blog.google