A Meta lançou no sábado (5) as versões mais recentes de seu modelo de linguagem de grande escala (LLM). Esta nova geração, que inclui o Scout e o Maverick, estabelece um marco importante na evolução dos sistemas de inteligência artificial, apresentando capacidades multimodais revolucionárias e uma arquitetura inovadora de Mixture of Experts (MoE).
O que torna esses modelos de IA verdadeiramente excepcionais é sua capacidade de processar simultaneamente texto e imagens de forma nativa, além de oferecerem uma eficiência computacional sem precedentes. Com uma janela de contexto impressionante de 10 milhões de tokens, os modelos Llama 4 podem processar e compreender quantidades massivas de informação em uma única análise.
Esta nova geração representa um avanço significativo em relação aos modelos anteriores, superando concorrentes estabelecidos como o GPT-4 e o Gemini 2.0 em diversos benchmarks, enquanto mantém um consumo de recursos computacionais notavelmente menor.
🚨 Vagas abertas para o nosso grupo de ofertas que vai te fazer economizar MUITO!
Llama 4: Apresentação dos modelos
A família Llama 4 introduz uma nova era na computação neural com seus modelos principais: Scout e Maverick. Cada um desses modelos foi projetado com características específicas para atender diferentes necessidades e casos de uso.
Os novos modelos Llama 4 são os primeiros a implementar uma arquitetura de Mixture of Experts (MoE) (MoE) disponível publicamente, representando um marco significativo na democratização da IA avançada.
Especificações do modelo Scout
O Llama 4 Scout é uma obra-prima de engenharia, equipado com 17 bilhões de parâmetros ativos e 16 especialistas. Uma das suas características mais impressionantes é a capacidade de operar em um único GPU Nvidia H100, tornando-o excepcionalmente eficiente em termos de recursos computacionais.
Este modelo se destaca por sua janela de contexto de 10 milhões de tokens, permitindo a análise de documentos extensos e conjuntos de dados complexos em uma única passagem. Essa característica o coloca à frente de competidores como o Gemma 3 e o Mistral 3.1 em diversos testes de desempenho.
Desempenho do modelo Maverick
O Llama 4 Maverick eleva ainda mais o patamar de desempenho, mantendo os 17 bilhões de parâmetros ativos, mas expandindo para 128 especialistas e um total impressionante de 400 bilhões de parâmetros. Seu desempenho superior em tarefas multimodais o coloca em posição de destaque no mercado.

A arquitetura de mistura de especialistas representa uma das maiores inovações do Llama 4. Este sistema inteligente ativa apenas uma fração dos parâmetros totais por token, resultando em uma eficiência extraordinária tanto no treinamento quanto na inferência.
“A multimodalidade nativa com fusão precoce é uma das características mais revolucionárias do Llama 4, permitindo uma integração perfeita entre tokens de texto e imagem no modelo”, destaca a equipe de desenvolvimento da Meta.
Llama 4 Behemoth
O Behemoth, ainda em desenvolvimento, promete ser o mais poderoso da família, com 288 bilhões de parâmetros ativos e quase dois trilhões de parâmetros totais. Este modelo já demonstra resultados superiores aos do GPT-4.5, Claude Sonnet 3.7 e Gemini 2.0 Pro em benchmarks STEM.

Abertura e acessibilidade
Mantendo seu compromisso com a inovação aberta, a Meta disponibilizou os modelos Llama 4 Scout e Maverick para download através do llama.com e Hugging Face. Esta iniciativa permite que desenvolvedores de todo o mundo possam criar aplicações inovadoras utilizando estas tecnologias avançadas.
A disponibilização pública destes modelos representa um passo importante na democratização da IA avançada, permitindo que mais pessoas possam contribuir para o desenvolvimento da tecnologia.