Video thumbnail

Grok 4 foi considerado Extraordinário e Assustador (Lançado HOJE)

Lucas Montano10 de julho de 2025

O recém-lançado Grok 4 da xAI de Elon Musk tem gerado um burburinho considerável no cenário da inteligência artificial, com alguns entusiastas chegando a sugerir que atingimos o nível de AGI (Inteligência Artificial Geral). Embora essa afirmação seja prematura, os números e capacidades demonstradas pelo Grok 4 são de fato impressionantes. Este modelo, especialmente as versões Grok 4 Expert e Grok 4 Heavy, prometem avanços significativos, especialmente na capacidade de raciocínio. A xAI lançou o Grok 4 logo após algumas controvérsias com o Grok 3, o que levanta questões sobre se o lançamento foi uma coincidência ou uma estratégia de marketing bem-cronometrada. O Grok 4 está disponível para assinantes do X Premium e possui um plano avulso para a versão Heavy que custa $300 por mês ou $3.000 por ano. No entanto, sua disponibilidade via API para desenvolvedores ainda não foi totalmente liberada, o que sugere um foco inicial na integração com a plataforma X para uso direto pelos usuários.

Funcionalidades e Testes Práticos do Grok 4

O Grok 4 se destaca por suas funcionalidades de busca na internet, que o tornam uma ferramenta poderosa para obter informações atualizadas, incluindo dados de tweets. O teste inicial para avaliar suas capacidades envolveu uma pergunta simples: contar o número de "R's" na palavra "morango" e, em seguida, gerar uma lista de dez palavras que contivessem a mesma quantidade de "R's". O Grok 4 obteve sucesso nesse teste, demonstrando sua habilidade de contagem e geração de listas de palavras com características específicas.

O desafio mais complexo foi a criação de um jogo de palavras cruzadas. Para um modelo de IA, gerar um jogo de palavras cruzadas exige um raciocínio sofisticado, incluindo pré-processamento de palavras, filtragem, criação de estruturas de dados eficientes para busca, e a implementação de um algoritmo de backtracking (busca com retrocesso). Este algoritmo é fundamental para construir a grade do jogo, onde as palavras se cruzam, e para lidar com as restrições de tamanho e posicionamento. O teste pediu ao Grok 4 para criar um jogo de palavras cruzadas com dez nomes de frameworks e bibliotecas JavaScript. Durante o processo, o Grok 4 demonstrou a capacidade de buscar os nomes mais populares de frameworks JavaScript, um passo crucial para obter o "pool" de palavras necessário. No entanto, o modelo não exibiu seu "thought process" (processo de pensamento) durante a geração, apenas indicando um tempo de raciocínio.

Análise da Janela de Contexto e Custo do Grok 4

A janela de contexto do Grok 4 é de 256.000 tokens, o que é semelhante ao Claude 3.7, mas consideravelmente menor que o Gemini 2.5 Pro do Google, que possui uma janela de 1 milhão de tokens. Em termos de custo, o Grok 4, via API, cobra $3 por milhão de tokens de input e $15 por milhão de tokens de output. Isso o posiciona como um dos modelos mais caros disponíveis atualmente via API, mais caro que o DeepSeek V2 e com custos de output comparáveis aos do Gemini, mas com um input significativamente mais caro.

Apesar do custo elevado, a questão é se o Grok 4 justifica o investimento, especialmente se ele conseguir resolver problemas que outros modelos levariam múltiplas interações para solucionar. Em um teste prático, o Grok 4 criou um HTML para o jogo de palavras cruzadas. No entanto, ao ser executado, o jogo não forneceu dicas ou letras iniciais, tornando-o difícil de jogar. Mesmo após solicitar dicas adicionais, o Grok 4 não conseguiu fornecer dicas para todas as palavras, e algumas das respostas, como "D3" para uma palavra de duas letras, não se encaixavam na grade gerada, indicando que o modelo falhou em resolver completamente o problema de intersecção das palavras.

O Grok 4 é a primeira vez na minha experiência que uma IA foi capaz de resolver questões de engenharia difíceis e do mundo real, onde as respostas não podem ser encontradas em nenhum lugar da internet ou em livros e vai ficar muito melhor.

Essa é uma citação de Elon Musk no Twitter (agora X), que destaca a capacidade do Grok 4 de solucionar problemas complexos, sem depender de informações preexistentes na internet ou em livros. Isso sugere um avanço significativo na capacidade de raciocínio da IA.

Grok 4 e o AAI (Artificial Analytical Intelligence Index)

Em gráficos de inteligência artificial, o Grok 4 demonstrou a maior pontuação no AAI (Artificial Analytical Intelligence Index), uma métrica que quantifica a capacidade de um modelo de analisar e resolver problemas. Essa pontuação, que o colocou em 73, superando modelos como o GPT-3 Pro da OpenAI (71), é considerada impressionante. O Grok 4 também se destacou no "Humanity's Last Exam", respondendo corretamente a 44% das questões, um exame considerado extremamente difícil para humanos, comparável a um nível de PhD.

Modelo	Janela de Contexto (Tokens)	Custo de Input (por 1 milhão de tokens)	Custo de Output (por 1 milhão de tokens)	Pontuação AAI	% no Humanity's Last Exam
Grok 4	256.000	$3	$15	73	44%
Cloud 3.7	500.000	N/A	N/A	N/A	N/A
Gemini 2.5 Pro	1.000.000	$1.25	$10	N/A	N/A
DeepSeek V2	N/A	$0.14	$0.28	N/A	N/A
GPT-4	N/A	$15	N/A	N/A	N/A
GPT-3 Pro	N/A	N/A	N/A	71	N/A

Apesar desses resultados promissores, a afirmação de que o Grok 4 representa a AGI ainda é considerada exagerada. No entanto, a capacidade do modelo de raciocinar e resolver problemas novos, sem conhecimento pré-treinado específico, coloca-o em uma posição de destaque. Além disso, um tweet interessante apontou que o Grok 4 possui uma alta "taxa de denúncia" ou "snitch rate", quase 100%, o que indica uma proatividade em reportar certas informações, um aspecto curioso e potencialmente controverso de seu comportamento.

Adoção e Futuro da IA

O Grok 4 está disponível para assinantes do X Premium, com um custo de $300 por mês para o plano "Super Grok Heavy", ou $3.000 por ano. Essa estratégia de monetização difere da OpenAI, que foca mais em agregar ferramentas à sua plataforma. A tendência de desenvolvimento no campo da IA está se movendo para além da mera capacidade do modelo, focando em como esses modelos são usados e a interface do usuário. A OpenAI, por exemplo, estaria desenvolvendo um navegador web com tecnologia de IA para competir com o Google Chrome, seguindo uma tendência onde diversas empresas buscam integrar modelos de IA em plataformas e produtos específicos. Essa visão de que a interface de interação com diversos modelos de IA é crucial para o futuro da tecnologia é um ponto central na adoção e desenvolvimento de novas ferramentas.

Takeaways

Lançamento e Acessibilidade: O Grok 4 da xAI, lançado recentemente, está disponível para assinantes do X Premium. A versão "Super Grok Heavy" custa $300/mês ou $3.000/ano, tornando-o um dos modelos mais caros via API.
Capacidade de Raciocínio: O Grok 4 demonstrou impressionante capacidade de raciocínio, resolvendo questões complexas e gerando resultados que não podem ser encontrados pré-treinados, o que o diferencia de outros modelos.
Janela de Contexto e Custo da API: Com uma janela de contexto de 256.000 tokens, o Grok 4 é competitivo, mas inferior a modelos como o Gemini 2.5 Pro. Seu custo por token via API é elevado em comparação com o DeepSeek V2 e o Gemini.
Desempenho em Benchmarks: O Grok 4 pontuou mais alto no AAI (Artificial Analytical Intelligence Index) e obteve 44% no "Humanity's Last Exam", superando outros modelos e demonstrando alta inteligência analítica e fluida.
Proatividade e Tendências Futuras: O modelo exibe uma alta "taxa de denúncia", um aspecto proativo e curioso. A tendência do mercado é focar na integração e na interface de interação dos modelos, como a suposta criação de um navegador de IA pela OpenAI.

References

This article was AI generated. It may contain errors and should be verified with the original source.

ClarifyTube

© 2025 ClarifyTube. All rights reserved.