Um Novo Modelo de IA de Vanguarda
A Anthropic está lançando um Novo Modelo de IA de Vanguarda chamado Claude 3.7 Sonnet. A Empresa o Projetou para “Pensar” sobre as Perguntas pelo Tempo que os Usuários desejarem.
A Anthropic chama o Claude 3.7 Sonnet de o primeiro “modelo híbrido de raciocínio de IA” do setor. Pois é um modelo único que pode fornecer:
- respostas em tempo real
- e respostas mais ponderadas e “pensadas”
às perguntas. Os usuários podem escolher se querem ativar as habilidades de “Raciocínio” do modelo de IA. Isso faz com que o Claude 3.7 Sonnet “pense” por um período curto ou longo.
O modelo representa o esforço mais amplo da Anthropic para simplificar a experiência do usuário com seus Produtos de IA. Atualmente, a maioria dos chatbots de IA tem um seletor de modelos assustador. O qual força os usuários a escolher entre várias opções diferentes que variam em Custo e Capacidade. Laboratórios como o Anthropic preferem que você não tenha que pensar nisso.
O ideal é que um modelo faça todo o trabalho.
O Lançamento da Claude 3.7 Sonnet
O Claude 3.7 Sonnet está sendo lançado para todos os usuários e desenvolvedores na segunda-feira, informou a Anthropic. Mas somente as pessoas que pagarem pelos planos premium do chatbot Claude da Anthropic terão acesso aos recursos de raciocínio do modelo. Os usuários gratuitos do Claude receberão a versão padrão, sem raciocínio, do Claude 3.7 Sonnet. Que, segundo a Anthropic, supera seu modelo anterior de IA de fronteira, o Claude 3.5 Sonnet. (Sim, a empresa pulou um número.)
O Claude 3.7 Sonnet custa US$ 3 por milhão de tokens de entrada (o que significa que você poderia
- inserir cerca de 750.000 palavras, mais palavras do que toda a série “O Senhor dos Anéis”, no Claude por US$ 3)
- e US$ 15 por milhão de tokens de saída.
Isso o torna mais caro do que
- o o3-mini da OpenAI (US$ 1,10 por 1 milhão de tokens de entrada/US$ 4,40 por 1 milhão de tokens de saída)
- e o R1 da DeepSeek (55 centavos por 1 milhão de tokens de entrada/US$ 2,19 por 1 milhão de tokens de saída),
mas lembre-se de que o o3-mini e o R1 são modelos estritamente de raciocínio, e não híbridos como o Claude 3.7 Sonnet.
Os Novos Modos de Raciocínio da Anthropic
O Claude 3.7 Sonnet é o Primeiro Modelo de IA do Anthropic que pode “Raciocinar”. Uma Técnica que muitos Laboratórios de IA têm Utilizado à Medida que os Métodos Tradicionais de Aprimoramento do Desempenho da IA Diminuem.
Modelos de raciocínio como
- o o3-mini, o R1,
- o Gemini 2.0 Flash Thinking do Google
- e o Grok 3 (Think) da xAI
usam mais tempo e poder de computação antes de responder às perguntas. Os modelos dividem os problemas em etapas menores, o que tende a melhorar a precisão da resposta final. Os modelos de raciocínio não estão pensando ou raciocinando necessariamente como um ser humano. Mas seu processo é modelado de acordo com a dedução.
Eventualmente, a Anthropic gostaria que o Claude descobrisse por quanto tempo deveria “pensar” nas perguntas por conta própria. Isso sem precisar que os usuários selecionassem os controles com antecedência, disse Dianne Penn, líder de produto e pesquisa da Anthropic, em entrevista ao TechCrunch.
“Da mesma forma que os seres humanos não têm dois cérebros separados:
- para perguntas que podem ser respondidas imediatamente
- e para aquelas que exigem reflexão”,
escreveu a Anthropic em um post de blog compartilhado com o TechCrunch. ‘Consideramos o raciocínio simplesmente como um dos recursos que um modelo de vanguarda deve ter:
- para ser integrado sem problemas a outros recursos,
- em vez de algo a ser fornecido em um modelo separado’.
A Anthropic diz que está permitindo que o Claude 3.7 Sonnet mostre sua fase de planejamento interno por meio de um “bloco de notas visível”. Penn disse ao TechCrunch que os usuários verão todo o processo de raciocínio do Claude para a maioria dos prompts. Mas que algumas partes podem ser editadas por motivos de confiança e segurança.
Processo de Pensamento do Claude
A Anthropic afirma ter Otimizado os Modos de Raciocínio do Claude para Tarefas do Mundo Real, como
- Problemas Difíceis de Codificação
- ou Tarefas Agênticas.
Os Desenvolvedores que Utilizam a API da Anthropic podem Controlar o “Orçamento” para Pensar, Trocando a Velocidade e o Custo pela Qualidade da Resposta.
Em um teste para medir tarefas de Codificação de Palavras Reais, o SWE-Bench, o Claude 3.7 Sonnet teve 62,3% de Precisão, em Comparação com o Modelo o3-mini da OpenAI, que obteve 49,3%. Em outro teste para medir a Capacidade de um modelo de IA de Interagir com Usuários Simulados e APIs Externas em um Ambiente de Varejo, o TAU-Bench, o Claude 3.7 Sonnet obteve 81,2% de Pontuação, em Comparação com o modelo o1 da OpenAI, que obteve 73,5%.
A Anthropic também afirma que o Claude 3.7 Sonnet se recusará a responder perguntas com menos frequência do que seus modelos anteriores, alegando que o modelo é capaz de fazer distinções mais sutis entre Solicitações Prejudiciais e Benignas. A Anthropic afirma que reduziu as recusas desnecessárias em 45% em comparação com o Claude 3.5 Sonnet. Isso ocorre em um momento em que alguns outros laboratórios de IA estão repensando sua abordagem para restringir as respostas de seus chatbots de IA.
Código Claude
Além do Claude 3.7 Sonnet, a Anthropic também está Lançando uma Ferramenta de Codificação Agêntica chamada Claude Code. Lançada como uma prévia de Pesquisa, a Ferramenta Permite que os Desenvolvedores Executem Tarefas Específicas por Meio do Claude Diretamente de seus Terminais.
Em uma Demonstração, os Funcionários da Anthropic Mostraram como o Claude Code pode Analisar um Projeto de Codificação com um Comando Simples, como “Explique a Estrutura deste Projeto”. Usando o inglês simples na linha de comando, um Desenvolvedor pode Modificar uma Base de Código. O Claude Code Descreverá suas Edições à Medida que fizer Alterações e até mesmo testará um projeto em busca de erros ou o enviará para um Repositório do GitHub.
Inicialmente, o Claude Code estará Disponível para um Número Limitado de UsuAAAAAAAários por “ordem de chegada”, disse um Porta-Voz da Anthropic ao TechCrunch.
A Anthropic está lançando o Claude 3.7 Sonnet em um momento em que os Laboratórios de IA estão enviando Novos Modelos de IA em um Ritmo Alucinante. Historicamente, a Anthropic tem adotado uma Abordagem Mais Metódica e Focada na Segurança. Mas, desta vez, a Empresa está Procurando Liderar o Grupo.
A questão, porém, é por quanto tempo. A OpenAI pode estar perto de lançar um modelo de IA híbrido próprio; o CEO da empresa, Sam Altman, disse que ele chegará em “meses”.
Fonte: TechCrunch
Leia outras notícias em nosso blog
Precisa de um Servidor Web? Dê uma olhada em nossos serviços