Introduzindo o Novo Claude 3.5 Sonnet e o Claude 3.5 Haiku
Esta semana, a Anthropic anuncia uma versão atualizada do Claude 3.5 Sonnet e um novo modelo, o Claude 3.5 Haiku. Primeiramente, o Claude 3.5 Sonnet aprimorado apresenta melhorias em todas as áreas em comparação com seu predecessor. Destaca-se com ganhos particularmente significativos na programação – um campo onde já liderava. Além disso, o Claude 3.5 Haiku iguala o desempenho do Claude 3 Opus, o maior modelo anterior, em muitas avaliações. Mantém o mesmo custo e uma velocidade semelhante à geração anterior do Haiku.
Adicionalmente, estão a introduzir uma nova capacidade revolucionária em versão beta pública: o uso de computadores. Especificamente, disponível hoje na API, os programadores podem direcionar o Claude para usar computadores como as pessoas fazem. Isso inclui olhar para um ecrã, mover um cursor, clicar em botões e digitar texto. Consequentemente, o Claude 3.5 Sonnet torna-se o primeiro modelo de IA de ponta a oferecer o uso de computadores em beta pública. No entanto, nesta fase, ainda é experimental – por vezes desajeitado e propenso a erros. Portanto, estão a lançar o uso de computadores antecipadamente para obter feedback dos programadores. Esperamos que a capacidade melhore rapidamente ao longo do tempo.
#IAInovadora #ComputaçãoAvançada 🖥️🤖
Além disso, empresas como Asana, Canva, Cognition, DoorDash, Replit e The Browser Company já começaram a explorar estas possibilidades. Elas estão realizando tarefas que exigem dezenas e, por vezes, até centenas de passos para completar. Por exemplo, a Replit está a usar as capacidades do Claude 3.5 Sonnet com uso de computador e navegação de interface. Ela está a desenvolver uma funcionalidade-chave que avalia aplicações à medida que são construídas para o seu produto Replit Agent.
O Claude 3.5 Sonnet atualizado já está disponível para todos os utilizadores.
A partir de hoje, os programadores podem construir com a versão beta de uso de computador nas APIs da Anthropic, Amazon Bedrock e Vertex AI da Google Cloud. Além disso, o novo Claude 3.5 Haiku será lançado ainda este mês.
O Claude 3.5 Sonnet atualizado apresenta melhorias abrangentes nos benchmarks da indústria. Ele obteve ganhos particularmente fortes em tarefas de programação e uso de ferramentas. Especificamente, na programação, ele melhora o desempenho no SWE-bench Verified de 33,4% para 49,0%. Dessa forma, supera todos os modelos disponíveis publicamente. Além disso, ele também aprimora o desempenho no TAU-bench, uma tarefa de uso de ferramentas. No domínio de retalho, o desempenho passa de 62,6% para 69,2%. Já no domínio mais desafiador das companhias aéreas, melhora de 36,0% para 46,0%.
#IAProgresso #ProgramaçãoInteligente 💻📈
O Claude 3.5 Haiku é a próxima geração do modelo mais rápido.
Além disso, ao usar computadores, eles estão a tentar algo fundamentalmente novo. Em vez disso, ao invés de criarem ferramentas específicas para ajudar o Claude a completar tarefas individuais, optaram por ensinar-lhe competências gerais de computação. Isso permite que ele utilize uma ampla gama de ferramentas e programas de software padrão, projetados para pessoas. Consequentemente, os programadores podem aproveitar essa capacidade nascente para automatizar processos repetitivos, construir e testar software, e realizar tarefas de final aberto, como pesquisa.
À medida que aprendemos com as implantações iniciais desta tecnologia, ainda em estágio inicial, seremos capazes de compreender melhor tanto o potencial quanto as implicações de sistemas de IA cada vez mais capazes. Portanto, convidamos-vos a explorar os novos modelos do Claude e a versão beta pública do uso de computadores.
Finalmente, acreditamos que estes desenvolvimentos abrirão novas possibilidades para o nosso trabalho com o Claude.
#FuturoIA #Claude #Anthropic