Claude 3.5 Sonnet Chegou!
· Leitura de 2 minutos
Cheguei: Claude 3.5 Sonnet
Você sabia que agora o CBYK.ai tem suporte aos 3 melhores modelos de inteligência artifical do mercado?
Mas afinal, por que temos tantos modelos? Simples, cada modelo apresenta uma caracteristica, que pode ser aproveitada para uma tarefa especifica:
| Categoria | Claude 3.5 Sonnet | GPT-4o | Gemini 1.5 Pro |
|---|---|---|---|
| Raciocínio em nível de pós-graduação | 59.4% | 53.6% | - |
| Conhecimento em nível de graduação | 88.7% (5-shot) | 88.7% | - |
| Código | 92.0% | 90.2% | 84.1% |
| Matemática multilíngue | 91.6% | 90.5% | 87.5% |
| Raciocínio sobre texto | 87.1% (3-shot) | 83.4% | 74.9% (Variável) |
| Avaliações mistas | 93.1% (3-shot) | - | 89.2% (3-shot) |
| Resolução de problemas matemáticos | 71.1% | 76.6% | 67.7% (4-shot) |
| Matemática de nível escolar | 96.4% | - | 90.8% (11-shot) |
Fonte: https://www.vellum.ai
Ou seja, agora temos o MELHOR modelo do mercado para quase tudo.
Em linhas gerais você pode considerar para:
- Tarefas simples do dia a dia: openai-gpt-3-5 (melhor custo x beneficio)
- Tarefas de coding e resolução de problemas complexos: claude-3-5-sonnet
- Problemas estatísticos e matematicos complexos: openai-gpt-4o
- Nenhum resolveu? Pode tentar o gemini-1-5-pro.
