Bien démarrer avec Claude Fable 5 : guide pratique pour développeurs

Anthropic a lancé Claude Fable 5 le 9 juin 2026, et le message tient en une ligne : c’est le premier modèle Claude de classe Mythos disponible publiquement, facturé 10 $ par million de tokens en entrée et 50 $ par million de tokens en sortie, avec une fenêtre de contexte de 1M de tokens et une sortie maximale de 128k (lancement Anthropic, documentation des modèles, documentation tarifaire). Si vous l’évaluez aujourd’hui, ne commencez pas par un tweet de benchmark. Prenez un vrai workflow difficile dans votre backlog, branchez-le, plafonnez la dépense, et mesurez si le nombre réduit d’allers-retours compense le compteur plus élevé.

Croquis d’architecture façon couverture montrant une application développeur appelant Claude Fable 5 par deux chemins : API Anthropic directe

Ce qu’est réellement Claude Fable 5

Claude Fable 5 est la version publique, chez Anthropic, d’un modèle de classe Mythos. Anthropic décrit la classe Mythos comme un niveau au-dessus d’Opus, avec Fable 5 rendu sûr pour un usage général et Mythos 5 réservé à un accès de confiance limité via Project Glasswing (Anthropic). En termes pratiques pour développeurs, Fable 5 est le modèle “à utiliser quand Opus ne suffit plus”.

L’ID du modèle API est :

claude-fable-5

La vue d’ensemble des modèles d’Anthropic liste ces spécifications actuelles (docs Anthropic) :

Modèle	ID API	Fenêtre de contexte	Sortie max	Entrée	Sortie
Claude Fable 5	`claude-fable-5`	1M tokens	128k tokens	$10 / MTok	$50 / MTok
Claude Opus 4.8	`claude-opus-4-8`	1M tokens	128k tokens	$5 / MTok	$25 / MTok
Claude Sonnet 4.6	`claude-sonnet-4-6`	1M tokens	64k tokens	$3 / MTok	$15 / MTok
Claude Haiku 4.5	`claude-haiku-4-5-20251001`	200k tokens	64k tokens	$1 / MTok	$5 / MTok

Ce tableau dit clairement où se place Fable. Ce n’est pas le choix par défaut bon marché. C’est le modèle à essayer quand la tâche est longue, brouillonne, et coûteuse à rater : migrations multi-repos, codage agentique, raisonnement sur des documents juridiques ou financiers, longs travaux de planification, et workflows où les modèles précédents perdaient du temps en boucles de correction.

Il y a un comportement de sécurité important : Anthropic indique que Fable 5 utilise des classificateurs pour des domaines incluant la cybersécurité, la biologie et la chimie, ainsi que la distillation. Les requêtes signalées basculent vers Claude Opus 4.8, et les utilisateurs sont informés quand cela arrive (Anthropic). Anthropic dit aussi que plus de 95 % des premières sessions Fable n’ont déclenché aucun fallback. Si votre produit touche à ces domaines, testez explicitement ce chemin de fallback.

Tarification : le vrai compteur

Le prix catalogue est clair : 10 $ / MTok en entrée, 50 $ / MTok en sortie. Le prompt caching suit la structure de multiplicateurs standard d’Anthropic : écritures de cache 5 minutes à 1,25x l’entrée, écritures de cache 1 heure à 2x l’entrée, et lectures de cache à 0,1x l’entrée (tarifs Anthropic). Pour Fable 5, cela donne :

Élément facturé	Prix Fable 5
Entrée	$10 / MTok
Sortie	$50 / MTok
Écriture de cache 5 minutes	$12.50 / MTok
Écriture de cache 1 heure	$20 / MTok
Lecture / rafraîchissement de cache	$1 / MTok

La page produit Fable d’Anthropic indique aussi que l’inférence limitée aux États-Unis est disponible à un tarif 1,1x pour les tokens d’entrée et de sortie (page Fable Anthropic). C’est important si vous construisez pour des clients avec des exigences de résidence des données.

Pour OneHop, la page du modèle liste actuellement anthropic/claude-fable-5, une étiquette de contexte 1000K, la disponibilité d’Anthropic Messages, et une offre de 10 $ de crédit gratuit pour les nouveaux comptes sans carte requise (OneHop). La page OneHop affiche aussi une tarification remisée par rapport au tarif officiel. Si vous voulez le chemin d’évaluation le plus rapide sans configurer la facturation directe Anthropic, commencez avec Claude Fable 5 sur OneHop ou démarrez avec 10 $ gratuits.

Graphique compact en barres comparant le prix d’entrée et de sortie par million de tokens pour Fable 5, Opus 4.8, Sonnet 4.6 et Haiku 4.5,

Des benchmarks sans brouillard

Anthropic dit que Fable 5 est “à l’état de l’art sur presque tous les benchmarks testés” et qu’il est le plus fort sur les tâches longues et complexes (Anthropic). Le tableau de benchmarks dans l’article de lancement d’Anthropic est publié sous forme d’image, donc traitez les chiffres recopiés ailleurs comme déclarés par le fournisseur, sauf si l’évaluateur héberge l’exécution.

Les chiffres que les développeurs comparent le plus sont très orientés code :

Benchmark	Claude Fable 5	Claude Opus 4.8	Contexte source
SWE-Bench Pro	80.3%	69.2%	Rapporté par des synthèses tierces du tableau de lancement d’Anthropic (TrueFoundry)
SWE-bench Verified	95.0%	88.6%	Rapporté depuis des synthèses Anthropic/system-card (LMM Marketcap)
FrontierCode Diamond	29.3%	13.4%	Rapporté depuis des synthèses Anthropic/system-card (LMM Marketcap)

Utilisez-les comme une raison de tester, pas comme une décision d’achat. La promesse de Fable 5, c’est l’autonomie sur la durée. Un prompt de chat de 10 minutes ne vous dira pas grand-chose. Une vraie branche de migration, un runbook d’incident de production, ou une tâche sale du genre “lis ces 40 fichiers et propose le plus petit patch sûr”, oui.

L’appeler directement avec le SDK Anthropic

Les SDK officiels d’Anthropic prennent en charge Python, TypeScript, Go, Java, C#, PHP et Ruby, avec streaming, reprises et interfaces typées selon le langage (docs SDK Anthropic). Voici le plus petit appel Python utile.

Installation :

python -m venv .venv
source .venv/bin/activate
pip install anthropic
export ANTHROPIC_API_KEY="sk-ant-..."

Créez fable.py :

from anthropic import Anthropic

client = Anthropic(api_key=os.environ["ANTHROPIC_API_KEY"])

message = client.messages.create(
    model="claude-fable-5",
    max_tokens=800,
    messages=[
        {
            "role": "user",
            "content": "Review this migration plan for risk. Return the top 5 issues and concrete fixes.",
        }
    ],
)

print(message.content[0].text)

Exécutez :

python fable.py

Une correction : ajoutez l’import manquant si vous copiez ceci dans un fichier :

import os

Pour Node.js :

npm install @anthropic-ai/sdk
export ANTHROPIC_API_KEY="sk-ant-..."

import Anthropic from "@anthropic-ai/sdk";

const client = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const message = await client.messages.create({
  model: "claude-fable-5",
  max_tokens: 800,
  messages: [
    {
      role: "user",
      content: "Turn this product brief into an implementation plan with risks and test cases.",
    },
  ],
});

console.log(message.content[0].type === "text" ? message.content[0].text : message.content);

Pour les premiers tests, gardez max_tokens bas. La sortie est le côté coûteux de ce modèle.

L’appeler via OneHop avec un changement de base URL

Si vous voulez évaluer Fable 5 rapidement, OneHop est le chemin à faible friction : créez un compte, récupérez le crédit de départ gratuit, et pointez votre client vers OneHop au lieu de brancher la facturation directe du fournisseur. La page actuelle du modèle OneHop affiche la prise en charge d’Anthropic Messages et un exemple Python utilisant le SDK Anthropic avec base_url="https://api.onehop.ai/anthropic" (OneHop).

Installez le même SDK :

pip install anthropic
export ONEHOP_API_KEY="oh_..."

Utilisez la route OneHop :

import os
from anthropic import Anthropic

client = Anthropic(
    base_url="https://api.onehop.ai/anthropic",
    api_key=os.environ["ONEHOP_API_KEY"],
)

message = client.messages.create(
    model="anthropic/claude-fable-5",
    max_tokens=800,
    messages=[
        {
            "role": "user",
            "content": "Analyze this failing CI log and suggest the smallest likely fix.",
        }
    ],
)

print(message.content[0].text)

C’est le changement drop-in concret : même forme de SDK Anthropic, autre base_url, autre clé API, et le nom de modèle OneHop.

Si votre intégration se standardise sur une passerelle façon OpenAI, le chemin de conversion OneHop suit la même idée : définissez la base URL de votre passerelle sur https://api.onehop.ai/v1, passez votre clé OneHop, et routez la requête vers Claude Fable 5 via l’ID de modèle OneHop. En production, gardez la route fournisseur derrière de la configuration :

LLM_BASE_URL="https://api.onehop.ai/v1"
LLM_MODEL="anthropic/claude-fable-5"

Ne codez pas ça en dur dans la logique applicative. Faites-en une variable d’environnement pour pouvoir comparer Fable 5, Opus 4.8 et des modèles moins chers sous le même banc d’essai.

Illustration de diff de code avant-après montrant seulement trois lignes de config modifiées : variable d’environnement de clé API, base URL et nom du modèle

Un plan d’évaluation raisonnable

Voici le plan que j’utiliserais avant de déplacer du vrai trafic :

Choisissez trois tâches qui échouent aujourd’hui ou demandent trop de tours de correction.
Exécutez-les sur votre modèle actuel et sur Fable 5 avec des prompts identiques.
Journalisez les tokens d’entrée, les tokens de sortie, le temps écoulé, les reprises et les modifications humaines.
Vérifiez si une requête bascule vers Opus 4.8.
Routez uniquement la classe de travail à plus forte valeur vers Fable 5.

Le modèle est assez cher pour que “en faire le défaut” soit probablement une erreur pour la plupart des équipes. Une meilleure architecture, c’est un routeur : Haiku ou Sonnet pour l’extraction bon marché, Opus pour le travail général solide, Fable pour la poignée de jobs où l’autonomie et la profondeur de contexte comptent vraiment.

Le prompt caching est aussi obligatoire pour un usage sérieux. Si votre requête inclut le même résumé de repo, paquet de politiques, schéma ou long bloc d’instructions d’un appel à l’autre, mettez-le en cache. Sur Fable 5, une lecture de cache coûte 1 $ / MTok au lieu de 10 $ / MTok, ce qui change vite l’économie.

Diagramme de routage avec trois voies de charge de travail : extraction bon marché vers Haiku/Sonnet, raisonnement général vers Opus 4.8, longues tâches les plus difficiles

Livrez le spike, puis décidez

Claude Fable 5 vaut le test si votre goulot d’étranglement n’est pas “nous avons besoin de complétions moins chères”, mais “nous avons besoin que le modèle reste cohérent sur un gros travail en plusieurs étapes.” Les faits actuels suffisent largement à justifier un spike : lancement le 9 juin, contexte 1M, sortie max 128k, tarification catalogue 10 $ / 50 $, réductions de prompt-cache, et un fallback de sécurité que vous devez comprendre avant la production.

Pour le chemin le plus rapide, utilisez directement le SDK Anthropic ou pointez le même style d’appel vers OneHop. Si vous voulez éviter la configuration de facturation et simplement lancer une évaluation concrète, ouvrez Claude Fable 5 sur OneHop, récupérez l’ID du modèle, et démarrez avec 10 $ gratuits. Ensuite, lancez votre vraie tâche la plus difficile. C’est le seul benchmark qui survivra au contact avec votre codebase.