Anthropic 在 2026 年 6 月 9 日推出 Claude Fable 5,重點很簡單:這是第一個正式公開可用的 Mythos 級 Claude 模型,價格是每百萬輸入 token 10 美元、每百萬輸出 token 50 美元,具備 100 萬 token 的上下文視窗與 128k 最大輸出(Anthropic 發布文、模型文件、價格文件)。如果你今天要評估它,不要從一則 benchmark 推文開始。從你自己 backlog 裡一個真的難搞的 workflow 開始,把它接起來、限制花費,然後量一量:更少的來回修正,是否足以抵掉更高的計費。

Claude Fable 5 到底是什麼
Claude Fable 5 是 Anthropic 公開版的 Mythos 級模型。Anthropic 將 Mythos 級描述為高於 Opus 的一個層級;Fable 5 已調整到適合一般用途,而 Mythos 5 則保留給透過 Project Glasswing 取得的有限可信任存取(Anthropic)。用開發者的實務語言來說,Fable 5 就是「Opus 不夠力時才拿出來用」的模型。
API model ID 是:
claude-fable-5
Anthropic 的模型總覽列出目前規格如下(Anthropic docs):
| Model | API ID | Context window | Max output | Input | Output |
|---|---|---|---|---|---|
| Claude Fable 5 | claude-fable-5 | 100 萬 tokens | 128k tokens | $10 / MTok | $50 / MTok |
| Claude Opus 4.8 | claude-opus-4-8 | 100 萬 tokens | 128k tokens | $5 / MTok | $25 / MTok |
| Claude Sonnet 4.6 | claude-sonnet-4-6 | 100 萬 tokens | 64k tokens | $3 / MTok | $15 / MTok |
| Claude Haiku 4.5 | claude-haiku-4-5-20251001 | 200k tokens | 64k tokens | $1 / MTok | $5 / MTok |
這張表告訴你 Fable 的定位。它不是便宜的預設選項。它是任務又長、又亂、又不能出錯時該試的模型:多 repo 遷移、agentic coding、法律或金融文件推理、長時間規劃工作,以及那些舊模型會在修正迴圈裡耗掉大量時間的 workflow。
這裡有一個重要的安全行為:Anthropic 表示 Fable 5 會在網路安全、生物與化學、蒸餾等領域使用分類器。被標記的請求會 fallback 到 Claude Opus 4.8,且使用者會被告知此事(Anthropic)。Anthropic 也說,早期 Fable session 中超過 95% 沒有發生 fallback。如果你的產品靠近這些領域,務必明確測試 fallback 路徑。
價格:真正的計費器
牌價很清楚:輸入 $10 / MTok,輸出 $50 / MTok。Prompt caching 遵循 Anthropic 的標準倍率結構:5 分鐘 cache 寫入為輸入價格 1.25 倍、1 小時 cache 寫入為輸入價格 2 倍、cache 讀取為輸入價格 0.1 倍(Anthropic pricing)。對 Fable 5 來說,也就是:
| Billing item | Fable 5 price |
|---|---|
| Input | $10 / MTok |
| Output | $50 / MTok |
| 5 分鐘 cache 寫入 | $12.50 / MTok |
| 1 小時 cache 寫入 | $20 / MTok |
| Cache 讀取 / refresh | $1 / MTok |
Anthropic 的 Fable 產品頁也寫明,美國境內推論可用,輸入與輸出 token 價格為 1.1 倍(Anthropic Fable page)。如果你正在為有資料駐留需求的客戶打造產品,這點很重要。
至於 OneHop,目前模型頁列出 anthropic/claude-fable-5、1000K context 標籤、支援 Anthropic Messages,並提供新帳號免信用卡 10 美元免費額度(OneHop)。OneHop 頁面也顯示相較官方費率的折扣價格。如果你想用最快方式評估、又不想先設定 Anthropic 直連帳務,可以從 OneHop 上的 Claude Fable 5 開始,或用 10 美元免費額度起步。

沒有煙霧彈的 benchmarks
Anthropic 表示 Fable 5 在「幾乎所有測試 benchmarks 上達到最先進水準」,且在更長、更複雜的任務上最強(Anthropic)。Anthropic 發布文中的 benchmark 表格是以圖片形式刊出,所以其他地方複製出來的數字,除非評測方有公開執行紀錄,否則都應視為供應商回報數據。
開發者一直拿來比較的,是偏重 coding 的數字:
| Benchmark | Claude Fable 5 | Claude Opus 4.8 | Source context |
|---|---|---|---|
| SWE-Bench Pro | 80.3% | 69.2% | 第三方摘要引用 Anthropic 發布表格的回報數字(TrueFoundry) |
| SWE-bench Verified | 95.0% | 88.6% | 據 Anthropic/system-card 摘要回報(LMM Marketcap) |
| FrontierCode Diamond | 29.3% | 13.4% | 據 Anthropic/system-card 摘要回報(LMM Marketcap) |
把這些數字當成「值得測」的理由,不要當成採購決策。Fable 5 的賣點是長時程自主性。一個 10 分鐘的聊天 prompt 告訴不了你什麼。真正的遷移分支、生產事故 runbook,或是一個混亂的「讀這 40 個檔案,提出最小且安全的 patch」任務,才看得出來。
用 Anthropic SDK 直接呼叫
Anthropic 官方 SDK 支援 Python、TypeScript、Go、Java、C#、PHP 與 Ruby;依語言不同,提供 streaming、重試與型別介面(Anthropic SDK docs)。下面是最小但有用的 Python 呼叫。
安裝:
python -m venv .venv
source .venv/bin/activate
pip install anthropic
export ANTHROPIC_API_KEY="sk-ant-..."
建立 fable.py:
from anthropic import Anthropic
client = Anthropic(api_key=os.environ["ANTHROPIC_API_KEY"])
message = client.messages.create(
model="claude-fable-5",
max_tokens=800,
messages=[
{
"role": "user",
"content": "Review this migration plan for risk. Return the top 5 issues and concrete fixes.",
}
],
)
print(message.content[0].text)
執行:
python fable.py
一個修正:如果你把這段複製到檔案裡,記得補上缺的 import:
import os
Node.js 版本:
npm install @anthropic-ai/sdk
export ANTHROPIC_API_KEY="sk-ant-..."
import Anthropic from "@anthropic-ai/sdk";
const client = new Anthropic({
apiKey: process.env.ANTHROPIC_API_KEY,
});
const message = await client.messages.create({
model: "claude-fable-5",
max_tokens: 800,
messages: [
{
role: "user",
content: "Turn this product brief into an implementation plan with risks and test cases.",
},
],
});
console.log(message.content[0].type === "text" ? message.content[0].text : message.content);
第一次測試時,把 max_tokens 設低一點。輸出才是這個模型貴的那一邊。
透過 OneHop 呼叫,只改 base URL
如果你想快速評估 Fable 5,OneHop 是低摩擦路徑:建立帳號、拿到免費起始額度,然後把 client 指到 OneHop,不必先接好直連供應商帳務。目前 OneHop 模型頁顯示支援 Anthropic Messages,並提供一個使用 Anthropic SDK、搭配 base_url="https://api.onehop.ai/anthropic" 的 Python 範例(OneHop)。
安裝同一個 SDK:
pip install anthropic
export ONEHOP_API_KEY="oh_..."
使用 OneHop 路徑:
import os
from anthropic import Anthropic
client = Anthropic(
base_url="https://api.onehop.ai/anthropic",
api_key=os.environ["ONEHOP_API_KEY"],
)
message = client.messages.create(
model="anthropic/claude-fable-5",
max_tokens=800,
messages=[
{
"role": "user",
"content": "Analyze this failing CI log and suggest the smallest likely fix.",
}
],
)
print(message.content[0].text)
這就是實務上的 drop-in change:同樣的 Anthropic SDK 形狀,不同的 base_url、不同的 API key,以及 OneHop 的模型名稱。
如果你的整合標準化在 OpenAI 風格 gateway 上,OneHop 的轉換路徑也是同一個概念:把 gateway base URL 設成 https://api.onehop.ai/v1,傳入你的 OneHop key,並透過 OneHop 的 model ID 將請求路由到 Claude Fable 5。在 production 裡,請把 provider route 放在 config 後面:
LLM_BASE_URL="https://api.onehop.ai/v1"
LLM_MODEL="anthropic/claude-fable-5"
不要把這些硬寫在 application logic 裡。做成環境變數,這樣你才能在同一套 harness 下比較 Fable 5、Opus 4.8 與更便宜的模型。

合理的評估計畫
在導入真實流量前,我會用這個計畫:
- 選三個目前會失敗,或需要太多修正回合的任務。
- 用完全相同的 prompts,在你目前的模型與 Fable 5 上各跑一次。
- 記錄輸入 tokens、輸出 tokens、wall time、重試次數與人工編修。
- 檢查是否有任何請求 fallback 到 Opus 4.8。
- 只把最高價值的工作類別路由到 Fable 5。
這個模型貴到「把它設成預設」對大多數團隊大概都是錯的。更好的架構是 router:Haiku 或 Sonnet 處理便宜的 extraction,Opus 處理強力的一般工作,Fable 則留給少數那些自主性與上下文深度真的重要的任務。
Prompt caching 對嚴肅使用也是必備。如果你的請求在多次呼叫中都包含相同的 repo 摘要、政策包、schema 或長指令區塊,就把它 cache 起來。在 Fable 5 上,cache 讀取是 $1 / MTok,而不是 $10 / MTok,成本結構會很快改變。

先 Ship Spike,再做決定
如果你的瓶頸不是「我們需要更便宜的 completions」,而是「我們需要模型在大型、多步驟工作中保持一致」,Claude Fable 5 就值得測。當前事實已經足以支持做一個 spike:6 月 9 日發布、100 萬 context、128k 最大輸出、$10 / $50 牌價、prompt-cache 折扣,以及一個你在 production 前必須弄懂的安全 fallback。
最快的路徑,是直接使用 Anthropic SDK,或把同樣風格的呼叫指向 OneHop。如果你想避開帳務設定、只做一次務實評估,就打開 OneHop 上的 Claude Fable 5,拿到 model ID,然後用 10 美元免費額度起步。接著跑你最難的真實任務。那才是唯一能撐過與你 codebase 正面碰撞的 benchmark。