Claude Fable 5 入門：給開發者的實用指南

Anthropic 在 2026 年 6 月 9 日推出 Claude Fable 5，重點很簡單：這是第一個正式公開可用的 Mythos 級 Claude 模型，價格是每百萬輸入 token 10 美元、每百萬輸出 token 50 美元，具備 100 萬 token 的上下文視窗與 128k 最大輸出（Anthropic 發布文、模型文件、價格文件）。如果你今天要評估它，不要從一則 benchmark 推文開始。從你自己 backlog 裡一個真的難搞的 workflow 開始，把它接起來、限制花費，然後量一量：更少的來回修正，是否足以抵掉更高的計費。

封面風格架構草圖，顯示開發者 app 透過兩條路徑呼叫 Claude Fable 5：直接走 Anthropic API

Claude Fable 5 到底是什麼

Claude Fable 5 是 Anthropic 公開版的 Mythos 級模型。Anthropic 將 Mythos 級描述為高於 Opus 的一個層級；Fable 5 已調整到適合一般用途，而 Mythos 5 則保留給透過 Project Glasswing 取得的有限可信任存取（Anthropic）。用開發者的實務語言來說，Fable 5 就是「Opus 不夠力時才拿出來用」的模型。

API model ID 是：

claude-fable-5

Anthropic 的模型總覽列出目前規格如下（Anthropic docs）：

Model	API ID	Context window	Max output	Input	Output
Claude Fable 5	`claude-fable-5`	100 萬 tokens	128k tokens	$10 / MTok	$50 / MTok
Claude Opus 4.8	`claude-opus-4-8`	100 萬 tokens	128k tokens	$5 / MTok	$25 / MTok
Claude Sonnet 4.6	`claude-sonnet-4-6`	100 萬 tokens	64k tokens	$3 / MTok	$15 / MTok
Claude Haiku 4.5	`claude-haiku-4-5-20251001`	200k tokens	64k tokens	$1 / MTok	$5 / MTok

這張表告訴你 Fable 的定位。它不是便宜的預設選項。它是任務又長、又亂、又不能出錯時該試的模型：多 repo 遷移、agentic coding、法律或金融文件推理、長時間規劃工作，以及那些舊模型會在修正迴圈裡耗掉大量時間的 workflow。

這裡有一個重要的安全行為：Anthropic 表示 Fable 5 會在網路安全、生物與化學、蒸餾等領域使用分類器。被標記的請求會 fallback 到 Claude Opus 4.8，且使用者會被告知此事（Anthropic）。Anthropic 也說，早期 Fable session 中超過 95% 沒有發生 fallback。如果你的產品靠近這些領域，務必明確測試 fallback 路徑。

價格：真正的計費器

牌價很清楚：輸入 $10 / MTok，輸出 $50 / MTok。Prompt caching 遵循 Anthropic 的標準倍率結構：5 分鐘 cache 寫入為輸入價格 1.25 倍、1 小時 cache 寫入為輸入價格 2 倍、cache 讀取為輸入價格 0.1 倍（Anthropic pricing）。對 Fable 5 來說，也就是：

Billing item	Fable 5 price
Input	$10 / MTok
Output	$50 / MTok
5 分鐘 cache 寫入	$12.50 / MTok
1 小時 cache 寫入	$20 / MTok
Cache 讀取 / refresh	$1 / MTok

Anthropic 的 Fable 產品頁也寫明，美國境內推論可用，輸入與輸出 token 價格為 1.1 倍（Anthropic Fable page）。如果你正在為有資料駐留需求的客戶打造產品，這點很重要。

至於 OneHop，目前模型頁列出 anthropic/claude-fable-5、1000K context 標籤、支援 Anthropic Messages，並提供新帳號免信用卡 10 美元免費額度（OneHop）。OneHop 頁面也顯示相較官方費率的折扣價格。如果你想用最快方式評估、又不想先設定 Anthropic 直連帳務，可以從 OneHop 上的 Claude Fable 5 開始，或用 10 美元免費額度起步。

小型長條圖，比較 Fable 5、Opus 4.8、Sonnet 4.6 與 Haiku 4.5 每百萬 token 的輸入與輸出價格，

沒有煙霧彈的 benchmarks

Anthropic 表示 Fable 5 在「幾乎所有測試 benchmarks 上達到最先進水準」，且在更長、更複雜的任務上最強（Anthropic）。Anthropic 發布文中的 benchmark 表格是以圖片形式刊出，所以其他地方複製出來的數字，除非評測方有公開執行紀錄，否則都應視為供應商回報數據。

開發者一直拿來比較的，是偏重 coding 的數字：

Benchmark	Claude Fable 5	Claude Opus 4.8	Source context
SWE-Bench Pro	80.3%	69.2%	第三方摘要引用 Anthropic 發布表格的回報數字（TrueFoundry）
SWE-bench Verified	95.0%	88.6%	據 Anthropic/system-card 摘要回報（LMM Marketcap）
FrontierCode Diamond	29.3%	13.4%	據 Anthropic/system-card 摘要回報（LMM Marketcap）

把這些數字當成「值得測」的理由，不要當成採購決策。Fable 5 的賣點是長時程自主性。一個 10 分鐘的聊天 prompt 告訴不了你什麼。真正的遷移分支、生產事故 runbook，或是一個混亂的「讀這 40 個檔案，提出最小且安全的 patch」任務，才看得出來。

用 Anthropic SDK 直接呼叫

Anthropic 官方 SDK 支援 Python、TypeScript、Go、Java、C#、PHP 與 Ruby；依語言不同，提供 streaming、重試與型別介面（Anthropic SDK docs）。下面是最小但有用的 Python 呼叫。

安裝：

python -m venv .venv
source .venv/bin/activate
pip install anthropic
export ANTHROPIC_API_KEY="sk-ant-..."

建立 fable.py：

from anthropic import Anthropic

client = Anthropic(api_key=os.environ["ANTHROPIC_API_KEY"])

message = client.messages.create(
    model="claude-fable-5",
    max_tokens=800,
    messages=[
        {
            "role": "user",
            "content": "Review this migration plan for risk. Return the top 5 issues and concrete fixes.",
        }
    ],
)

print(message.content[0].text)

執行：

python fable.py

一個修正：如果你把這段複製到檔案裡，記得補上缺的 import：

import os

Node.js 版本：

npm install @anthropic-ai/sdk
export ANTHROPIC_API_KEY="sk-ant-..."

import Anthropic from "@anthropic-ai/sdk";

const client = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const message = await client.messages.create({
  model: "claude-fable-5",
  max_tokens: 800,
  messages: [
    {
      role: "user",
      content: "Turn this product brief into an implementation plan with risks and test cases.",
    },
  ],
});

console.log(message.content[0].type === "text" ? message.content[0].text : message.content);

第一次測試時，把 max_tokens 設低一點。輸出才是這個模型貴的那一邊。

透過 OneHop 呼叫，只改 base URL

如果你想快速評估 Fable 5，OneHop 是低摩擦路徑：建立帳號、拿到免費起始額度，然後把 client 指到 OneHop，不必先接好直連供應商帳務。目前 OneHop 模型頁顯示支援 Anthropic Messages，並提供一個使用 Anthropic SDK、搭配 base_url="https://api.onehop.ai/anthropic" 的 Python 範例（OneHop）。

安裝同一個 SDK：

pip install anthropic
export ONEHOP_API_KEY="oh_..."

使用 OneHop 路徑：

import os
from anthropic import Anthropic

client = Anthropic(
    base_url="https://api.onehop.ai/anthropic",
    api_key=os.environ["ONEHOP_API_KEY"],
)

message = client.messages.create(
    model="anthropic/claude-fable-5",
    max_tokens=800,
    messages=[
        {
            "role": "user",
            "content": "Analyze this failing CI log and suggest the smallest likely fix.",
        }
    ],
)

print(message.content[0].text)

這就是實務上的 drop-in change：同樣的 Anthropic SDK 形狀，不同的 base_url、不同的 API key，以及 OneHop 的模型名稱。

如果你的整合標準化在 OpenAI 風格 gateway 上，OneHop 的轉換路徑也是同一個概念：把 gateway base URL 設成 https://api.onehop.ai/v1，傳入你的 OneHop key，並透過 OneHop 的 model ID 將請求路由到 Claude Fable 5。在 production 裡，請把 provider route 放在 config 後面：

LLM_BASE_URL="https://api.onehop.ai/v1"
LLM_MODEL="anthropic/claude-fable-5"

不要把這些硬寫在 application logic 裡。做成環境變數，這樣你才能在同一套 harness 下比較 Fable 5、Opus 4.8 與更便宜的模型。

前後對照的程式碼 diff 插圖，只顯示三行設定變更：API key 環境變數、base URL 與 model na

合理的評估計畫

在導入真實流量前，我會用這個計畫：

選三個目前會失敗，或需要太多修正回合的任務。
用完全相同的 prompts，在你目前的模型與 Fable 5 上各跑一次。
記錄輸入 tokens、輸出 tokens、wall time、重試次數與人工編修。
檢查是否有任何請求 fallback 到 Opus 4.8。
只把最高價值的工作類別路由到 Fable 5。

這個模型貴到「把它設成預設」對大多數團隊大概都是錯的。更好的架構是 router：Haiku 或 Sonnet 處理便宜的 extraction，Opus 處理強力的一般工作，Fable 則留給少數那些自主性與上下文深度真的重要的任務。

Prompt caching 對嚴肅使用也是必備。如果你的請求在多次呼叫中都包含相同的 repo 摘要、政策包、schema 或長指令區塊，就把它 cache 起來。在 Fable 5 上，cache 讀取是 $1 / MTok，而不是 $10 / MTok，成本結構會很快改變。

路由圖，包含三條工作負載通道：便宜 extraction 給 Haiku/Sonnet，一般推理給 Opus 4.8，最困難的長任務

先 Ship Spike，再做決定

如果你的瓶頸不是「我們需要更便宜的 completions」，而是「我們需要模型在大型、多步驟工作中保持一致」，Claude Fable 5 就值得測。當前事實已經足以支持做一個 spike：6 月 9 日發布、100 萬 context、128k 最大輸出、$10 / $50 牌價、prompt-cache 折扣，以及一個你在 production 前必須弄懂的安全 fallback。

最快的路徑，是直接使用 Anthropic SDK，或把同樣風格的呼叫指向 OneHop。如果你想避開帳務設定、只做一次務實評估，就打開 OneHop 上的 Claude Fable 5，拿到 model ID，然後用 10 美元免費額度起步。接著跑你最難的真實任務。那才是唯一能撐過與你 codebase 正面碰撞的 benchmark。