Claude Fable 5 上手指南：面向开发者的实用手册

Anthropic 已于 2026 年 6 月 9 日发布 Claude Fable 5，重点很简单：这是首个正式开放使用的 Mythos 级 Claude 模型，价格为每百万输入 token 10 美元、每百万输出 token 50 美元，拥有 100 万 token 上下文窗口和最高 128k 输出（Anthropic 发布公告、模型文档、价格文档）。如果你今天要评估它，别从某条基准测试推文开始。拿你自己 backlog 里一个真正棘手的工作流，把它接起来，设好花费上限，然后衡量更少的来回修正是否抵得上更高的计费。

封面风格架构草图，展示开发者应用通过两条路径调用 Claude Fable 5：直接 Anthropic API

Claude Fable 5 到底是什么

Claude Fable 5 是 Anthropic 面向公众开放的 Mythos 级模型版本。Anthropic 将 Mythos 级描述为高于 Opus 的层级，其中 Fable 5 已经过通用使用安全处理，而 Mythos 5 仅通过 Project Glasswing 向有限的可信访问开放（Anthropic）。放到开发者的实际语境里，Fable 5 就是那个“Opus 不够用时该试的”模型。

API 模型 ID 是：

claude-fable-5

Anthropic 的模型概览列出了这些当前规格（Anthropic docs）：

模型	API ID	上下文窗口	最大输出	输入	输出
Claude Fable 5	`claude-fable-5`	1M tokens	128k tokens	$10 / MTok	$50 / MTok
Claude Opus 4.8	`claude-opus-4-8`	1M tokens	128k tokens	$5 / MTok	$25 / MTok
Claude Sonnet 4.6	`claude-sonnet-4-6`	1M tokens	64k tokens	$3 / MTok	$15 / MTok
Claude Haiku 4.5	`claude-haiku-4-5-20251001`	200k tokens	64k tokens	$1 / MTok	$5 / MTok

这张表说明了 Fable 的位置。它不是便宜的默认选项。它适合在任务又长、又乱、又不能出错时尝试：多仓库迁移、agentic coding、法律或金融文档推理、长周期规划任务，以及那些之前模型会在反复修正中耗掉大量时间的工作流。

这里有一个重要的安全行为：Anthropic 表示，Fable 5 会在网络安全、生物与化学、蒸馏等领域使用分类器。被标记的请求会回退到 Claude Opus 4.8，并且用户会被告知发生了回退（Anthropic）。Anthropic 还表示，早期 Fable 会话中超过 95% 没有发生回退。如果你的产品靠近这些领域，请明确测试回退路径。

价格：真正的计费表

标价很清楚：输入 $10 / MTok，输出 $50 / MTok。提示缓存沿用 Anthropic 的标准倍率结构：5 分钟缓存写入按输入价 1.25 倍，1 小时缓存写入按输入价 2 倍，缓存读取按输入价 0.1 倍（Anthropic pricing）。对 Fable 5 来说，这意味着：

计费项目	Fable 5 价格
输入	$10 / MTok
输出	$50 / MTok
5 分钟缓存写入	$12.50 / MTok
1 小时缓存写入	$20 / MTok
缓存读取 / 刷新	$1 / MTok

Anthropic 的 Fable 产品页还说明，美国境内推理可用，输入和输出 token 按 1.1 倍价格计费（Anthropic Fable page）。如果你在为有数据驻留要求的客户构建产品，这一点很重要。

对于 OneHop，模型页目前列出了 anthropic/claude-fable-5、1000K 上下文标签、Anthropic Messages 可用性，以及新账户无需绑卡即可获得 10 美元免费额度的优惠（OneHop）。OneHop 页面还显示了相较官方价格的折扣。如果你想用最快路径完成评估，又不想配置直接 Anthropic 计费，可以从 OneHop 上的 Claude Fable 5 开始，或领取 10 美元免费额度。

紧凑柱状图，对比 Fable 5、Opus 4.8、Sonnet 4.6 和 Haiku 4.5 每百万 token 的输入与输出价格，

不带迷雾看基准测试

Anthropic 称 Fable 5 在“几乎所有测试基准上达到最先进水平”，并且在更长、更复杂的任务上最强（Anthropic）。Anthropic 发布文章里的基准表是以图片形式发布的，所以除非评测方托管了运行记录，否则其他地方复制的数字都应视为供应商报告数据。

开发者反复比较的数字主要偏编码：

基准	Claude Fable 5	Claude Opus 4.8	来源背景
SWE-Bench Pro	80.3%	69.2%	第三方对 Anthropic 发布表格的摘要报告（TrueFoundry）
SWE-bench Verified	95.0%	88.6%	来自 Anthropic/system-card 摘要的报告（LMM Marketcap）
FrontierCode Diamond	29.3%	13.4%	来自 Anthropic/system-card 摘要的报告（LMM Marketcap）

把这些当成测试理由，不要当成采购决策。Fable 5 的卖点是长周期自主性。一个 10 分钟的聊天提示不会告诉你太多。真正的迁移分支、生产事故 runbook，或一个混乱的“读完这 40 个文件，然后提出最小安全补丁”的任务，才会。

直接用 Anthropic SDK 调用

Anthropic 的官方 SDK 支持 Python、TypeScript、Go、Java、C#、PHP 和 Ruby，并根据语言提供流式传输、重试和类型化接口（Anthropic SDK docs）。下面是最小可用的 Python 调用。

安装：

python -m venv .venv
source .venv/bin/activate
pip install anthropic
export ANTHROPIC_API_KEY="sk-ant-..."

创建 fable.py：

from anthropic import Anthropic

client = Anthropic(api_key=os.environ["ANTHROPIC_API_KEY"])

message = client.messages.create(
    model="claude-fable-5",
    max_tokens=800,
    messages=[
        {
            "role": "user",
            "content": "Review this migration plan for risk. Return the top 5 issues and concrete fixes.",
        }
    ],
)

print(message.content[0].text)

运行：

python fable.py

有个修正：如果你把这段复制到文件里，记得补上缺失的导入：

import os

Node.js 版本：

npm install @anthropic-ai/sdk
export ANTHROPIC_API_KEY="sk-ant-..."

import Anthropic from "@anthropic-ai/sdk";

const client = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const message = await client.messages.create({
  model: "claude-fable-5",
  max_tokens: 800,
  messages: [
    {
      role: "user",
      content: "Turn this product brief into an implementation plan with risks and test cases.",
    },
  ],
});

console.log(message.content[0].type === "text" ? message.content[0].text : message.content);

首次测试时，把 max_tokens 设低一点。输出是这个模型里昂贵的一侧。

通过 OneHop 调用，只改 base URL

如果你想快速评估 Fable 5，OneHop 是低摩擦路径：创建账户，拿到免费起始额度，然后把客户端指向 OneHop，而不是直接接入供应商计费。当前 OneHop 模型页显示支持 Anthropic Messages，并给出了使用 Anthropic SDK、设置 base_url="https://api.onehop.ai/anthropic" 的 Python 示例（OneHop）。

安装同一个 SDK：

pip install anthropic
export ONEHOP_API_KEY="oh_..."

使用 OneHop 路由：

import os
from anthropic import Anthropic

client = Anthropic(
    base_url="https://api.onehop.ai/anthropic",
    api_key=os.environ["ONEHOP_API_KEY"],
)

message = client.messages.create(
    model="anthropic/claude-fable-5",
    max_tokens=800,
    messages=[
        {
            "role": "user",
            "content": "Analyze this failing CI log and suggest the smallest likely fix.",
        }
    ],
)

print(message.content[0].text)

这就是实际的即插即用改动：相同的 Anthropic SDK 形态，不同的 base_url，不同的 API key，以及 OneHop 的模型名。

如果你的集成标准化在 OpenAI 风格的网关上，OneHop 的转换路径也一样：把网关 base URL 设为 https://api.onehop.ai/v1，传入你的 OneHop key，然后通过 OneHop 的模型 ID 将请求路由到 Claude Fable 5。生产环境里，把供应商路由放在配置后面：

LLM_BASE_URL="https://api.onehop.ai/v1"
LLM_MODEL="anthropic/claude-fable-5"

不要把它硬编码进应用逻辑。把它做成环境变量，这样你就能在同一套 harness 下比较 Fable 5、Opus 4.8 和更便宜的模型。

前后代码 diff 示意图，只展示三行配置变化：API key 环境变量、base URL 和模型名

一个靠谱的评估计划

在迁移真实流量之前，我会用这个计划：

选三个当前会失败或需要太多修正轮次的任务。
用完全相同的提示，在你当前模型和 Fable 5 上分别运行。
记录输入 token、输出 token、耗时、重试次数和人工编辑量。
检查是否有请求回退到 Opus 4.8。
只把最高价值的工作类别路由到 Fable 5。

这个模型贵到足以说明，“把它设成默认模型”对大多数团队来说大概率是错的。更好的架构是一个路由器：Haiku 或 Sonnet 用于便宜的信息抽取，Opus 用于强通用工作，Fable 留给少数真正需要自主性和上下文深度的任务。

认真使用时，提示缓存也是必选项。如果你的请求在多次调用中包含相同的仓库摘要、政策包、schema 或长指令块，就缓存它。在 Fable 5 上，缓存读取是 $1 / MTok，而不是 $10 / MTok，这会很快改变成本结构。

路由图，包含三条工作负载通道：便宜抽取到 Haiku/Sonnet，通用推理到 Opus 4.8，最难的长任务

先上线 Spike，再做决定

如果你的瓶颈不是“我们需要更便宜的 completions”，而是“我们需要模型在大型、多步骤任务中保持连贯”，Claude Fable 5 就值得测试。当前事实已经足够支持做一次 spike：6 月 9 日发布、100 万上下文、128k 最大输出、$10 / $50 标价、提示缓存折扣，以及上线前必须理解清楚的安全回退机制。

最快路径是直接使用 Anthropic SDK，或把同样风格的调用指向 OneHop。如果你想避开计费配置，直接跑一次实用评估，就打开 OneHop 上的 Claude Fable 5，拿到模型 ID，然后领取 10 美元免费额度。接着运行你最难的真实任务。那才是唯一能经受住与你代码库正面接触的基准测试。