← 全部文章
Guide

Claude Fable 5 上手指南:面向开发者的实用手册

A developer workstation with layered API cards flowing into a large “Fable 5” model node, showing Anthropic SDK and OneH

Anthropic 已于 2026 年 6 月 9 日发布 Claude Fable 5,重点很简单:这是首个正式开放使用的 Mythos 级 Claude 模型,价格为每百万输入 token 10 美元、每百万输出 token 50 美元,拥有 100 万 token 上下文窗口和最高 128k 输出(Anthropic 发布公告模型文档价格文档)。如果你今天要评估它,别从某条基准测试推文开始。拿你自己 backlog 里一个真正棘手的工作流,把它接起来,设好花费上限,然后衡量更少的来回修正是否抵得上更高的计费。

封面风格架构草图,展示开发者应用通过两条路径调用 Claude Fable 5:直接 Anthropic API

Claude Fable 5 到底是什么

Claude Fable 5 是 Anthropic 面向公众开放的 Mythos 级模型版本。Anthropic 将 Mythos 级描述为高于 Opus 的层级,其中 Fable 5 已经过通用使用安全处理,而 Mythos 5 仅通过 Project Glasswing 向有限的可信访问开放(Anthropic)。放到开发者的实际语境里,Fable 5 就是那个“Opus 不够用时该试的”模型。

API 模型 ID 是:

claude-fable-5

Anthropic 的模型概览列出了这些当前规格(Anthropic docs):

模型API ID上下文窗口最大输出输入输出
Claude Fable 5claude-fable-51M tokens128k tokens$10 / MTok$50 / MTok
Claude Opus 4.8claude-opus-4-81M tokens128k tokens$5 / MTok$25 / MTok
Claude Sonnet 4.6claude-sonnet-4-61M tokens64k tokens$3 / MTok$15 / MTok
Claude Haiku 4.5claude-haiku-4-5-20251001200k tokens64k tokens$1 / MTok$5 / MTok

这张表说明了 Fable 的位置。它不是便宜的默认选项。它适合在任务又长、又乱、又不能出错时尝试:多仓库迁移、agentic coding、法律或金融文档推理、长周期规划任务,以及那些之前模型会在反复修正中耗掉大量时间的工作流。

这里有一个重要的安全行为:Anthropic 表示,Fable 5 会在网络安全、生物与化学、蒸馏等领域使用分类器。被标记的请求会回退到 Claude Opus 4.8,并且用户会被告知发生了回退(Anthropic)。Anthropic 还表示,早期 Fable 会话中超过 95% 没有发生回退。如果你的产品靠近这些领域,请明确测试回退路径。

价格:真正的计费表

标价很清楚:输入 $10 / MTok,输出 $50 / MTok。提示缓存沿用 Anthropic 的标准倍率结构:5 分钟缓存写入按输入价 1.25 倍,1 小时缓存写入按输入价 2 倍,缓存读取按输入价 0.1 倍(Anthropic pricing)。对 Fable 5 来说,这意味着:

计费项目Fable 5 价格
输入$10 / MTok
输出$50 / MTok
5 分钟缓存写入$12.50 / MTok
1 小时缓存写入$20 / MTok
缓存读取 / 刷新$1 / MTok

Anthropic 的 Fable 产品页还说明,美国境内推理可用,输入和输出 token 按 1.1 倍价格计费(Anthropic Fable page)。如果你在为有数据驻留要求的客户构建产品,这一点很重要。

对于 OneHop,模型页目前列出了 anthropic/claude-fable-5、1000K 上下文标签、Anthropic Messages 可用性,以及新账户无需绑卡即可获得 10 美元免费额度的优惠(OneHop)。OneHop 页面还显示了相较官方价格的折扣。如果你想用最快路径完成评估,又不想配置直接 Anthropic 计费,可以从 OneHop 上的 Claude Fable 5 开始,或领取 10 美元免费额度

紧凑柱状图,对比 Fable 5、Opus 4.8、Sonnet 4.6 和 Haiku 4.5 每百万 token 的输入与输出价格,

不带迷雾看基准测试

Anthropic 称 Fable 5 在“几乎所有测试基准上达到最先进水平”,并且在更长、更复杂的任务上最强(Anthropic)。Anthropic 发布文章里的基准表是以图片形式发布的,所以除非评测方托管了运行记录,否则其他地方复制的数字都应视为供应商报告数据。

开发者反复比较的数字主要偏编码:

基准Claude Fable 5Claude Opus 4.8来源背景
SWE-Bench Pro80.3%69.2%第三方对 Anthropic 发布表格的摘要报告(TrueFoundry
SWE-bench Verified95.0%88.6%来自 Anthropic/system-card 摘要的报告(LMM Marketcap
FrontierCode Diamond29.3%13.4%来自 Anthropic/system-card 摘要的报告(LMM Marketcap

把这些当成测试理由,不要当成采购决策。Fable 5 的卖点是长周期自主性。一个 10 分钟的聊天提示不会告诉你太多。真正的迁移分支、生产事故 runbook,或一个混乱的“读完这 40 个文件,然后提出最小安全补丁”的任务,才会。

直接用 Anthropic SDK 调用

Anthropic 的官方 SDK 支持 Python、TypeScript、Go、Java、C#、PHP 和 Ruby,并根据语言提供流式传输、重试和类型化接口(Anthropic SDK docs)。下面是最小可用的 Python 调用。

安装:

python -m venv .venv
source .venv/bin/activate
pip install anthropic
export ANTHROPIC_API_KEY="sk-ant-..."

创建 fable.py

from anthropic import Anthropic

client = Anthropic(api_key=os.environ["ANTHROPIC_API_KEY"])

message = client.messages.create(
    model="claude-fable-5",
    max_tokens=800,
    messages=[
        {
            "role": "user",
            "content": "Review this migration plan for risk. Return the top 5 issues and concrete fixes.",
        }
    ],
)

print(message.content[0].text)

运行:

python fable.py

有个修正:如果你把这段复制到文件里,记得补上缺失的导入:

import os

Node.js 版本:

npm install @anthropic-ai/sdk
export ANTHROPIC_API_KEY="sk-ant-..."
import Anthropic from "@anthropic-ai/sdk";

const client = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const message = await client.messages.create({
  model: "claude-fable-5",
  max_tokens: 800,
  messages: [
    {
      role: "user",
      content: "Turn this product brief into an implementation plan with risks and test cases.",
    },
  ],
});

console.log(message.content[0].type === "text" ? message.content[0].text : message.content);

首次测试时,把 max_tokens 设低一点。输出是这个模型里昂贵的一侧。

通过 OneHop 调用,只改 base URL

如果你想快速评估 Fable 5,OneHop 是低摩擦路径:创建账户,拿到免费起始额度,然后把客户端指向 OneHop,而不是直接接入供应商计费。当前 OneHop 模型页显示支持 Anthropic Messages,并给出了使用 Anthropic SDK、设置 base_url="https://api.onehop.ai/anthropic" 的 Python 示例(OneHop)。

安装同一个 SDK:

pip install anthropic
export ONEHOP_API_KEY="oh_..."

使用 OneHop 路由:

import os
from anthropic import Anthropic

client = Anthropic(
    base_url="https://api.onehop.ai/anthropic",
    api_key=os.environ["ONEHOP_API_KEY"],
)

message = client.messages.create(
    model="anthropic/claude-fable-5",
    max_tokens=800,
    messages=[
        {
            "role": "user",
            "content": "Analyze this failing CI log and suggest the smallest likely fix.",
        }
    ],
)

print(message.content[0].text)

这就是实际的即插即用改动:相同的 Anthropic SDK 形态,不同的 base_url,不同的 API key,以及 OneHop 的模型名。

如果你的集成标准化在 OpenAI 风格的网关上,OneHop 的转换路径也一样:把网关 base URL 设为 https://api.onehop.ai/v1,传入你的 OneHop key,然后通过 OneHop 的模型 ID 将请求路由到 Claude Fable 5。生产环境里,把供应商路由放在配置后面:

LLM_BASE_URL="https://api.onehop.ai/v1"
LLM_MODEL="anthropic/claude-fable-5"

不要把它硬编码进应用逻辑。把它做成环境变量,这样你就能在同一套 harness 下比较 Fable 5、Opus 4.8 和更便宜的模型。

前后代码 diff 示意图,只展示三行配置变化:API key 环境变量、base URL 和模型名

一个靠谱的评估计划

在迁移真实流量之前,我会用这个计划:

  1. 选三个当前会失败或需要太多修正轮次的任务。
  2. 用完全相同的提示,在你当前模型和 Fable 5 上分别运行。
  3. 记录输入 token、输出 token、耗时、重试次数和人工编辑量。
  4. 检查是否有请求回退到 Opus 4.8。
  5. 只把最高价值的工作类别路由到 Fable 5。

这个模型贵到足以说明,“把它设成默认模型”对大多数团队来说大概率是错的。更好的架构是一个路由器:Haiku 或 Sonnet 用于便宜的信息抽取,Opus 用于强通用工作,Fable 留给少数真正需要自主性和上下文深度的任务。

认真使用时,提示缓存也是必选项。如果你的请求在多次调用中包含相同的仓库摘要、政策包、schema 或长指令块,就缓存它。在 Fable 5 上,缓存读取是 $1 / MTok,而不是 $10 / MTok,这会很快改变成本结构。

路由图,包含三条工作负载通道:便宜抽取到 Haiku/Sonnet,通用推理到 Opus 4.8,最难的长任务

先上线 Spike,再做决定

如果你的瓶颈不是“我们需要更便宜的 completions”,而是“我们需要模型在大型、多步骤任务中保持连贯”,Claude Fable 5 就值得测试。当前事实已经足够支持做一次 spike:6 月 9 日发布、100 万上下文、128k 最大输出、$10 / $50 标价、提示缓存折扣,以及上线前必须理解清楚的安全回退机制。

最快路径是直接使用 Anthropic SDK,或把同样风格的调用指向 OneHop。如果你想避开计费配置,直接跑一次实用评估,就打开 OneHop 上的 Claude Fable 5,拿到模型 ID,然后领取 10 美元免费额度。接着运行你最难的真实任务。那才是唯一能经受住与你代码库正面接触的基准测试。