通过 OneHop 即插即用访问 Claude API

Claude Fable 5 于 2026 年 6 月 9 日发布，价格已经把 Anthropic 对它的定位说得很清楚：通过 Claude API 调用，每百万输入 token 10 美元、每百万输出 token 50 美元（Anthropic）。这不是拿来当默认自动补全的模型。它适合那些流程长、出错代价高、值得更强模型认真跑一遍的任务。

好处是：如果你的应用已经在用 Anthropic SDK，就不需要为了通过 OneHop 试用它而重写客户端层。你可以继续用 client.messages.create(...)，继续保留 Anthropic 的消息结构，只要把 SDK 指向 OneHop 的 Anthropic 兼容端点即可。

前后集成示意图，两个并排面板：左侧显示应用直接通过 api 调用 Anthropic。

为什么 Fable 5 改变了路由这件事

Anthropic 将 Claude Fable 5 描述为一个面向通用使用做过安全处理的 “Mythos-class” 模型，能力高于它此前任何已普遍开放的模型（Anthropic）。Claude API 中的模型 ID 是 claude-fable-5，Anthropic 表示它可通过 Claude Platform 和云市场使用（Anthropic）。

对开发者来说，有两个细节很重要。

第一，Fable 5 的定价就是顶级模型的定价：输入 $10/M、输出 $50/M，同时 Anthropic 针对 prompt caching 的 90% 输入 token 折扣仍然适用（Anthropic）。Anthropic 还表示，仅限美国的推理可用，输入和输出 token 均按 1.1 倍价格计费（Anthropic）。

第二，Fable 内置了安全保护。Anthropic 表示，网络安全、生物和化学，或被分类器标记的蒸馏请求，会自动改由 Claude Opus 4.8 处理；早期数据显示，超过 95% 的 Fable 会话没有触发 fallback（Anthropic）。如果你的产品涉及安全研究、生物或化学工作流，就应该把它视为产品行为，而不是边缘情况。

这正是 gateway 发挥价值的地方。通常你并不希望每个请求都打到最贵的模型。你想要的是一个集成点、一把 key、清晰的账单，以及把普通任务路由到更便宜模型、只把值得的 prompt 留给 Fable 的能力。

OneHop 能给你什么

OneHop 将自己定位为 AI gateway：一个账号、一层 API、访问多个提供商的模型。它的首页写明支持 OpenAI、Anthropic 和 Vertex 协议，并且你可以“把 base_url 指向 OneHop，继续使用你现有的 SDK 和代码”（OneHop）。

具体到 Claude Fable 5，OneHop 列出的模型信息如下：

项目	当前值
OneHop 模型名	`anthropic/claude-fable-5`
上下文	1M tokens
已列能力	vision, reasoning, tool calling, coding, prompt cache
Anthropic 标价	$10/M input, $50/M output
OneHop 目录价格	$7/M input，标注 “Save 30%”
OneHop 详情页价格	$5/M input, $25/M output, “Verified 2026-06-10”

来源：OneHop 的模型目录列出 Claude Fable 5 为 1M 上下文，价格 $7.00/M，并标注 “Save 30%”（OneHop models）。Fable 详情页目前显示输入 $5.00/M、输出 $25.00/M，cache read 为 $0.500/M，cache write 为 $6.25/M，验证日期为 2026-06-10（OneHop Fable 5）。

这个差异值得单独指出，因为价格会变。更稳妥的说法是：OneHop 目前正在以低于 Anthropic 标价的价格推广 Claude Fable 5，并且它的实时模型目录里至少展示了 30% 的折扣。在你把价格假设写进上线计划之前，先检查模型页面。

OneHop 还在 Fable 页面为新账号提供 10 美元免费额度，无需绑卡（OneHop Fable 5）。如果你只是想快速冒烟测试一下集成，可以从 Claude Fable 5 on OneHop 开始，或者免费领取 10 美元开始。

紧凑的价格对比条形图，对比 Anthropic 标价、OneHop 目录价格和 OneHop 详情页价格

即插即用的 Anthropic SDK 设置

安装官方 Anthropic Python SDK：

python -m venv .venv
source .venv/bin/activate
pip install anthropic

设置你的 OneHop key：

export ONEHOP_API_KEY="oh_your_key_here"

然后继续使用你已经熟悉的 Anthropic SDK 结构。关键就是 base_url 这一行。

import os
from anthropic import Anthropic

client = Anthropic(
    api_key=os.environ["ONEHOP_API_KEY"],
    base_url="https://api.onehop.ai/anthropic",
)

message = client.messages.create(
    model="anthropic/claude-fable-5",
    max_tokens=800,
    messages=[
        {
            "role": "user",
            "content": (
                "You are reviewing a Python web service. "
                "List the three highest-risk failure modes in its request pipeline "
                "and give one concrete test for each."
            ),
        }
    ],
)

print(message.content[0].text)

这就是 OneHop 的 Claude Fable 5 页面展示的真实 Anthropic SDK 路径：用于支持 Anthropic Messages streaming 的 https://api.onehop.ai/anthropic（OneHop Fable 5）。OneHop 通用的 OpenAI 兼容 base URL 是 https://api.onehop.ai/v1（OneHop），但对于 Anthropic Python SDK，请使用上面的 Anthropic 兼容 base URL。把这两个搞混，是拿到一个让人摸不着头脑的 404 的最快方式。

如果你现有代码已经从环境变量读取配置，迁移还会更小：

client = Anthropic(
    api_key=os.environ["ANTHROPIC_API_KEY"],
    base_url=os.environ.get("ANTHROPIC_BASE_URL", "https://api.anthropic.com"),
)

然后像这样通过 OneHop 运行：

export ANTHROPIC_API_KEY="$ONEHOP_API_KEY"
export ANTHROPIC_BASE_URL="https://api.onehop.ai/anthropic"

你的调用点保持无聊就好：

client.messages.create(
    model="anthropic/claude-fable-5",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Refactor this API design for lower latency."}],
)

官方 Anthropic SDK 在 Python SDK 文档中支持 messages.create、streaming、token 使用量报告、重试和长请求指导（Anthropic docs）。OneHop 在这里有用，是因为你没有替换这套接口表面。你只是改变了 HTTP 请求落到哪里。

极简代码 diff 示意图，只显示两处改动：API key 环境变量，以及从 Anthropic 直连改成 base_url

Gateway 什么时候有用，什么时候没用

当你在意采用速度时，可以用 OneHop 跑 Fable 5。如果你的产品已经有 Anthropic 抽象层，gateway 访问能让你把 Fable 放在 feature flag 后面测试，而不动业务逻辑。你可以只把难题路由过去：多文件代码迁移、长上下文分析、高成本客户升级、会烧掉人力时间的规划任务。

当团队同时在用不止一个模型家族时，它也有帮助。OneHop 的模型页面在同一个目录下列出了 Anthropic、OpenAI、Google、DeepSeek、MiniMax 等模型（OneHop models）。这在生产环境里很重要，因为模型选择不再是哲学争论，而会变成策略：分类用便宜模型，草稿用中档模型，失败成本高于 token 成本的任务交给 Fable 5。

不要把 gateway 当成逃避理解模型行为的办法。Fable 5 有安全 fallback 行为。根据 Anthropic 的 Fable 页面，它为了安全监控会保留 30 天数据（Anthropic）。它也贵到足以让不受限制的 agent 循环真正伤到钱包。你仍然需要请求日志、预算上限、针对重复上下文的 prompt caching，以及清晰的路由规则。

一个合理的起步策略可以像这样：

工作负载	建议路由
分类、抽取、短 JSON 转换	更便宜的快速模型
常规代码解释或文档草稿	Sonnet/Opus-class route
多步骤代码库迁移或疑难调试	Claude Fable 5
安全、生物、化学敏感 prompt	预期会有 Anthropic fallback 行为
复用的长 system prompts 或文档	在支持的地方启用 prompt caching

关键是让 Fable 的使用保持有意图。把它当成高级工程师的时间：不要花在每张工单上，但工作真的很难时，也别犹豫。

上线最小可行迁移

如果是生产 rollout，我会把 gateway 切换做成配置变更，而不是代码分叉。

添加三个环境变量：

export ANTHROPIC_API_KEY="$ONEHOP_API_KEY"
export ANTHROPIC_BASE_URL="https://api.onehop.ai/anthropic"
export CLAUDE_MODEL="anthropic/claude-fable-5"

然后把你的应用接到这些值上。在你用自己的 prompt 对输出、延迟和成本做完对比之前，先在 staging 保留直连 Anthropic 端点作为 fallback。合成 benchmark 有用；你自己的 traces 更有用。

OneHop 的卖点很简单：通过一个 gateway 访问 Claude Fable 5 和其他模型，继续用你已经熟悉的 SDK，并且在测试时支付低于标价的费用。对开发团队来说，这正是好用的无聊。一处配置里的 base URL，一个模型名，一次冒烟测试。

从这个模型页面开始：Claude Fable 5 on OneHop。如果你只是想直接跑上面的代码，不想先开账单讨论，免费领取 10 美元开始。