← 全部文章
Guide

通过 OneHop 即插即用访问 Claude API

A cream-background vector cover showing a developer terminal connected through a terracotta OneHop-style gateway node to

Claude Fable 5 于 2026 年 6 月 9 日发布,价格已经把 Anthropic 对它的定位说得很清楚:通过 Claude API 调用,每百万输入 token 10 美元、每百万输出 token 50 美元(Anthropic)。这不是拿来当默认自动补全的模型。它适合那些流程长、出错代价高、值得更强模型认真跑一遍的任务。

好处是:如果你的应用已经在用 Anthropic SDK,就不需要为了通过 OneHop 试用它而重写客户端层。你可以继续用 client.messages.create(...),继续保留 Anthropic 的消息结构,只要把 SDK 指向 OneHop 的 Anthropic 兼容端点即可。

前后集成示意图,两个并排面板:左侧显示应用直接通过 api 调用 Anthropic。

为什么 Fable 5 改变了路由这件事

Anthropic 将 Claude Fable 5 描述为一个面向通用使用做过安全处理的 “Mythos-class” 模型,能力高于它此前任何已普遍开放的模型(Anthropic)。Claude API 中的模型 ID 是 claude-fable-5,Anthropic 表示它可通过 Claude Platform 和云市场使用(Anthropic)。

对开发者来说,有两个细节很重要。

第一,Fable 5 的定价就是顶级模型的定价:输入 $10/M、输出 $50/M,同时 Anthropic 针对 prompt caching 的 90% 输入 token 折扣仍然适用(Anthropic)。Anthropic 还表示,仅限美国的推理可用,输入和输出 token 均按 1.1 倍价格计费(Anthropic)。

第二,Fable 内置了安全保护。Anthropic 表示,网络安全、生物和化学,或被分类器标记的蒸馏请求,会自动改由 Claude Opus 4.8 处理;早期数据显示,超过 95% 的 Fable 会话没有触发 fallback(Anthropic)。如果你的产品涉及安全研究、生物或化学工作流,就应该把它视为产品行为,而不是边缘情况。

这正是 gateway 发挥价值的地方。通常你并不希望每个请求都打到最贵的模型。你想要的是一个集成点、一把 key、清晰的账单,以及把普通任务路由到更便宜模型、只把值得的 prompt 留给 Fable 的能力。

OneHop 能给你什么

OneHop 将自己定位为 AI gateway:一个账号、一层 API、访问多个提供商的模型。它的首页写明支持 OpenAI、Anthropic 和 Vertex 协议,并且你可以“把 base_url 指向 OneHop,继续使用你现有的 SDK 和代码”(OneHop)。

具体到 Claude Fable 5,OneHop 列出的模型信息如下:

项目当前值
OneHop 模型名anthropic/claude-fable-5
上下文1M tokens
已列能力vision, reasoning, tool calling, coding, prompt cache
Anthropic 标价$10/M input, $50/M output
OneHop 目录价格$7/M input,标注 “Save 30%”
OneHop 详情页价格$5/M input, $25/M output, “Verified 2026-06-10”

来源:OneHop 的模型目录列出 Claude Fable 5 为 1M 上下文,价格 $7.00/M,并标注 “Save 30%”(OneHop models)。Fable 详情页目前显示输入 $5.00/M、输出 $25.00/M,cache read 为 $0.500/M,cache write 为 $6.25/M,验证日期为 2026-06-10(OneHop Fable 5)。

这个差异值得单独指出,因为价格会变。更稳妥的说法是:OneHop 目前正在以低于 Anthropic 标价的价格推广 Claude Fable 5,并且它的实时模型目录里至少展示了 30% 的折扣。在你把价格假设写进上线计划之前,先检查模型页面。

OneHop 还在 Fable 页面为新账号提供 10 美元免费额度,无需绑卡(OneHop Fable 5)。如果你只是想快速冒烟测试一下集成,可以从 Claude Fable 5 on OneHop 开始,或者免费领取 10 美元开始

紧凑的价格对比条形图,对比 Anthropic 标价、OneHop 目录价格和 OneHop 详情页价格

即插即用的 Anthropic SDK 设置

安装官方 Anthropic Python SDK:

python -m venv .venv
source .venv/bin/activate
pip install anthropic

设置你的 OneHop key:

export ONEHOP_API_KEY="oh_your_key_here"

然后继续使用你已经熟悉的 Anthropic SDK 结构。关键就是 base_url 这一行。

import os
from anthropic import Anthropic

client = Anthropic(
    api_key=os.environ["ONEHOP_API_KEY"],
    base_url="https://api.onehop.ai/anthropic",
)

message = client.messages.create(
    model="anthropic/claude-fable-5",
    max_tokens=800,
    messages=[
        {
            "role": "user",
            "content": (
                "You are reviewing a Python web service. "
                "List the three highest-risk failure modes in its request pipeline "
                "and give one concrete test for each."
            ),
        }
    ],
)

print(message.content[0].text)

这就是 OneHop 的 Claude Fable 5 页面展示的真实 Anthropic SDK 路径:用于支持 Anthropic Messages streaming 的 https://api.onehop.ai/anthropicOneHop Fable 5)。OneHop 通用的 OpenAI 兼容 base URL 是 https://api.onehop.ai/v1OneHop),但对于 Anthropic Python SDK,请使用上面的 Anthropic 兼容 base URL。把这两个搞混,是拿到一个让人摸不着头脑的 404 的最快方式。

如果你现有代码已经从环境变量读取配置,迁移还会更小:

client = Anthropic(
    api_key=os.environ["ANTHROPIC_API_KEY"],
    base_url=os.environ.get("ANTHROPIC_BASE_URL", "https://api.anthropic.com"),
)

然后像这样通过 OneHop 运行:

export ANTHROPIC_API_KEY="$ONEHOP_API_KEY"
export ANTHROPIC_BASE_URL="https://api.onehop.ai/anthropic"

你的调用点保持无聊就好:

client.messages.create(
    model="anthropic/claude-fable-5",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Refactor this API design for lower latency."}],
)

官方 Anthropic SDK 在 Python SDK 文档中支持 messages.create、streaming、token 使用量报告、重试和长请求指导(Anthropic docs)。OneHop 在这里有用,是因为你没有替换这套接口表面。你只是改变了 HTTP 请求落到哪里。

极简代码 diff 示意图,只显示两处改动:API key 环境变量,以及从 Anthropic 直连改成 base_url

Gateway 什么时候有用,什么时候没用

当你在意采用速度时,可以用 OneHop 跑 Fable 5。如果你的产品已经有 Anthropic 抽象层,gateway 访问能让你把 Fable 放在 feature flag 后面测试,而不动业务逻辑。你可以只把难题路由过去:多文件代码迁移、长上下文分析、高成本客户升级、会烧掉人力时间的规划任务。

当团队同时在用不止一个模型家族时,它也有帮助。OneHop 的模型页面在同一个目录下列出了 Anthropic、OpenAI、Google、DeepSeek、MiniMax 等模型(OneHop models)。这在生产环境里很重要,因为模型选择不再是哲学争论,而会变成策略:分类用便宜模型,草稿用中档模型,失败成本高于 token 成本的任务交给 Fable 5。

不要把 gateway 当成逃避理解模型行为的办法。Fable 5 有安全 fallback 行为。根据 Anthropic 的 Fable 页面,它为了安全监控会保留 30 天数据(Anthropic)。它也贵到足以让不受限制的 agent 循环真正伤到钱包。你仍然需要请求日志、预算上限、针对重复上下文的 prompt caching,以及清晰的路由规则。

一个合理的起步策略可以像这样:

工作负载建议路由
分类、抽取、短 JSON 转换更便宜的快速模型
常规代码解释或文档草稿Sonnet/Opus-class route
多步骤代码库迁移或疑难调试Claude Fable 5
安全、生物、化学敏感 prompt预期会有 Anthropic fallback 行为
复用的长 system prompts 或文档在支持的地方启用 prompt caching

关键是让 Fable 的使用保持有意图。把它当成高级工程师的时间:不要花在每张工单上,但工作真的很难时,也别犹豫。

上线最小可行迁移

如果是生产 rollout,我会把 gateway 切换做成配置变更,而不是代码分叉。

添加三个环境变量:

export ANTHROPIC_API_KEY="$ONEHOP_API_KEY"
export ANTHROPIC_BASE_URL="https://api.onehop.ai/anthropic"
export CLAUDE_MODEL="anthropic/claude-fable-5"

然后把你的应用接到这些值上。在你用自己的 prompt 对输出、延迟和成本做完对比之前,先在 staging 保留直连 Anthropic 端点作为 fallback。合成 benchmark 有用;你自己的 traces 更有用。

OneHop 的卖点很简单:通过一个 gateway 访问 Claude Fable 5 和其他模型,继续用你已经熟悉的 SDK,并且在测试时支付低于标价的费用。对开发团队来说,这正是好用的无聊。一处配置里的 base URL,一个模型名,一次冒烟测试。

从这个模型页面开始:Claude Fable 5 on OneHop。如果你只是想直接跑上面的代码,不想先开账单讨论,免费领取 10 美元开始