Claude Fable 5 시작하기: 개발자를 위한 실전 가이드

Anthropic은 2026년 6월 9일 Claude Fable 5를 출시했습니다. 핵심은 간단합니다. 이 모델은 일반 공개된 첫 Mythos급 Claude 모델이며, 가격은 입력 토큰 100만 개당 $10, 출력 토큰 100만 개당 $50입니다. 컨텍스트 윈도우는 1M 토큰, 최대 출력은 128k입니다 (Anthropic launch, model docs, pricing docs). 지금 평가해 보려는 중이라면 벤치마크 트윗부터 보지 마세요. 여러분의 백로그에 있는 까다로운 워크플로 하나를 고르고, 연결하고, 지출 한도를 걸고, 더 적은 턴으로 비싼 사용량을 상쇄할 수 있는지 측정하세요.

개발자 앱이 두 경로로 Claude Fable 5를 호출하는 모습을 보여주는 커버 스타일 아키텍처 스케치: Anthropic API 직접 호출

Claude Fable 5의 정체

Claude Fable 5는 Anthropic이 공개한 Mythos급 모델입니다. Anthropic은 Mythos급을 Opus보다 한 단계 위의 티어로 설명합니다. Fable 5는 일반 사용에 맞게 안전하게 다듬어진 모델이고, Mythos 5는 Project Glasswing을 통해 제한된 신뢰 접근에만 제공됩니다 (Anthropic). 개발자 관점에서 말하면 Fable 5는 “Opus로는 부족할 때 쓰는” 모델입니다.

API model ID는 다음과 같습니다.

claude-fable-5

Anthropic의 모델 개요에는 현재 사양이 이렇게 정리되어 있습니다 (Anthropic docs):

모델	API ID	컨텍스트 윈도우	최대 출력	입력	출력
Claude Fable 5	`claude-fable-5`	1M 토큰	128k 토큰	$10 / MTok	$50 / MTok
Claude Opus 4.8	`claude-opus-4-8`	1M 토큰	128k 토큰	$5 / MTok	$25 / MTok
Claude Sonnet 4.6	`claude-sonnet-4-6`	1M 토큰	64k 토큰	$3 / MTok	$15 / MTok
Claude Haiku 4.5	`claude-haiku-4-5-20251001`	200k 토큰	64k 토큰	$1 / MTok	$5 / MTok

이 표를 보면 Fable의 위치가 분명해집니다. 저렴한 기본값이 아닙니다. 작업이 길고, 지저분하고, 틀렸을 때 비용이 큰 경우에 시도할 모델입니다. 예를 들면 멀티 레포 마이그레이션, 에이전트형 코딩, 법률 또는 금융 문서 추론, 긴 계획 수립 작업, 이전 모델들이 수정 루프를 반복하느라 시간을 태웠던 워크플로가 여기에 들어갑니다.

중요한 안전 동작도 하나 있습니다. Anthropic에 따르면 Fable 5는 사이버보안, 생물학과 화학, 증류 같은 영역에 분류기를 사용합니다. 플래그가 지정된 요청은 Claude Opus 4.8로 폴백되고, 사용자에게 그 사실이 안내됩니다 (Anthropic). Anthropic은 초기 Fable 세션의 95% 이상에서는 폴백이 없었다고도 말합니다. 여러분의 제품이 이런 도메인 근처에 있다면 폴백 경로를 반드시 명시적으로 테스트하세요.

가격: 실제로 돈이 새는 지점

정가는 명확합니다. 입력 $10 / MTok, 출력 $50 / MTok입니다. 프롬프트 캐싱은 Anthropic의 표준 배수 구조를 따릅니다. 5분 캐시 쓰기는 입력의 1.25배, 1시간 캐시 쓰기는 입력의 2배, 캐시 읽기는 입력의 0.1배입니다 (Anthropic pricing). Fable 5 기준으로는 이렇게 됩니다.

과금 항목	Fable 5 가격
입력	$10 / MTok
출력	$50 / MTok
5분 캐시 쓰기	$12.50 / MTok
1시간 캐시 쓰기	$20 / MTok
캐시 읽기 / 새로고침	$1 / MTok

Anthropic의 Fable 제품 페이지에는 입력과 출력 토큰에 대해 1.1배 가격으로 미국 전용 추론을 사용할 수 있다고도 나와 있습니다 (Anthropic Fable page). 데이터 레지던시 요구사항이 있는 고객을 대상으로 제품을 만든다면 중요한 포인트입니다.

OneHop의 경우 현재 모델 페이지에 anthropic/claude-fable-5, 1000K 컨텍스트 라벨, Anthropic Messages 지원, 카드 없이 신규 계정에 $10 무료 크레딧을 제공한다는 내용이 표시됩니다 (OneHop). OneHop 페이지에는 공식 요금보다 할인된 가격도 표시됩니다. Anthropic 직접 과금 설정 없이 가장 빠르게 평가하고 싶다면 OneHop의 Claude Fable 5에서 시작하거나 $10 무료로 시작하세요.

Fable 5, Opus 4.8, Sonnet 4.6, Haiku 4.5의 100만 토큰당 입력 및 출력 가격을 비교하는 간결한 막대 차트

안개 걷어낸 벤치마크

Anthropic은 Fable 5가 “테스트한 거의 모든 벤치마크에서 최첨단”이며, 길고 복잡한 작업에서 가장 강하다고 말합니다 (Anthropic). Anthropic 출시 글의 벤치마크 표는 이미지로 게시되어 있으니, 다른 곳에 복사된 숫자는 평가자가 실행 결과를 직접 호스팅하지 않는 한 벤더 보고 수치로 보는 게 맞습니다.

개발자들이 계속 비교하는 숫자는 코딩 중심입니다.

벤치마크	Claude Fable 5	Claude Opus 4.8	출처 맥락
SWE-Bench Pro	80.3%	69.2%	Anthropic 출시 표에 대한 서드파티 요약에서 보고됨 (TrueFoundry)
SWE-bench Verified	95.0%	88.6%	Anthropic/system-card 요약에서 보고됨 (LMM Marketcap)
FrontierCode Diamond	29.3%	13.4%	Anthropic/system-card 요약에서 보고됨 (LMM Marketcap)

이 숫자는 테스트해 볼 이유로 쓰세요. 구매 결정을 대신하게 해서는 안 됩니다. Fable 5의 핵심 제안은 긴 지평의 자율성입니다. 10분짜리 채팅 프롬프트로는 많은 걸 알 수 없습니다. 실제 마이그레이션 브랜치, 프로덕션 장애 대응 런북, 또는 “이 40개 파일을 읽고 가장 작고 안전한 패치를 제안하라” 같은 지저분한 작업에서 드러납니다.

Anthropic SDK로 직접 호출하기

Anthropic의 공식 SDK는 Python, TypeScript, Go, Java, C#, PHP, Ruby를 지원하며, 언어에 따라 스트리밍, 재시도, 타입 인터페이스를 제공합니다 (Anthropic SDK docs). 가장 작은 실용 Python 호출은 다음과 같습니다.

설치:

python -m venv .venv
source .venv/bin/activate
pip install anthropic
export ANTHROPIC_API_KEY="sk-ant-..."

fable.py 생성:

from anthropic import Anthropic

client = Anthropic(api_key=os.environ["ANTHROPIC_API_KEY"])

message = client.messages.create(
    model="claude-fable-5",
    max_tokens=800,
    messages=[
        {
            "role": "user",
            "content": "Review this migration plan for risk. Return the top 5 issues and concrete fixes.",
        }
    ],
)

print(message.content[0].text)

실행:

python fable.py

한 가지 수정할 점이 있습니다. 이 코드를 파일에 그대로 복사한다면 빠진 import를 추가하세요.

import os

Node.js에서는 이렇게 합니다.

npm install @anthropic-ai/sdk
export ANTHROPIC_API_KEY="sk-ant-..."

import Anthropic from "@anthropic-ai/sdk";

const client = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY,
});

const message = await client.messages.create({
  model: "claude-fable-5",
  max_tokens: 800,
  messages: [
    {
      role: "user",
      content: "Turn this product brief into an implementation plan with risks and test cases.",
    },
  ],
});

console.log(message.content[0].type === "text" ? message.content[0].text : message.content);

첫 테스트에서는 max_tokens를 낮게 유지하세요. 이 모델에서 비싼 쪽은 출력입니다.

base URL 변경으로 OneHop을 통해 호출하기

Fable 5를 빠르게 평가하고 싶다면 OneHop이 마찰이 가장 적은 경로입니다. 계정을 만들고, 무료 시작 크레딧을 받은 다음, 직접 provider 과금을 연결하는 대신 클라이언트가 OneHop을 바라보게 하면 됩니다. 현재 OneHop 모델 페이지에는 Anthropic Messages 지원과 함께 Anthropic SDK에서 base_url="https://api.onehop.ai/anthropic"을 쓰는 Python 예제가 표시되어 있습니다 (OneHop).

같은 SDK를 설치합니다.

pip install anthropic
export ONEHOP_API_KEY="oh_..."

OneHop 경로를 사용합니다.

import os
from anthropic import Anthropic

client = Anthropic(
    base_url="https://api.onehop.ai/anthropic",
    api_key=os.environ["ONEHOP_API_KEY"],
)

message = client.messages.create(
    model="anthropic/claude-fable-5",
    max_tokens=800,
    messages=[
        {
            "role": "user",
            "content": "Analyze this failing CI log and suggest the smallest likely fix.",
        }
    ],
)

print(message.content[0].text)

실질적으로는 이게 드롭인 변경입니다. 같은 Anthropic SDK 형태, 다른 base_url, 다른 API 키, 그리고 OneHop의 모델 이름입니다.

통합 구조가 OpenAI 스타일 게이트웨이를 표준으로 삼고 있다면 OneHop의 변환 경로도 같은 방식입니다. 게이트웨이 base URL을 https://api.onehop.ai/v1로 설정하고, OneHop 키를 넘기고, OneHop의 모델 ID를 통해 Claude Fable 5로 요청을 라우팅하면 됩니다. 프로덕션에서는 provider 경로를 설정 뒤에 숨기세요.

LLM_BASE_URL="https://api.onehop.ai/v1"
LLM_MODEL="anthropic/claude-fable-5"

애플리케이션 로직에 하드코딩하지 마세요. 환경 변수로 만들어야 같은 하네스에서 Fable 5, Opus 4.8, 더 저렴한 모델들을 비교할 수 있습니다.

변경된 설정 세 줄만 보여주는 전후 코드 diff 일러스트: API 키 환경 변수, base URL, 모델 이름

현실적인 평가 계획

실제 트래픽을 옮기기 전에 저는 이렇게 평가하겠습니다.

현재 실패하거나 수정 턴이 너무 많이 필요한 작업 세 개를 고릅니다.
같은 프롬프트로 현재 모델과 Fable 5에서 실행합니다.
입력 토큰, 출력 토큰, 벽시계 시간, 재시도, 사람의 수정량을 기록합니다.
어떤 요청이 Opus 4.8로 폴백되는지 확인합니다.
가장 가치가 높은 작업 유형에만 Fable 5를 라우팅합니다.

이 모델은 충분히 비싸기 때문에 대부분의 팀에서 “기본값으로 만들자”는 아마 틀린 판단입니다. 더 나은 아키텍처는 라우터입니다. 저렴한 추출에는 Haiku나 Sonnet, 강한 범용 작업에는 Opus, 자율성과 컨텍스트 깊이가 중요한 몇몇 작업에는 Fable을 쓰는 식입니다.

진지하게 쓰려면 프롬프트 캐싱도 필수입니다. 요청마다 같은 레포 요약, 정책 묶음, 스키마, 긴 지시 블록이 들어간다면 캐시하세요. Fable 5에서는 캐시 읽기가 $10 / MTok이 아니라 $1 / MTok이므로 경제성이 빠르게 달라집니다.

세 가지 워크로드 레인을 보여주는 라우팅 다이어그램: 저렴한 추출은 Haiku/Sonnet, 일반 추론은 Opus 4.8, 가장 어려운 장기 작업은 Fable

스파이크를 배포하고, 그다음 결정하세요

Claude Fable 5는 병목이 “더 싼 completion이 필요하다”가 아니라 “크고 여러 단계로 이루어진 작업에서 모델이 끝까지 일관성을 유지해야 한다”일 때 테스트할 가치가 있습니다. 현재 확인된 사실만으로도 스파이크를 정당화하기에는 충분합니다. 6월 9일 출시, 1M 컨텍스트, 128k 최대 출력, $10 / $50 정가, 프롬프트 캐시 할인, 그리고 프로덕션 전에 이해해야 할 안전 폴백까지 갖추고 있습니다.

가장 빠른 길은 Anthropic SDK를 직접 쓰거나 같은 형태의 호출을 OneHop으로 보내는 것입니다. 과금 설정을 피하고 실전 평가만 바로 돌리고 싶다면 OneHop의 Claude Fable 5를 열고, 모델 ID를 가져온 뒤, $10 무료로 시작하세요. 그런 다음 여러분의 가장 어려운 실제 작업을 실행하세요. 여러분의 코드베이스와 부딪힌 뒤에도 살아남는 벤치마크는 그것뿐입니다.