일일 혼합 가격($/1M) — 매일 기록되며 시간이 지남에 따라 추세가 형성됩니다.
1M 토큰당 일반적인 3:1 출력-입력 혼합
2026-05-11 기준 가격 · 원천: inception_reference_catalog
광범위한 기능과 저렴한 비용이 가장 중요한 범용 텍스트 생성, 채팅, 요약 및 콘텐츠 워크로드입니다.
Inception Mercury 2 Instant is the low-latency reasoning_effort mode for near-realtime chat workflows.
mercury-2-instant는 Inception(US)의 텍스트 모델입니다. HotON.ai는 128K 토큰 컨텍스트 창을 사용하여 1M 입력 토큰당 $0.25 및 1M 출력 토큰당 $0.75로 이를 추적합니다. 복합 효율성 점수는 성공적인 작업당 추정된 $0.001에서 89/100입니다.
mercury-2-instant는 1M 입력 토큰당 $0.25, 1M 출력 토큰당 $0.75로 추적됩니다. 일반적인 3:1 출력-입력 워크로드는 대략 1M 토큰당 $0.63로 혼합됩니다. 수치는 예시적인 데모 데이터입니다.
광범위한 기능과 저렴한 비용이 가장 중요한 범용 텍스트 생성, 채팅, 요약 및 콘텐츠 워크로드입니다.
mercury-2-instant는 최대 128K 토큰 컨텍스트 창을 지원합니다. 이는 단일 요청으로 긴 문서와 확장된 대화를 처리할 수 있을 만큼 충분히 큽니다.
HotON.ai 추적 세트 내에서 mercury-2-instant는 입력 가격에서 모델의 58%보다 저렴하고 전체 효율성 기준으로 521의 #134 순위를 매깁니다.
예 — deepseek/deepseek-v4-flash는 1M 출력 토큰당 $0.28의 저렴한 옵션이면서도 유사한 텍스트 사용 사례를 계속 다루고 있습니다. HotON.ai에서 나란히 비교해 보세요.
가격은 실제입니다(매일 업데이트되는 TestKey 카탈로그를 통해). 품질(Arena Elo)은 모델이 LMArena에서 순위가 매겨진 곳에서 실제입니다. 속도, 가용성 및 효율성은 모델링된 추정치입니다.