일일 혼합 가격($/1M) — 매일 기록되며 시간이 지남에 따라 추세가 형성됩니다.
1M 토큰당 일반적인 3:1 출력-입력 혼합
2026-05-11 기준 가격 · 원천: arcee_ai_reference_catalog
답변 품질이 원가보다 더 중요한 복잡한 추론, 분석, 계획 및 다단계 문제 해결.
Trinity Large Thinking is a powerful open source reasoning model from the team at Arcee AI. It shows strong performance in PinchBench, agentic workloads, and reasoning tasks. Launch video: https://youtu.be/Gc82AXLa0Rg...
trinity-large-thinking는 Arcee Ai(US)의 추리 모델입니다. HotON.ai는 262K 토큰 컨텍스트 창을 사용하여 1M 입력 토큰당 $0.22 및 1M 출력 토큰당 $0.85로 이를 추적합니다. 복합 효율성 점수는 성공적인 작업당 추정된 $0.001에서 90/100입니다.
trinity-large-thinking는 1M 입력 토큰당 $0.22, 1M 출력 토큰당 $0.85로 추적됩니다. 일반적인 3:1 출력-입력 워크로드는 대략 1M 토큰당 $0.69로 혼합됩니다. 수치는 예시적인 데모 데이터입니다.
답변 품질이 원가보다 더 중요한 복잡한 추론, 분석, 계획 및 다단계 문제 해결.
trinity-large-thinking는 최대 262K 토큰 컨텍스트 창을 지원합니다. 이는 단일 요청으로 긴 문서와 확장된 대화를 처리할 수 있을 만큼 충분히 큽니다.
HotON.ai 추적 세트 내에서 trinity-large-thinking는 입력 가격에서 모델의 61%보다 저렴하고 전체 효율성 기준으로 521의 #76 순위를 매깁니다.
예 — qwen-plus-2025-07-28:thinking는 1M 출력 토큰당 $0.78의 저렴한 옵션이면서도 유사한 추리 사용 사례를 계속 다루고 있습니다. HotON.ai에서 나란히 비교해 보세요.
가격은 실제입니다(매일 업데이트되는 TestKey 카탈로그를 통해). 품질(Arena Elo)은 모델이 LMArena에서 순위가 매겨진 곳에서 실제입니다. 속도, 가용성 및 효율성은 모델링된 추정치입니다.