일일 혼합 가격($/1M) — 매일 기록되며 시간이 지남에 따라 추세가 형성됩니다.
1M 토큰당 일반적인 3:1 출력-입력 혼합
2026-04-28 기준 가격 · 원천: legacy_model_catalog
답변 품질이 원가보다 더 중요한 복잡한 추론, 분석, 계획 및 다단계 문제 해결.
Qwen3-VL-8B-Thinking은 Qwen3-VL-8B 다중 모달 모델의 추론 최적화 변형으로, 복잡한 장면, 문서, 시간 시퀀스에서의 고급 시각적과 텍스트 추론을 위해 설계되었습니다. 그것은 인터넷을 통합하여 다중 모달 혼합을 개선합니다...
qwen3-vl-8b-thinking는 Alibaba Cloud · Qwen(CN)의 추리 모델입니다. HotON.ai는 131K 토큰 컨텍스트 창을 사용하여 1M 입력 토큰당 $0.12 및 1M 출력 토큰당 $1.37로 이를 추적합니다. 복합 효율성 점수는 성공적인 작업당 추정된 $0.001에서 89/100입니다.
qwen3-vl-8b-thinking는 1M 입력 토큰당 $0.12, 1M 출력 토큰당 $1.37로 추적됩니다. 일반적인 3:1 출력-입력 워크로드는 대략 1M 토큰당 $1.06로 혼합됩니다. 수치는 예시적인 데모 데이터입니다.
답변 품질이 원가보다 더 중요한 복잡한 추론, 분석, 계획 및 다단계 문제 해결.
qwen3-vl-8b-thinking는 최대 131K 토큰 컨텍스트 창을 지원합니다. 이는 단일 요청으로 긴 문서와 확장된 대화를 처리할 수 있을 만큼 충분히 큽니다.
HotON.ai 추적 세트 내에서 qwen3-vl-8b-thinking는 입력 가격에서 모델의 76%보다 저렴하고 전체 효율성 기준으로 522의 #143 순위를 매깁니다.
예 — grok-4-1-fast-non-reasoning는 1M 출력 토큰당 $0.50의 저렴한 옵션이면서도 유사한 추리 사용 사례를 계속 다루고 있습니다. HotON.ai에서 나란히 비교해 보세요.
기사, 신문 또는 AI 프롬프트에 붙여넣을 준비가 되어 있습니다. 가격과 날짜는 실시간 데이터로 새로 고쳐집니다.
HotON.ai — qwen3-vl-8b-thinking (Alibaba Cloud · Qwen): $0.12/1M input, $1.37/1M output, as of 2026-04-28. https://hoton.ai/ko/models/qwen-qwen3-vl-8b-thinking가격은 실제입니다(매일 업데이트되는 TestKey 카탈로그를 통해). 품질(Arena Elo)은 모델이 LMArena에서 순위가 매겨진 곳에서 실제입니다. 속도, 가용성 및 효율성은 모델링된 추정치입니다.