일일 혼합 가격($/1M) — 매일 기록되며 시간이 지남에 따라 추세가 형성됩니다.
1M 토큰당 일반적인 3:1 출력-입력 혼합
원천: litellm
광범위한 기능과 저렴한 비용이 가장 중요한 범용 텍스트 생성, 채팅, 요약 및 콘텐츠 워크로드입니다.
Azure OpenAI realtime deployment reference; endpoint, region, deployment name, and API version are required.
gpt-4o-realtime-preview는 Azure OpenAI(US)의 텍스트 모델입니다. HotON.ai는 128K 토큰 컨텍스트 창을 사용하여 1M 입력 토큰당 $5.00 및 1M 출력 토큰당 $20.00로 이를 추적합니다. 복합 효율성 점수는 성공적인 작업당 추정된 $0.020에서 80/100입니다.
gpt-4o-realtime-preview는 1M 입력 토큰당 $5.00, 1M 출력 토큰당 $20.00로 추적됩니다. 일반적인 3:1 출력-입력 워크로드는 대략 1M 토큰당 $16.25로 혼합됩니다. 수치는 예시적인 데모 데이터입니다.
광범위한 기능과 저렴한 비용이 가장 중요한 범용 텍스트 생성, 채팅, 요약 및 콘텐츠 워크로드입니다.
gpt-4o-realtime-preview는 최대 128K 토큰 컨텍스트 창을 지원합니다. 이는 단일 요청으로 긴 문서와 확장된 대화를 처리할 수 있을 만큼 충분히 큽니다.
HotON.ai 추적 세트 내에서 gpt-4o-realtime-preview는 입력 가격에서 모델의 5%보다 저렴하고 전체 효율성 기준으로 521의 #497 순위를 매깁니다.
예 — minimax-m2.5는 1M 출력 토큰당 $0.99의 저렴한 옵션이면서도 유사한 텍스트 사용 사례를 계속 다루고 있습니다. HotON.ai에서 나란히 비교해 보세요.
가격은 실제입니다(매일 업데이트되는 TestKey 카탈로그를 통해). 품질(Arena Elo)은 모델이 LMArena에서 순위가 매겨진 곳에서 실제입니다. 속도, 가용성 및 효율성은 모델링된 추정치입니다.