Memadukan $/1 juta di seluruh versi terlacak dari baris ini.
Campuran output-to-input 3:1, per 1 juta token
Sumber: litellm
Pembuatan teks, obrolan, ringkasan, dan beban kerja konten untuk tujuan umum yang mengutamakan kemampuan luas dan biaya rendah.
OpenAI GPT Realtime 2 is a reasoning realtime voice model for low-latency speech-to-speech interactions and tool use.
gpt-realtime-2 adalah model Teks dari OpenAI (US). HotON.ai melacaknya pada $4.00 per 1 juta token masukan dan $16.00 per 1 juta token keluaran, dengan jendela konteks token 128K. Skor efisiensi gabungannya adalah 82/100 dengan perkiraan $0.016 per tugas yang berhasil.
gpt-realtime-2 dilacak pada $4.00 per 1 juta token masukan dan $16.00 per 1 juta token keluaran. Beban kerja output-to-input 3:1 rata-rata berpadu menjadi $13.00 per 1 juta token. Angka adalah ilustrasi data demo.
Pembuatan teks, obrolan, ringkasan, dan beban kerja konten untuk tujuan umum yang mengutamakan kemampuan luas dan biaya rendah.
gpt-realtime-2 mendukung hingga jendela konteks token 128K — cukup besar untuk dokumen panjang dan percakapan panjang dalam satu permintaan.
Dalam rangkaian terlacak HotON.ai, gpt-realtime-2 lebih murah dibandingkan 7% model dalam hal harga input dan menempati peringkat #485 dari 521 berdasarkan efisiensi keseluruhan.
Ya — minimax-m2.5 adalah opsi berbiaya lebih rendah di $0.99 per 1 juta token keluaran, namun tetap mencakup kasus penggunaan Teks yang serupa. Bandingkan keduanya secara berdampingan di HotON.ai.
Harga nyata (melalui katalog TestKey, diperbarui setiap hari). Kualitas (Arena Elo) nyata dimana modelnya diperingkat di LMArena. Kecepatan, ketersediaan, dan efisiensi merupakan perkiraan yang dimodelkan.