Insgesamt 1 Mio. US-Dollar für alle getrackten Versionen dieser Linie.
Typischer 3:1-Output-to-Input-Mix pro 1 Mio. Token
Preis ab 2026-04-28 · Quelle: legacy_model_catalog
Gemischte Text-, Bild-, Audio- und Dokument-Workloads, die modalitätsübergreifend von einem Modell profitieren.
Gemini 2.5 Flash is Google's state-of-the-art workhorse model, specifically designed for advanced reasoning, coding, mathematics, and scientific tasks. It includes built-in "thinking" capabilities, enabling it to prov...
gemini-2.5-flash ist ein Multimodal-Modell von Google (US). HotON.ai verfolgt es bei $0.30 pro 1 Mio. Eingabe-Tokens und $2.50 pro 1 Mio. Ausgabe-Tokens mit einem 1049K-Token-Kontextfenster. Sein zusammengesetzter Effizienzwert beträgt 95/100 bei einem geschätzten $0.002 pro erfolgreicher Aufgabe.
gemini-2.5-flash wird bei $0.30 pro 1 Mio. Eingabe-Tokens und $2.50 pro 1 Mio. Ausgabe-Tokens verfolgt. Eine typische 3:1-Ausgabe-zu-Eingabe-Arbeitslast ergibt ungefähr $1.95 pro 1 Mio. Token. Bei den Zahlen handelt es sich um illustrative Demodaten.
Gemischte Text-, Bild-, Audio- und Dokument-Workloads, die modalitätsübergreifend von einem Modell profitieren.
gemini-2.5-flash unterstützt bis zu einem 1049K-Token-Kontextfenster – groß genug für lange Dokumente und längere Konversationen in einer einzigen Anfrage.
Innerhalb des von HotON.ai erfassten Bestands ist gemini-2.5-flash beim Eingabepreis günstiger als 50% der Modelle und liegt nach Gesamteffizienz auf Platz 37 von 521.
Ja – gpt-4.1-nano ist eine kostengünstigere Option bei $0.40 pro 1 Million Ausgabe-Tokens, deckt aber dennoch ähnliche Multimodal-Anwendungsfälle ab. Vergleichen Sie sie nebeneinander auf HotON.ai.
Die Preise sind real (über den TestKey-Katalog, täglich aktualisiert). Qualität (Arena Elo) ist real, wenn das Modell auf der LMArena-Rangliste steht. Geschwindigkeit, Verfügbarkeit und Effizienz sind modellierte Schätzungen.