Täglicher gemischter Preis ($/1 Mio.) – wird jeden Tag aufgezeichnet und bildet im Laufe der Zeit einen Trend.
Typischer 3:1-Output-to-Input-Mix pro 1 Mio. Token
Preis ab 2026-05-11 · Quelle: alfredpros_reference_catalog
Codegenerierung, Refactoring und Überprüfung sowie Entwickler-Tooling-Workloads mit großem Kontext.
A finetuned 7 billion parameters Code LLaMA - Instruct model to generate Solidity smart contract using 4-bit QLoRA finetuning provided by PEFT library.
codellama-7b-instruct-solidity ist ein Code-Modell von Alfredpros (US). HotON.ai verfolgt es bei $0.80 pro 1 Mio. Eingabe-Tokens und $1.20 pro 1 Mio. Ausgabe-Tokens mit einem 4K-Token-Kontextfenster. Sein zusammengesetzter Effizienzwert beträgt 88/100 bei einem geschätzten $0.002 pro erfolgreicher Aufgabe.
codellama-7b-instruct-solidity wird bei $0.80 pro 1 Mio. Eingabe-Tokens und $1.20 pro 1 Mio. Ausgabe-Tokens verfolgt. Eine typische 3:1-Ausgabe-zu-Eingabe-Arbeitslast ergibt ungefähr $1.10 pro 1 Mio. Token. Bei den Zahlen handelt es sich um illustrative Demodaten.
Codegenerierung, Refactoring und Überprüfung sowie Entwickler-Tooling-Workloads mit großem Kontext.
codellama-7b-instruct-solidity unterstützt bis zu einem 4K-Token-Kontextfenster – groß genug für lange Dokumente und längere Konversationen in einer einzigen Anfrage.
Innerhalb des von HotON.ai erfassten Bestands ist codellama-7b-instruct-solidity beim Eingabepreis günstiger als 34% der Modelle und liegt nach Gesamteffizienz auf Platz 303 von 521.
Ja – qwen3-coder-flash ist eine kostengünstigere Option bei $0.98 pro 1 Million Ausgabe-Tokens, deckt aber dennoch ähnliche Code-Anwendungsfälle ab. Vergleichen Sie sie nebeneinander auf HotON.ai.
Die Preise sind real (über den TestKey-Katalog, täglich aktualisiert). Qualität (Arena Elo) ist real, wenn das Modell auf der LMArena-Rangliste steht. Geschwindigkeit, Verfügbarkeit und Effizienz sind modellierte Schätzungen.