Prezzo combinato giornaliero ($/1 milione): registrato ogni giorno, si sviluppa in una tendenza nel tempo.
Tipico mix output-input 3:1, per 1 milione di token
Prezzo a partire da 2026-05-11 · Fonte: arcee_ai_reference_catalog
Ragionamento complesso, analisi, pianificazione e risoluzione di problemi in più fasi in cui la qualità della risposta conta più del costo grezzo.
Trinity Large Thinking is a powerful open source reasoning model from the team at Arcee AI. It shows strong performance in PinchBench, agentic workloads, and reasoning tasks. Launch video: https://youtu.be/Gc82AXLa0Rg...
trinity-large-thinking è un modello Ragionamento di Arcee Ai (US). HotON.ai lo tiene traccia di $0.22 per 1 milione di token di input e $0.85 per 1 milione di token di output, con una finestra di contesto del token 262K. Il suo punteggio di efficienza composito è 90/100 con un $0.001 stimato per attività riuscita.
trinity-large-thinking viene tracciato su $0.22 per 1 milione di token di input e $0.85 per 1 milione di token di output. Un tipico carico di lavoro output-to-input 3:1 si riduce a circa $0.69 per 1 milione di token. Le cifre sono dati dimostrativi illustrativi.
Ragionamento complesso, analisi, pianificazione e risoluzione di problemi in più fasi in cui la qualità della risposta conta più del costo grezzo.
trinity-large-thinking supporta fino a una finestra di contesto del token 262K, abbastanza grande per documenti lunghi e conversazioni estese in un'unica richiesta.
All'interno dell'insieme tracciato HotON.ai, trinity-large-thinking è più economico della 61% dei modelli sul prezzo di input e si classifica #76 di 521 in base all'efficienza complessiva.
Sì: qwen-plus-2025-07-28:thinking è un'opzione a costo inferiore a $0.78 per 1 milione di token di output, pur coprendo casi d'uso Ragionamento simili. Confrontali fianco a fianco su HotON.ai.
Il prezzo è reale (tramite il catalogo TestKey, aggiornato quotidianamente). La qualità (Arena Elo) è reale quando il modello è classificato su LMArena. Velocità, disponibilità ed efficienza sono stime modellate.