In diesem Tutorial verwenden wir GEPA als reflektives Prompt-Evolution-Framework, um zu verbessern, wie ein kleines Sprachmodell mehrstufige arithmetische Wortprobleme löst. Wir gehen von einem schwachen Seed-Prompt aus und bauen einen deterministischen Benchmark auf.
Neue Modelle setzen die Leistungs- und Preis-Leistungs-Grenze neu. Die Teams bewerten neu, worauf sie aufbauen können, wenn eine Markteinführung das Mögliche pro Dollar verändert.
Zusammenfassungen werden nur zu Informationszwecken aggregiert – folgen Sie dem Quelllink für die vollständige Geschichte. Demo-Einträge dienen der Veranschaulichung.