Dans ce didacticiel, nous travaillons avec l'ensemble de données Nemotron-Pretraining-Code-v3 de NVIDIA en tant qu'index de métadonnées à grande échelle pour la recherche sur la pré-entraînement du code. Nous diffusons l'ensemble de données au lieu de le télécharger, inspectons son schéma et construisons…
Les nouveaux modèles repoussent les limites des capacités et du rapport qualité-prix. Les équipes réévaluent les éléments sur lesquels s'appuyer chaque fois qu'un lancement modifie ce qui est possible par dollar.
Les résumés sont regroupés à titre d’information uniquement – suivez le lien source pour l’histoire complète. Les entrées de démonstration sont illustratives.