このチュートリアルでは、コードの事前トレーニング研究のための大規模なメタデータ インデックスとして、NVIDIA の Nemotron-Pretraining-Code-v3 データセットを使用します。データセットをダウンロードする代わりにストリーミングし、そのスキーマを検査し、構築します。
新しいモデルは、機能と価格パフォーマンスの最前線をリセットします。チームは、ローンチによって 1 ドルあたりの可能性が変わるたびに、何を構築するかを再評価します。
概要は情報提供のみを目的としてまとめられています。全文についてはソース リンクを参照してください。デモのエントリは一例です。