グロク基盤モデルV9-Mediumの訓練完了 2〜3週間で公開へ

xAIが開発を進めるグロクの基盤モデルV9-Mediumについて、訓練が完了したことがわかりました。パラメータ規模1.5Tのこのモデルは、既存の0.5Tモデルを上回る性能を示しており、特に高度なコーディング作業での向上が期待されています。2〜3週間以内に一般公開される予定です。
訓練完了と性能向上の詳細
グロク基盤モデルV9-Mediumは訓練を終え、評価結果が良好であることが確認されました。補助訓練としてCursorのデータが大量に追加されており、今後もさらなるデータ投入が予定されています。
このモデルは現在運用中の0.5T v8-smallモデルと比べて、特に難しいコーディングタスクで大幅に改善される見込みです。ファインチューニングが進められており、強化学習は数日以内に開始されます。
今後のスケジュール
一般公開までは2〜3週間程度かかるとされています。公開後は幅広い用途での活用が想定されており、開発チームは実用性のさらなる向上を目指しています。
0.5Tモデルのオープン化
同時に、現在の0.5Tモデルについては末に向けオープン化が計画されています。オープン化により、開発コミュニティでの活用や研究が進む可能性があります。
XDOGE
コメント
記事への感想、補足情報、質問などを気軽に投稿できます。
まだコメントはありません。最初のコメントを投稿してみませんか?