今日のニュース内容は「AMDが独自開発の推論モデル「Instella-Math」を公開」
出典:AMDが独自開発の推論モデル「Instella-Math」を公開
公開日 2025年08月12日 11時16分AMDが、AMDのGPUのみでトレーニングしたという言語モデル「Instella-Math」を発表しました。パラメーター数は30億で、推論や数学的問題解決等に特化しているとのことです。
ニュースチェック(2025-08-14)https://gigazine.net/news/20250812-amd-instella-math/
これはAMDにとって重要なマイルストーンとなる発表です。
Instella-Mathの概要 💡
「Instella-Math」は、AMDが開発した推論に特化した30億パラメータの言語モデルです。特に、多段階の論理的推論、数学的問題解決、思考連鎖(Chain-of-Thought)タスクに最適化されています。
最も注目すべき点は、このモデルがAMDのGPU(Instinct MI300X)のみで学習された、初の完全オープンな数学推論モデルであるということです。AMDは、モデルのアーキテクチャ、学習コード、重み、データセットをすべて公開しており、AIコミュニティ全体でのコラボレーション、透明性、進歩を促進することを目指しています。
技術的な詳細と特徴 🚀
Instella-Mathは、AMDのROCm™ソフトウェアスタック上に構築されており、効率的な分散学習技術を活用しています。
- パラメータ数: 30億
- 学習に使用されたGPU: 32基のAMD Instinct MI300X GPU
- 学習方法:
- ベースモデルである「Instella-3B-Instruct」から派生。
- 2段階の教師ありファインチューニングと、3段階の**強化学習(GRPOアルゴリズムを使用)**からなる多段階の学習パイプラインを採用。
- 特に、思考連鎖(Chain-of-Thought)強化学習をAMD GPU上で完全に実行した初めての言語モデルとされています。
- オープンソース: モデルの重み、学習セットアップ、コードベース、データセットが完全にオープンソースとして公開されています。これにより、研究者、教育者、開発者はモデルを自由に調査、使用、修正、あるいは基盤として利用することができます。
Instellaファミリーの一員 🧬
Instella-Mathは、AMDが公開している「Instella」言語モデルファミリーの一員です。以前にもAMDは、30億パラメータの汎用言語モデル「Instella」や、視覚言語モデル「Instella-VL-1B」を発表しており、Instella-Mathはこの推論特化型モデルとして加わりました。
AMDのAI戦略における意義 🎯
この発表は、AMDのAI戦略において非常に大きな意味を持ちます。
- ハードウェアとソフトウェアの統合: AMDは、自社のGPU(MI300X)とROCmソフトウェアスタックの組み合わせが、最先端のAIワークロード、特に強化学習やファインチューニングにおいて優れたスケーラビリティとパフォーマンスを発揮できることを示しました。
- オープンイノベーションへのコミットメント: モデル、学習コード、データセットを完全にオープンソース化することで、AMDはAIコミュニティ全体の発展に貢献し、自社エコシステムの採用を促進しようとしています。
- 推論能力の強化: 数学や論理的推論といった分野は、AIモデルにとって特に難しい領域です。Instella-Mathがこれらのタスクで競争力のあるパフォーマンスを示したことは、AMDのAI技術力の高さを示しています。
今後の展望 ✨
Instella-Mathの公開により、AMDはAI分野における存在感をさらに高めていくと考えられます。特に、高性能な推論モデルがオープンソースで提供されることで、より多くの開発者や企業がAMDのハードウェアとソフトウェアを活用したAIアプリケーションを開発するきっかけとなるでしょう。これは、NVIDIAが先行するAIハードウェア市場において、AMDが競争力を高める上での重要な一手となる可能性があります。