1. 料金の全体構造(3要素)

Microsoft Foundry のファインチューニングにかかるコストは、以下の 3 つの要素 で構成されます。

ファインチューニングのコスト構造

# 費用項目 課金単位 発生タイミング
① トレーニング料金 トークン数 or 時間 学習データ量 × エポック数 学習ジョブ実行中のみ(1回限り)
② ホスティング料金 時間(hour) モデルをデプロイしている時間 デプロイ中は常時発生
③ 推論料金 入出力トークン数(per 1M tokens) API 呼び出し時 推論リクエストごと

⚠️ 最重要ポイント: ホスティング料金は デプロイしている限り 24 時間 365 日課金されます。月額コストの大半はここに集中するため、使用時間の最適化が最大の節約ポイントです。


2. Tier ごとの料金体系と割引

Foundry のファインチューニングは 3 つの Tier を提供しており、用途に応じて使い分けられます。

Tier データ所在地 トレーニング割引 ホスティング料金 推奨用途
Regional Standard 保証あり(リージョン固定) 基準価格 標準料金 コンプライアンス要件のある本番環境
Global Standard 保証なし(Azure グローバル最適化) 10〜30% 割引 標準料金 コスト重視の本番環境
Developer Tier 保証なし(Global ベース) Global から さらに 50% 割引 完全無料(ただし 24 時間後に自動削除) PoC・評価・開発検証

Developer Tier のホスティングに関する注意: デプロイしたモデルは 24 時間後に自動削除されます。本番運用には使えませんが、機能検証・評価に最適です。また、ジョブが Paused 状態の期間はホスティング料金が発生しません


3. 主要モデルの料金一覧

以下は 2026-05-18 時点の料金目安です。最新の公式料金は必ず Azure 公式料金ページ で確認してください。

3.1 トレーニング料金(Global Standard)

モデル Global Standard Developer Tier(Global の 50% 引き)
GPT-4.1 $25.00 / 1M tokens $12.50 / 1M tokens
GPT-4.1-mini $5.00 / 1M tokens $2.50 / 1M tokens
GPT-4.1-nano $1.50 / 1M tokens $0.75 / 1M tokens
o4-mini(RFT) $100.00 / hour
GPT-OSS 20B $3.60 / 1M tokens

o4-mini の RFT(強化学習型ファインチューニング)はトークン単位ではなく 時間課金です。

3.2 ホスティング料金

モデル Regional / Global Standard Developer Tier
GPT-4.1 / GPT-4.1-mini / GPT-4.1-nano / o4-mini $1.70 / hour $0(無料)
GPT-OSS 20B $0.30 / hour

3.3 推論料金(per 1M tokens)

モデル Input Output
GPT-4.1 $2.00 $8.00
GPT-4.1-mini $0.40 $1.60
GPT-4.1-nano $0.10 $0.40
o4-mini $1.10 $4.40
GPT-OSS 20B $0.07 $0.30

4. 課金されないケース(重要)

以下の状況では 料金が発生しません。ジョブの状態管理を適切に行うことでコストを抑えられます。

状況 課金なし
ジョブがキューで待機中 ✅ 課金なし
サービスエラーによるジョブ失敗 ✅ 課金なし
Data Safety Check(安全チェック)実行中 ✅ 課金なし
Developer Tier でジョブが Paused 状態 ✅ 課金なし

5. RFT(強化学習型ファインチューニング)固有の料金ルール

RFT(Reinforcement Fine-Tuning)は高コストになりやすいため、専用の自動停止キャップが設けられています。

  • $5,000 の自動停止キャップ: 1 ジョブあたり $5,000 に達した時点でジョブが自動停止します
  • 停止後の選択肢: チェックポイントをデプロイするか、ジョブを再開するかを選択できます
  • 再開後は上限なし: キャップは 1 ジョブにつき 1 回のみ適用。再開後は追加の上限はありません

RFT コスト削減のポイント: eval サンプルを絞り、最小限のグレーダー(採点器)を使用することで、学習時間と費用を大幅に削減できます。


6. コスト計算の実例

1 USD = 155 円換算での試算例です。

6.1 ケース A: GPT-4.1-mini(Global Standard)で本番運用

前提条件

  • 学習データ: 100 万トークン、2 エポック
  • ホスティング: 常時起動(30 日間)
  • 推論: 月間 1,500 万トークン
費用項目 計算式 USD 円換算
トレーニング $5.00 × 1M × 2 epochs $10.00 約 1,550 円
ホスティング(常時起動) $1.70 × 24h × 30 日 $1,224.00 約 189,720 円
推論(入力 10M + 出力 5M) $0.40 × 10 + $1.60 × 5 $12.00 約 1,860 円
合計(初月) $1,246.00 約 193,130 円

ホスティング料金が コストの 98% 以上を占めています。常時起動が必要かどうかを必ず検討してください。

6.2 ケース B: Developer Tier で PoC(概念実証)

前提条件

  • 学習データ: 100 万トークン、2 エポック
  • ホスティング: Developer Tier(無料、24 時間で自動削除)
  • 推論: 評価期間 1 週間(約 300 万トークン入力 + 150 万トークン出力)
費用項目 計算式 USD 円換算
トレーニング $2.50 × 1M × 2 epochs $5.00 約 775 円
ホスティング Developer Tier $0.00 0 円
推論(評価 1 週間) $0.40 × 3 + $1.60 × 1.5 $3.60 約 558 円
合計 $8.60 約 1,333 円

ケース A との差額: 約$1,237(約 191,797 円)の節約。まず Developer Tier で検証してから本番移行するのが賢明です。

6.3 ケース C: 業務時間のみデプロイ(ホスティング最適化)

前提条件

  • ホスティング: 平日 8 時間 × 22 日のみデプロイ
  • モデル: GPT-4.1-mini($1.70/hour)
パターン 計算式 USD/月 円換算
常時起動 $1.70 × 24h × 30 日 $1,224.00 約 189,720 円
業務時間のみ $1.70 × 8h × 22 日 $299.20 約 46,376 円
削減効果 ▲$924.80(約 75% 削減) 約▲143,344 円

7. コスト最適化戦略

以下の 6 つの戦略を組み合わせることで、大幅なコスト削減が可能です。

コスト最適化の優先順位

7.1 Developer Tier で PoC を実施する

トレーニング料金が Global の 50% 引き、ホスティングが 完全無料になります。本番移行前に必ず Developer Tier で検証してください。

7.2 最小モデルから試す

モデルサイズが小さいほどトレーニング・推論コストは大幅に低下します。

GPT-4.1-nano → GPT-4.1-mini → GPT-4.1
($1.50/1M)      ($5.00/1M)     ($25.00/1M)

ターゲット精度を達成できる最小モデルから検証を始め、必要な場合のみ上位モデルへ移行します。

7.3 Global Training を活用する

Regional Standard より 10〜30% のトレーニングコスト削減が可能です。データ所在地の要件がない場合は Global Standard を選択してください。

7.4 ホスティング時間を最適化する

使用しない時間帯はデプロイを停止することで、最大 75% のホスティングコスト削減が可能です(ケース C 参照)。

運用パターン 削減効果の目安
業務時間のみ(平日 8 時間) 約 75% 削減
検証時のみ手動デプロイ 最大 90% 以上削減
Developer Tier(24 時間後自動削除) 100% 削減(無料)

7.5 RFT はサンプルを絞って実行する

  • eval データセットを最小限に絞る
  • グレーダーは最も軽量なモデルを使用する
  • $5,000 キャップを念頭に早期チェックポイントをデプロイして効果を確認する

7.6 Foundry ポータルでリアルタイム監視する

Azure Portal / Foundry ポータルのコストモニタリングを活用し、予想外の課金が発生していないかを定期的に確認します。アラートを設定しておくと安心です。


8. Developer Tier で試してみる

Developer Tier は PoC・評価・開発検証 に最適なエントリーポイントです。以下の手順で即座に始められます。

8.1 前提条件

  • Azure サブスクリプション
  • Microsoft Foundry のアクセス権限
  • Fine Tuning 対応リージョン(North Central US / Sweden Central など)

8.2 手順

1. Microsoft Foundry ポータル (https://ai.azure.com) にアクセス
2. 左メニュー「Fine-tuning」を選択
3. 「+ Fine-tune a model」をクリック
4. モデル(例: GPT-4.1-mini)を選択
5. Deployment type で「Developer」を選択
6. 学習データ(JSONL 形式)をアップロード
7. ハイパーパラメータを設定してジョブを実行
8. 完了後、自動生成されたデプロイエンドポイントで推論をテスト

Developer Tier では、デプロイされたモデルは 24 時間後に自動削除されます。評価・テストは 24 時間以内に完了させるか、必要に応じて Standard Tier に再デプロイしてください。

8.3 学習データの準備(JSONL 形式)

{"messages": [{"role": "system", "content": "あなたは丁寧な日本語カスタマーサポートです。"}, {"role": "user", "content": "返品方法を教えてください"}, {"role": "assistant", "content": "ご購入から30日以内であれば、マイページの「注文履歴」から返品申請が可能です。"}]}
{"messages": [{"role": "system", "content": "あなたは丁寧な日本語カスタマーサポートです。"}, {"role": "user", "content": "配送状況を確認したい"}, {"role": "assistant", "content": "マイページの「配送状況」から現在の状況をご確認いただけます。"}]}

詳細な Fine Tuning の実施手順は Microsoft Foundry Fine Tuning 完全ガイド を参照してください。


まとめ

Microsoft Foundry ファインチューニングのコストを抑えるための要点をまとめます。

ポイント アクション
コストの大半はホスティング 使用時間のみデプロイする運用を検討する
まず Developer Tier で検証 50% 引き + ホスティング無料で低リスクに PoC できる
最小モデルから始める nano → mini → standard の順に必要十分なモデルを選ぶ
Global Training で節約 データ所在地要件がなければ Global で 10〜30% 削減
RFT はサンプルを絞る eval データと軽量グレーダーで時間・費用を最小化
料金は変動する 本番導入前に必ず公式料金ページで最新情報を確認する

ファインチューニングの技術的な詳細(手法の選択・ワークフロー・ユースケース)については、Microsoft Foundry Fine Tuning 完全ガイド を合わせてご覧ください。


参考リンク


この記事の執筆にあたり、AI の支援を受けています。料金情報は 2026-05-18 時点のものです。最新の料金は必ず Azure 公式料金ページ でご確認ください。