
Foundry Localを使い、端末内だけで動くマルチターンチャットアプリをPythonで実装する手順を解説。OpenAI互換API対応で既存SDKを流用でき、モデル取得・推論・ハードウェア最適化をローカル完結。CLI確認、実装例、Gradio拡張、注意点も紹介。

Phi-4とFoundry Localで分類・要約・PII除去など軽い処理をローカル実行し、複雑な推論や長文脈はAzure OpenAIへ振り分けるハイブリッド構成を解説。OpenAI互換APIで切替えやすく、固定費と従量課金の損益分岐やフォールバック設計が重要。

ローカルLLMは「ランタイム」と「モデル」を分けて選ぶと整理しやすい。Foundry Localは単一ユーザー向けのオンデバイスAIで、OpenAI互換APIやGPU/NPU自動選択が強み。手軽さはOllama/LM Studio、柔軟性はllama.cpp、多人数配信はvLLMが適する。

Microsoft Foundry Agent Serviceを、Planner・Tool・Memoryの3軸で解説。Plannerはモデル自身が担い、実行基盤がツール呼び出しを反復制御する。Toolは組み込みやカスタム関数を使い、JSONスキーマ設計が重要。Memoryは短期・長期・知識で使い分ける。

Real-ESRGANで写真向け超解像アプリをGradioで最小構成で作る手順を解説。環境構築、重み配置、モデル選択、GFPGANによる顔補正、tileによるOOM対策、CPU/GPU切替、BGR/RGB変換、ライセンス確認など実運用の注意点も紹介している。

画像高解像度化の選定は処理量と要件次第。MVPはReplicate、小〜中規模はDeep-image.ai、大規模・閉域はAKS+Real-ESRGANが有力。実用性はCNN系Real-ESRGANが高く、商用ではOSSライセンス確認が重要。