メインコンテンツへスキップ
AI用語集に戻る
AI用語

小規模言語モデル

Small Language Model

解説

小規模言語モデル(SLM)とは、巨大なAIに比べ、特定の用途に絞って効率化したAIのことです。スマホやPC上で直接動かせるほど軽量で、処理が速く、通信コストや情報漏洩リスクを抑えられるのが特徴です。2026年現在は、企業の機密情報を扱う専用AIや、ネット不要のデバイス内AIとして広く普及しています。

さらに詳しく解説

小規模言語モデル(Small Language Model; SLM)は、大規模言語モデルLLM)と比較してパラメータ数や計算規模が小さい言語モデルです。一般に数億〜数十億パラメータ規模で、コスト・速度・プライバシーで優位性を持ち、特定用途やエッジ運用で重要な選択肢となっています。

SLMとLLMの比較

観点SLMLLM
パラメータ数数億〜数十億数百億〜数兆
計算コスト低い高い
推論速度速い遅め
メモリ少ない多い
動作環境スマホ・PC可高性能GPU必須
汎用性限定的高い
専門タスク特化すると高精度汎用的に高精度

代表的なSLM

モデルパラメータ提供
Phi-3 / Phi-4 系数十億Microsoft
Gemma 系2B〜27BGoogle
Llama 3 8B / Llama 4 系小型数十億Meta
Mistral 7B7BMistral AI
Qwen 系小型数十億〜Alibaba
ELYZA、rinna、cyberAgent数十億〜日本企業

SLMのメリット

1. コスト効率

  • 推論コストが大幅に低い
  • API課金が安い/無料運用可能
  • 大規模利用でROIが出やすい

2. 速度

  • 応答が高速
  • リアルタイム用途に向く
  • TTFTが短い

3. プライバシー

  • ローカル/オンプレ運用可能
  • 機密データを外部に送らない
  • 規制業界に適合

4. カスタマイズ性

5. デバイス対応

  • スマホ・PC・組み込み機器で動作
  • オフライン利用可能
  • エッジAIの主役

SLMの限界

  1. 汎用知識の幅:LLMほど博識ではない
  2. 複雑推論:高度な推論力で劣る
  3. **長コンテキスト**:扱える情報量に制限
  4. 品質の安定性:難しい質問でばらつき
  5. 多言語性能:英語優位、他言語は限定的なことも

SLMの活用パターン

1. 専門特化

ファインチューニングで特定業務に特化。汎用LLMより高精度になることも。

2. 第一次対応

SLMで一次処理し、必要な場合のみLLMにエスカレーション

3. エッジ運用

スマホ・PCでローカル処理。プライバシー重視。

4. 大量バッチ処理

コスト効率を活かした大量データ処理。

5. 機密業務

オンプレ運用で社外送信なし。

ビジネスでの活用例

バックオフィス

  • 帳票分類・抽出
  • メール仕分け
  • 社内QA

カスタマー対応

  • FAQ応答
  • 一次トリアージ

業界特化

  • 医療カルテ処理(オンプレ)
  • 法務文書チェック
  • 製造現場での音声記録

モバイルアプリ

  • スマホ内蔵AI
  • オフライン翻訳
  • パーソナルアシスタント

SLM運用の選択肢

形態特徴
API利用軽量モデルとしてのSLM
自社GPU運用コスト管理・カスタマイズ性
エッジデバイススマホ・PC・IoT
ハイブリッドSLM+LLMの使い分け

SLMとLLMの使い分け

判定例:

簡単な分類・要約 → SLM
複雑な推論・分析 → LLM
大量バッチ処理 → SLM
専門領域の創造的タスク → LLM+[RAG](/glossary/rag)
機密オンプレ → SLM
プロトタイプ → LLM API

進化の方向性

  • 同等性能の小型化:知識蒸留量子化
  • **マルチモーダルSLM**:画像も扱える小型モデル
  • 専用ハードウェアNPU・スマホAIチップの強化
  • オンプレ商用パッケージ:エンタープライズ向け

留意点

  1. 要件の見極め:本当にLLMが必要か検討
  2. 評価セット必須:実データでの精度測定
  3. ファインチューニング設計:データ準備が成否を分ける
  4. 継続改善:再学習サイクル
  5. ハードウェア計画:オンプレ運用時のリソース

エコシステム

  • Hugging Face:モデル・ツールの集積地
  • **Ollama、LM Studio**:ローカル実行環境
  • llama.cpp、MLX:軽量推論ライブラリ
  • Lamini、Together AI:ファインチューニング基盤

SLMは「LLMの民主化と現実解」を担う存在で、コスト・速度・プライバシーの観点から、生成AI実装の選択肢として急速に重要性を増している領域です。

AI用語集に戻る

この用語をシェア

AIの導入についてご相談ください

「うちの会社でも使えるの?」「何から始めればいい?」
そんな疑問に、30分のオンライン相談でお答えします。

無料相談を予約する