FunASR デプロイ選択マトリクス

May 26, 2026 · View on GitHub

プロダクト、デモ、ベンチマーク、社内ワークフローに合わせて最短のデプロイ経路を選ぶためのガイドです。まずは要件を満たす最小構成から始め、throughput、latency、integration 要件が明確になったら重い runtime に移行してください。

クイック判断表

Path向いている用途最初に読むもの運用メモ
Colab notebookブラウザ smoke test、初回評価、共有 demoColab クイックスタートローカル環境不要。初回はモデルをダウンロードし、GPU runtime の方が高速です。
Python APINotebook、offline job、最初の model evaluationREADME quick start最小構成。batching、retry、file 管理は呼び出し側で扱います。
OpenAI 互換 APIPrivate speech API、Agent、Dify/LangChain/AutoGen style clientsOpenAI API exampleOpenAI audio API に対応した既存 app に最も接続しやすい経路です。
Docker Compose API再現可能な local smoke test、小さな internal serviceOpenAI API Docker docsデフォルトは CPU。CUDA を使う前に CUDA-capable image へ調整してください。
Kubernetes APICluster service 向け internal speech APIKubernetes templateprivate ClusterIP から開始。公開範囲を広げる前に auth、TLS、network policy、GPU scheduling を追加します。
Runtime WebSocket serviceLive captions、meeting、call-center streamRuntime service docspartial result、endpointing、long-lived audio stream が重要な場合に使います。
vLLM accelerationFun-ASR-Nano の LLM-based ASR throughput 向上vLLM guideLLM decoder throughput 向け。non-autoregressive Paraformer には適用しません。
MCP serverClaude/Cursor/desktop agent の speech toolMCP exampleASR 結果を local tool として Agent に渡したい場合に便利です。
Subtitle generator長時間 audio/video から SRT/VTT 作成Subtitle examplereadability が重要な場合は verbose segment と speaker label を使います。
Batch ASR scriptArchive、meeting、dataset、繰り返し offline runBatch exampleproduction では queue、manifest、retry log を追加してください。

よくある選択

5分で FunASR を試したい

ブラウザだけで試すなら Colab クイックスタート を使います。ローカルで作業する場合は README の Python API から始めます。どのモデルを使うか迷う場合は モデル選択ガイド を参照してください。

Cloud transcription の local replacement が欲しい

OpenAI 互換 API を使います。/v1/audio/transcriptions/v1/models/health、Swagger docs を提供します。まず sensevoice で smoke test を実行し、既存 SDK や HTTP client を OpenAI API example に合わせて接続してください。

再現可能な container demo が欲しい

examples/openai_api/docker-compose.yml を CPU mode の smoke test として使います。

cd examples/openai_api
cp .env.example .env
docker compose up --build

CUDA を使う場合は CUDA-capable PyTorch/FunASR image を作成してから FUNASR_DEVICE=cuda に変更し、同じ smoke test で確認します。

Streaming または live captioning が必要

Runtime WebSocket service を使います。本番投入前に chunk size、VAD、endpointing、punctuation、speaker diarization、reconnect、client backpressure を実音声で検証してください。

Readiness checklist

  • model alias を決め、deployment note に固定します。
  • FunASR version、model version、device、CUDA/PyTorch version、Docker image tag、command line を記録します。
  • public smoke sample と realistic private sample を少なくとも 1 つずつ実行します。
  • request ごとに audio duration、model、device、latency、response format、error type をログ化します。
  • trusted network の外へ API を出す前に upload-size limit、authentication、TLS、rate limit を入れます。Security guide も確認してください。
  • 詰まったら deployment path、command/config、logs、model、device、audio characteristics を添えて Deployment Help issue を開いてください。