`ollama run llama3` の 1 行でモデルを取得・起動します。NVIDIA CUDA・Mac Metal など GPU 高速化にも対応します。
`ollama run llama3` の 1 行でモデルを取得・起動します。NVIDIA CUDA・Mac Metal など GPU 高速化にも対応します。
API 課金なしでローカル LLM を試したい場面で登場します。Claude Code や MCP の呼び出し先として設定でき OpenAI 互換 API も提供します。
ローカル PC 上で LLM を取得・実行する配布ランタイムです。
API 課金なしでモデルを試せ、オフライン環境でも動作します。
大きいモデルは VRAM 不足でクラッシュするため、量子化バリアント選びが重要です。
Claude Code や MCP サーバーのローカル LLM 連携先として機能します。
`ollama run llama3` で動作確認し、`ollama list` でサイズを確認します。
llama.cpp、VRAM、GGUF 量子化