Clawdbot 省錢攻略：用本地模型跑 AI 助理，每月省下上萬元的完整指南

管

管管

4 分鐘閱讀 · 2026年1月29日

技術分享 AI 應用

Photo by Lilian Do Khac on Unsplash

使用 Clawdbot 最讓人頭痛的問題之一，就是 Token 費用像喝水一樣燒錢。Claude Opus 4.5 每百萬 token 輸入要 NT$480、輸出要 NT$2,400，重度使用者一個月下來帳單可能比房租還貴。

好消息是，你可以用 本地模型 來跑 Clawdbot。雖然智慧程度比不上 Claude Opus，但對於日常任務來說綽綽有餘，而且費用是零（除了電費）。

這篇文章會告訴你：如何設定 Clawdbot 使用本地模型、該選什麼模型、需要什麼硬體，以及能省下多少錢。

費用比較：雲端 vs 本地

先算一筆帳，假設你每天使用 Clawdbot 處理 50 萬 token（中度使用）：

雲端模型費用（以 Claude 為例）

Claude Opus 4.5：NT$480/M input + NT$2,400/M output ≈ 每天 NT$720 ≈ 每月 NT$21,600
Claude Sonnet 4.5：NT$96/M input + NT$480/M output ≈ 每天 NT$144 ≈ 每月 NT$4,320

本地模型費用

電費：假設 GPU 功耗 300W，每天跑 8 小時 ≈ 2.4 度 ≈ 每月約 NT$300-600
模型費用：NT$0

結論：換成本地模型，每月可以省下 NT$3,000 - NT$21,000，取決於你原本用什麼模型。

本地模型的取捨

當然，本地模型不是萬能的。先了解它的優缺點：

✅ 優點

費用極低：只有電費
隱私安全：資料完全不離開你的電腦
無網路依賴：離線也能用
無速率限制：不會被 API 限流

❌ 缺點

智慧程度較低：目前最強的本地模型大約是 Claude Sonnet 等級，比不上 Opus
需要硬體投資：好的 GPU 不便宜
上下文長度受限：受 VRAM 限制，通常比雲端模型短
安全性較弱：本地模型的 prompt injection 防護較差

硬體需求指南

選擇本地模型最重要的因素是 VRAM（顯示記憶體）。以下是各級距的建議：

入門級：8GB VRAM（RTX 3070 / 4060 Ti）

可跑模型：7B 參數以下
推薦：qwen2.5-coder:7b、llama3.2:3b、phi3:3.8b
適合任務：簡單問答、輕量程式碼補全
顯卡價格：約 NT$12,000 - NT$15,000

中階：16GB VRAM（RTX 4080 / 4070 Ti Super）

可跑模型：13-14B 參數
推薦：qwen2.5-coder:14b、phi4:14b、deepseek-coder:6.7b
適合任務：一般程式碼生成、文件撰寫、日常對話
顯卡價格：約 NT$25,000 - NT$35,000

進階：24GB VRAM（RTX 4090 / A5000）

可跑模型：32-34B 參數
推薦：qwen2.5-coder:32b、deepseek-coder:33b、qwq:32b（推理模型）
適合任務：大部分日常任務、中等複雜度的程式碼
顯卡價格：約 NT$55,000 - NT$65,000
這是性價比甜蜜點

高階：48GB+ VRAM（雙 4090 / A6000 / Mac Studio M2 Ultra）

可跑模型：70B 參數
推薦：llama3.1:70b、qwen2.5:72b、deepseek-r1:70b
適合任務：接近雲端模型的表現
設備價格：NT$120,000+

Mac 用戶的優勢

Apple Silicon 的統一記憶體架構讓 Mac 在跑本地模型時有獨特優勢：

Mac Studio M2 Ultra（192GB）：可以跑 70B 甚至更大的模型，約 NT$200,000+
MacBook Pro M3 Max（128GB）：可以跑 32-70B 模型，約 NT$130,000+
缺點：推理速度比 NVIDIA GPU 慢，但勝在穩定

設定 Clawdbot 使用本地模型

方法一：透過 Ollama（推薦）

Step 1：安裝 Ollama 並下載模型

# 安裝 Ollama
curl -fsSL https://ollama.com/install.sh | sh

# 下載模型（以 qwen2.5-coder:14b 為例）
ollama pull qwen2.5-coder:14b

# 啟動 Ollama 服務（通常自動啟動）
ollama serve

Step 2：設定 Clawdbot

編輯 Clawdbot 設定檔，加入 Ollama provider：

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "ollama/qwen2.5-coder:14b",
        "fallbacks": ["anthropic/claude-sonnet-4-5"]
      }
    }
  },
  "models": {
    "mode": "merge",
    "providers": {
      "ollama": {
        "baseUrl": "http://127.0.0.1:11434/v1",
        "apiKey": "ollama",
        "api": "openai",
        "models": [
          {
            "id": "qwen2.5-coder:14b",
            "name": "Qwen2.5 Coder 14B",
            "reasoning": false,
            "input": ["text"],
            "cost": { "input": 0, "output": 0 },
            "contextWindow": 32768,
            "maxTokens": 8192
          }
        ]
      }
    }
  }
}

方法二：透過 LM Studio

LM Studio 提供更友善的圖形介面：

下載 LM Studio
在 LM Studio 中搜尋並下載模型
啟動本地伺服器（預設 http://127.0.0.1:1234）
設定 Clawdbot 指向 LM Studio

混合策略：本地 + 雲端

最聰明的做法是混合使用：日常任務用本地模型，複雜任務才切換到雲端。

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "ollama/qwen2.5-coder:14b",
        "fallbacks": ["anthropic/claude-sonnet-4-5", "anthropic/claude-opus-4-5"]
      }
    }
  }
}

這樣設定後：

日常任務用本地模型處理（免費）
本地模型搞不定時，自動 fallback 到 Sonnet
真正困難的任務，手動切換到 Opus

實際省錢案例

假設你是一個每天寫程式的開發者：

之前（純雲端）

使用 Claude Sonnet 4.5
每天約 100 萬 tokens
每月費用：約 NT$8,640

之後（本地優先）

日常用 qwen2.5-coder:14b（本地）
複雜任務才用 Sonnet（約 20% 的量）
每月雲端費用：約 NT$1,728
電費：約 NT$500
每月省下 NT$6,400

回本計算

如果你買一張 RTX 4090（約 NT$60,000）：

每月省 NT$6,400
約 9-10 個月 回本
之後都是淨賺

注意事項

安全性考量

本地模型的 prompt injection 防護比雲端模型弱。如果你讓 Clawdbot 執行有風險的操作（如檔案刪除、執行指令），建議：

複雜或敏感操作時切換到雲端模型
開啟 Clawdbot 的 sandbox 模式
設定適當的 tool policy

上下文長度

本地模型的上下文長度通常比雲端短。如果你需要處理很長的文件或對話歷史，可能需要：

更大的 VRAM
啟用 compaction（自動壓縮歷史）
或切換到雲端模型

結語

跑本地模型不是要完全取代雲端，而是省下不必要的開支。日常的程式碼補全、簡單問答、文件整理，用本地模型就夠了；真正需要頂級智慧的任務，再切換到 Claude Opus。

如果你有 RTX 4090 或更好的卡，現在就可以開始。一張 4090 的價格大約等於 3 個月的 Claude Opus 帳單，之後就是淨賺。

相關連結：