Clawdbot 省錢攻略:用本地模型跑 AI 助理,每月省下上萬元的完整指南

管管
技術分享 AI 應用
GPU 顯示卡

Photo by Lilian Do Khac on Unsplash

使用 Clawdbot 最讓人頭痛的問題之一,就是 Token 費用像喝水一樣燒錢。Claude Opus 4.5 每百萬 token 輸入要 NT$480、輸出要 NT$2,400,重度使用者一個月下來帳單可能比房租還貴。

好消息是,你可以用 本地模型 來跑 Clawdbot。雖然智慧程度比不上 Claude Opus,但對於日常任務來說綽綽有餘,而且費用是零(除了電費)。

這篇文章會告訴你:如何設定 Clawdbot 使用本地模型、該選什麼模型、需要什麼硬體,以及能省下多少錢。

費用比較:雲端 vs 本地

先算一筆帳,假設你每天使用 Clawdbot 處理 50 萬 token(中度使用):

雲端模型費用(以 Claude 為例)

  • Claude Opus 4.5:NT$480/M input + NT$2,400/M output ≈ 每天 NT$720 ≈ 每月 NT$21,600
  • Claude Sonnet 4.5:NT$96/M input + NT$480/M output ≈ 每天 NT$144 ≈ 每月 NT$4,320

本地模型費用

  • 電費:假設 GPU 功耗 300W,每天跑 8 小時 ≈ 2.4 度 ≈ 每月約 NT$300-600
  • 模型費用:NT$0

結論:換成本地模型,每月可以省下 NT$3,000 - NT$21,000,取決於你原本用什麼模型。

本地模型的取捨

當然,本地模型不是萬能的。先了解它的優缺點:

✅ 優點

  • 費用極低:只有電費
  • 隱私安全:資料完全不離開你的電腦
  • 無網路依賴:離線也能用
  • 無速率限制:不會被 API 限流

❌ 缺點

  • 智慧程度較低:目前最強的本地模型大約是 Claude Sonnet 等級,比不上 Opus
  • 需要硬體投資:好的 GPU 不便宜
  • 上下文長度受限:受 VRAM 限制,通常比雲端模型短
  • 安全性較弱:本地模型的 prompt injection 防護較差

硬體需求指南

選擇本地模型最重要的因素是 VRAM(顯示記憶體)。以下是各級距的建議:

入門級:8GB VRAM(RTX 3070 / 4060 Ti)

  • 可跑模型:7B 參數以下
  • 推薦:qwen2.5-coder:7b、llama3.2:3b、phi3:3.8b
  • 適合任務:簡單問答、輕量程式碼補全
  • 顯卡價格:約 NT$12,000 - NT$15,000

中階:16GB VRAM(RTX 4080 / 4070 Ti Super)

  • 可跑模型:13-14B 參數
  • 推薦:qwen2.5-coder:14b、phi4:14b、deepseek-coder:6.7b
  • 適合任務:一般程式碼生成、文件撰寫、日常對話
  • 顯卡價格:約 NT$25,000 - NT$35,000

進階:24GB VRAM(RTX 4090 / A5000)

  • 可跑模型:32-34B 參數
  • 推薦:qwen2.5-coder:32b、deepseek-coder:33b、qwq:32b(推理模型)
  • 適合任務:大部分日常任務、中等複雜度的程式碼
  • 顯卡價格:約 NT$55,000 - NT$65,000
  • 這是性價比甜蜜點

高階:48GB+ VRAM(雙 4090 / A6000 / Mac Studio M2 Ultra)

  • 可跑模型:70B 參數
  • 推薦:llama3.1:70b、qwen2.5:72b、deepseek-r1:70b
  • 適合任務:接近雲端模型的表現
  • 設備價格:NT$120,000+

Mac 用戶的優勢

Apple Silicon 的統一記憶體架構讓 Mac 在跑本地模型時有獨特優勢:

  • Mac Studio M2 Ultra(192GB):可以跑 70B 甚至更大的模型,約 NT$200,000+
  • MacBook Pro M3 Max(128GB):可以跑 32-70B 模型,約 NT$130,000+
  • 缺點:推理速度比 NVIDIA GPU 慢,但勝在穩定

推薦模型清單

以下是經過社群驗證、適合搭配 Clawdbot 使用的本地模型:

程式碼專用

  • qwen2.5-coder:阿里巴巴出品,程式碼生成品質極佳,有 7B/14B/32B 版本
  • deepseek-coder-v2:深度求索的程式碼模型,16B 版本 CP 值高
  • codellama:Meta 的程式碼模型,老牌穩定

通用對話

  • llama3.1:Meta 的旗艦模型,8B/70B 版本表現優秀
  • qwen2.5:阿里巴巴的通用模型,中文表現特別好
  • gemma3:Google 出品,支援視覺輸入

推理專用

  • deepseek-r1:專為複雜推理設計,有 thinking 過程
  • qwq:Qwen 系列的推理模型,32B 版本表現不錯

設定 Clawdbot 使用本地模型

方法一:透過 Ollama(推薦)

Step 1:安裝 Ollama 並下載模型

# 安裝 Ollama
curl -fsSL https://ollama.com/install.sh | sh

# 下載模型(以 qwen2.5-coder:14b 為例)
ollama pull qwen2.5-coder:14b

# 啟動 Ollama 服務(通常自動啟動)
ollama serve

Step 2:設定 Clawdbot

編輯 Clawdbot 設定檔,加入 Ollama provider:

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "ollama/qwen2.5-coder:14b",
        "fallbacks": ["anthropic/claude-sonnet-4-5"]
      }
    }
  },
  "models": {
    "mode": "merge",
    "providers": {
      "ollama": {
        "baseUrl": "http://127.0.0.1:11434/v1",
        "apiKey": "ollama",
        "api": "openai",
        "models": [
          {
            "id": "qwen2.5-coder:14b",
            "name": "Qwen2.5 Coder 14B",
            "reasoning": false,
            "input": ["text"],
            "cost": { "input": 0, "output": 0 },
            "contextWindow": 32768,
            "maxTokens": 8192
          }
        ]
      }
    }
  }
}

方法二:透過 LM Studio

LM Studio 提供更友善的圖形介面:

  1. 下載 LM Studio
  2. 在 LM Studio 中搜尋並下載模型
  3. 啟動本地伺服器(預設 http://127.0.0.1:1234)
  4. 設定 Clawdbot 指向 LM Studio

混合策略:本地 + 雲端

最聰明的做法是混合使用:日常任務用本地模型,複雜任務才切換到雲端。

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "ollama/qwen2.5-coder:14b",
        "fallbacks": ["anthropic/claude-sonnet-4-5", "anthropic/claude-opus-4-5"]
      }
    }
  }
}

這樣設定後:

  • 日常任務用本地模型處理(免費)
  • 本地模型搞不定時,自動 fallback 到 Sonnet
  • 真正困難的任務,手動切換到 Opus

實際省錢案例

假設你是一個每天寫程式的開發者:

之前(純雲端)

  • 使用 Claude Sonnet 4.5
  • 每天約 100 萬 tokens
  • 每月費用:約 NT$8,640

之後(本地優先)

  • 日常用 qwen2.5-coder:14b(本地)
  • 複雜任務才用 Sonnet(約 20% 的量)
  • 每月雲端費用:約 NT$1,728
  • 電費:約 NT$500
  • 每月省下 NT$6,400

回本計算

如果你買一張 RTX 4090(約 NT$60,000):

  • 每月省 NT$6,400
  • 9-10 個月 回本
  • 之後都是淨賺

注意事項

安全性考量

本地模型的 prompt injection 防護比雲端模型弱。如果你讓 Clawdbot 執行有風險的操作(如檔案刪除、執行指令),建議:

  • 複雜或敏感操作時切換到雲端模型
  • 開啟 Clawdbot 的 sandbox 模式
  • 設定適當的 tool policy

上下文長度

本地模型的上下文長度通常比雲端短。如果你需要處理很長的文件或對話歷史,可能需要:

  • 更大的 VRAM
  • 啟用 compaction(自動壓縮歷史)
  • 或切換到雲端模型

結語

跑本地模型不是要完全取代雲端,而是省下不必要的開支。日常的程式碼補全、簡單問答、文件整理,用本地模型就夠了;真正需要頂級智慧的任務,再切換到 Claude Opus。

如果你有 RTX 4090 或更好的卡,現在就可以開始。一張 4090 的價格大約等於 3 個月的 Claude Opus 帳單,之後就是淨賺。

相關連結: