在 Apple Silicon Mac 跑本地大型語言模型(Ollama 入門)

專家 ✓ 已於 macOS 26、M 系列 實測 Mac · 圖文 11 分鐘 · 更新 2026/4/16
iLab學校技術長進階技術・終端機・系統維修・已於 macOS 26、M 系列 實測
簡報模式 LINE @
💡 到 ollama.com 下載安裝 Ollama,開終端機執行 ollama run llama3.2 會自動下載並啟動模型,接著就能離線對話。Apple Silicon 的統一記憶體很適合跑本機模型,16GB 以上體驗較佳;想要圖形介面可改用 LM Studio。
影片示範 國外創作者 來源:YouTube 國外創作者教學

這支國外創作者的英文教學完整示範安裝流程;想照繁中步驟做,往下看 iLab 整理。

開始前

適用系統macOS 14 以上(Apple Silicon)
需要工具終端機 Terminal、Homebrew(選用)

先看結論

Apple Silicon(M 系列)Mac 很適合離線跑 AI 模型——不上雲、最隱私、沒有 API 費用。最簡單的工具是 Ollama。本文由 iLab 學校技術長帶你跑起來。

前提需要 Apple Silicon Mac 與一點終端機基礎,建議先看 Mac 終端機入門

安裝與第一次對話

# 方法一:到 ollama.com 下載安裝
# 方法二:用 Homebrew
brew install ollama

# 下載並啟動一個模型(第一次會自動抓)
ollama run llama3.2

執行後就能在終端機直接對話,完全離線

常用指令

ollama list           # 看已下載的模型
ollama run qwen2.5    # 換一個模型跑
ollama rm llama3.2    # 移除模型釋放空間

為什麼用 Apple Silicon 跑

統一記憶體讓 CPU/GPU 共用大記憶體,神經網路引擎加速推論,跑本機模型又快又省電。記憶體越大,能跑的模型越聰明(16GB 起跳體驗較好)。

進階Ollama 會在本機開一個 API(預設 11434 埠),可被其他程式呼叫——這就是把 Mac 變成 本地 AI 伺服器 的基礎。

想要圖形介面

不想用終端機,改裝 LM Studio:視窗化下載模型、聊天、調參數,對新手更友善。

操作步驟

安裝 Ollama 到 ollama.com 下載 macOS 版安裝,或用 Homebrew:brew install ollama。
下載並執行模型 開終端機輸入 ollama run llama3.2,第一次會自動下載模型,完成後即可對話。
換模型 ollama run qwen2.5 或其他模型名;用 ollama list 看已下載、ollama rm 模型名 移除。
想要圖形介面 改裝 LM Studio,用視窗介面下載、聊天、調參數,對新手更友善。

常見問題

需要多大記憶體?

小模型(3B 參數)8GB 可跑;7~8B 建議 16GB;更大的模型要 32GB 以上。記憶體越大、能跑的模型越聰明。

跑本機模型要付費嗎?

Ollama 與開源模型本身免費,只用你的硬體。不上雲,也不會產生 API 費用,適合大量或機敏用途。

學習路徑 · 第 3 / 5 課 Apple × AI 進階:把 Mac 變成 AI 工作站
延伸閱讀

相關教學

為你精選

猜你喜歡

選一個你喜歡的色調
底色維持白/黑/灰,只換點綴色