Orin Studio
手工品牌 × AI 客服系統
每天 80 則客服問題,九成讓 AI 先答
假想情境:Orin Studio 是一個台灣手工生活品牌,在 Shopee 和自有網站同時經營。隨著訂單增加,LINE 官方帳號每天湧入 80+ 則訊息,其中 90% 是一樣的問題:有沒有現貨、可不可以超商取貨、要幾天到、能不能客製化。兩個員工輪流回覆、複製貼上,浪費在可預期問題上的時間遠超過真正需要人工判斷的對話。
用 RAG(Retrieval-Augmented Generation)搭配 Claude Haiku,讓 bot 從品牌上傳的知識庫(商品型錄、FAQ、退換貨政策、運費說明)查詢後回答。常規問題 AI 即時處理;遇到 AI 沒把握的問題(客製化細節、異常訂單),平滑轉接真人,不是硬答、也不是空白等待。業主透過管理後台更新知識庫——改了退換貨政策,bot 下一則訊息就能引用新版本,不需要找工程師。
Bot 知道什麼,你說了算
上傳商品 FAQ、型錄 PDF、退換貨政策,系統自動切割成知識片段、向量化儲存。Bot 回答前先查知識庫,引用的是你的資料,不是模型自己亂掰。改政策、加新品、調運費——更新文件,bot 立即同步,不需要重新訓練或找工程師。今天 87 則對話,94.3% 由 AI 自動處理,轉真人只有 5 則。
RAG 而不是 Fine-tuning
Fine-tuning 要大量資料、花時間、貴。RAG 讓模型在回答時即時查詢知識庫——資料更新不需要重新訓練,準確度反而更高,因為 bot 引用的是原始文件,不是從訓練資料「回憶」出來的答案。
不確定就轉人,不硬答
信心分數低於門檻時,bot 主動提出轉真人,而不是用模糊語氣強答。對品牌的信任比回覆速度重要——客戶可以等 5 分鐘讓真人回覆,但不能接受機器人給出錯誤的退款資訊。
Claude Haiku 而不是 GPT-4
客服 bot 的瓶頸是延遲和成本,不是智慧。Haiku 在 FAQ 查詢場景的回覆速度比大模型快 4–6 倍,成本低 80%,準確度在有知識庫輔助的情況下不輸大模型。大模型留給真正需要推理的任務。
這個方案會用的工具
- Next.js 15
- Claude Haiku (Anthropic)
- RAG / pgvector
- Supabase (PostgreSQL)
- LINE Messaging API
- Resend
- Vercel
