【客座文】MCP 是怎樣讓世界又更好一點點
最近研究 AI 領域的熱門新概念 MCP,原本覺得自己已經理解了,但當我第一次親眼看到 AI 透過 MCP 一口氣完成原本用 ChatGPT 要反覆多次才能解決的問題時,那種震撼感徹底顛覆了我的想像!發現自己對 MCP 從「理解」跟「體會」還是有一段落差。寫了一篇把我自己的心得打下來當作梳理自己的想法。

本文作者,林裕欽,Dcard 共同創辦人與CEO,本文將帶您深入了解MCP如何突破傳統語言模型的限制,讓AI不僅能「說」,更能「做」。從理論到實踐,從現狀到未來,作者以親身體驗分享這項技術如何通過觀察與行動的循環,以及跨領域整合的網路效應,為我們的工作與生活帶來改變。
最近研究 AI 領域的熱門新概念 MCP,原本覺得自己已經理解了,但當我第一次親眼看到 AI 透過 MCP 一口氣完成原本用 ChatGPT 要反覆多次才能解決的問題時,那種震撼感徹底顛覆了我的想像!發現自己對 MCP 從「理解」跟「體會」還是有一段落差。寫了一篇把我自己的心得打下來當作梳理自己的想法。
▍MCP:讓 AI 把語言變成咒語 From language to spell
LLM 全文是 Large Language Model 大型語言模型,我們平常在使用 ChatGPT 的時候就是輸入一些文字、也是輸出一些文字。我們之所以會覺得 LLM 做出來得很聰明,把它稱為 AI,是因為那些文字用特定人類喜歡的規則排列。
例如蘊含很多知識量、條理分明、或富有創造力。然而不論這些文字多棒,單純資訊輸入輸出,能做的事情還是有限。我們使用 ChatGPT 時經常需要剪下貼上、或是按照 LLM 輸出的指示在現實生活中一步一步操作。有時候不小心做錯了、或是得到不如預期的結果,還要想辦法描述給 LLM 發生了什麼事情,等待下一步指令,實在令人很沮喪。
而 MCP (Model Context Protocol)的出現就是希望解決這樣的問題!MCP 是由 Claude 母公司 Anthropic 提出來的統一規範,讓 LLM 有了「控制」跟「觀察」其他事物的能力。LLM 一樣還是只是會文字的輸入輸出,但只要 LLM 按照規則輸出文字,就會由 MCP (client server host 架構) 把相關文字解讀成指令,去跟其他支援 MCP 的軟硬體互動。就像是有些文字突然變成咒語一般,讓依然只需要負責文字的 LLM 有了更多能力。
▍更好的觀察帶來更好的行動 Better Observations leads to better actions
看完第一段,你可能會用很多方式去描述:「這就是 API 的 API 吧!」「這是 AI 界的 USB!」這些說法都正確,但對有智能的 AI 的來說,改進不僅止「接起來」。
想像一個場景,今天如果我們左手打直拿著手機,再用右手點擊畫面上的一點,相信很多人都能夠輕鬆做到。然而同樣的任務,如果要求你只看一眼後閉上眼,右手再開始動作,要精準點擊到目標的難度就會大大大提升。這是因為一個看似簡單的動作,我們在運動的過程持續透過眼睛觀察去調整。
大腦會根據觀察到的訊號,時時調整每條相關肌肉的發力,最後達成看似簡單的目標。如果不會觀察,就很難把事情做好。繪畫、做菜、音樂、打球等皆是如此。每一次的短暫觀察與動作行為,讓每個任務變簡單,集合在一起就讓人類可以完成各式各樣了不起的事情。
最早將這樣觀察與行動循環帶入 LLM 領域的概念是 Agent。而早期的 Agent 能使用的外界工具有限,例如 Web Search 搜索網路上的結果。而 MCP 大大降低開發工具給 LLM 的門檻,同時賦予 LLM 「觀察」與「控制」外在事物的能力,讓許多任務透過觀察與控制循環得到更多資訊,達成原先 LLM 沒辦法一次就做到的事情。只看一眼後閉上眼睛,就像是我們過去下 prompt 指令一樣,希望 LLM 高表現一次就吐出正確答案。
而有了 MCP 後的 LLM 可以先「試試看」更多事情。例如叫 AI 寫個 3D 遊戲。它可以先試寫一段程式碼,透過 MCP 控制檔案系統跟遊戲編譯器,讓寫出來的程式碼跑起來看看。如果一但發現物理邏輯不如預期、或跑起來光線反射跟原先要求不一樣,可以再換段程式碼寫法,再試一次。
如此往復,讓遊戲越來越靠近用戶的要求。現在支援 MCP 的軟硬體還不算多,但正在以飛速增加中。最基礎如主流資料庫 mysql, postgres, bigquery 都有開源的 MCP 支援。上班族常用的 Excel、短推文媒體 X、財經資訊 Yahoo Finance 也都有 MCP 支援。因為能「試試看」的事情變多了,能做到的複雜任務也比過去多的更多。(ps. 懂寫程式的讀者可以去下載剛出爐的 claude code!寫程式的體驗會有 10x 的感受,看著 AI 自己寫 debug 程式碼試試看為什麼有 bug 的時候,我還記得自己在電腦前叫了出來!)
▍跨領域的網路效應 The Network Effects of Cross-Domain Integration
跨領域的人才能夠做出許多不可思議的事物。例如懂多國料理做法的廚師,能夠融合不同手法創作出新的料理。懂影像、音樂、心理學的講者,或許能把演講帶到下一個高度。人類世界有許多突破性的進展,是因為跨領域的借鏡跟串聯,最後形塑出許多美好事物。
我自己第一次體會到 MCP 震撼的時候,是把多個不同資料庫 MCP (postgres, bigquery) 設定好的第一次提問。原先需要好幾次 LLM 生成 SQL、查表格 、我再手動跑去不同介面執行的問題,支援 MCP 的 claude 一次提問就幫我完成。是 LLM 時代後又一次 10x 效率提升。
這時我想到如果掛上 dashboard (e.g. redash) 的 MCP。瞬間用自然語言產生一張可以持續使用、修改 dashboard 的全過程就被實踐了!這個過程不是簡單的自動化,而是 LLM 有意識的根據當前情境,做出下一步選擇,最後完成的傑出任務。每多一個 MCP,LLM 就對多一個領域有更多理解與控制的能力。
就像是有網路效應一般,能做到的排列組合以非線性增長。想像未來你只需對 AI 說:「幫我規劃一趟京都三日遊,要有美食和景點,而且我去過的地方不要去。」AI 就能自動連上飯店、餐廳訂位網站,甚至直接把行程表送到你的手機裡。現在之所以做起來還有點愚笨,是因為 MCP 不夠充足。
我們沒有及時的景點資訊、飯店跟餐廳訂位也沒有相對應好存取的 MCP。MCP 還在發展的早期,許多服務也因為技術採用速度、穩定性、商業模式考量等尚未支援。MCP 的設定對非工程師族群尚有一些門檻。
上述美好的情景不一定會那麼快發生,甚至因為技術以外的問題不會發生。我仍相信有一天人類能做到或不能做到的事情,都可能會透過 MCP 或其他類似概念,讓 AI 能夠學會,拼湊出更不一樣的世界。很多事情不需要我們再手工一步一步拼接!如果那一天到來,我還是想要叫 AI 去幫我買菜跟洗碗,讓我可以更好享受煮菜創作的過程,這世界總有些 AI 可能做得比我們好,但我們想自己來的事。
▍後記
MCP 或許很快就會像半導體一樣無縫融入生活,下一代的人或許會理所當然地享受它帶來的便利,甚至連這概念本身都無需知道。而我們,正幸運地見證著 AI 世界快速蛻變的關鍵時刻。
作者 : Dcard 有在徵 infra manager~我們有很多大規模併發、底層機構的挑戰~同時如果有對推薦演算法有經驗的人才我們也都很歡迎聊聊!幫忙介紹推薦成功我也會給推薦獎金喔!!https://boards.greenhouse.io/dcard/jobs/6475999