【客座文】MCP 是怎樣讓世界又更好一點點

最近研究 AI 領域的熱門新概念 MCP,原本覺得自己已經理解了,但當我第一次親眼看到 AI 透過 MCP 一口氣完成原本用 ChatGPT 要反覆多次才能解決的問題時,那種震撼感徹底顛覆了我的想像!發現自己對 MCP 從「理解」跟「體會」還是有一段落差。寫了一篇把我自己的心得打下來當作梳理自己的想法。

【客座文】MCP 是怎樣讓世界又更好一點點
mountains by GPT 4.5
本文作者,林裕欽,Dcard 共同創辦人與CEO,本文將帶您深入了解MCP如何突破傳統語言模型的限制,讓AI不僅能「說」,更能「做」。從理論到實踐,從現狀到未來,作者以親身體驗分享這項技術如何通過觀察與行動的循環,以及跨領域整合的網路效應,為我們的工作與生活帶來改變。

最近研究 AI 領域的熱門新概念 MCP,原本覺得自己已經理解了,但當我第一次親眼看到 AI 透過 MCP 一口氣完成原本用 ChatGPT 要反覆多次才能解決的問題時,那種震撼感徹底顛覆了我的想像!發現自己對 MCP 從「理解」跟「體會」還是有一段落差。寫了一篇把我自己的心得打下來當作梳理自己的想法。

▍MCP:讓 AI 把語言變成咒語 From language to spell

LLM 全文是 Large Language Model 大型語言模型,我們平常在使用 ChatGPT 的時候就是輸入一些文字、也是輸出一些文字。我們之所以會覺得 LLM 做出來得很聰明,把它稱為 AI,是因為那些文字用特定人類喜歡的規則排列。

例如蘊含很多知識量、條理分明、或富有創造力。然而不論這些文字多棒,單純資訊輸入輸出,能做的事情還是有限。我們使用 ChatGPT 時經常需要剪下貼上、或是按照 LLM 輸出的指示在現實生活中一步一步操作。有時候不小心做錯了、或是得到不如預期的結果,還要想辦法描述給 LLM 發生了什麼事情,等待下一步指令,實在令人很沮喪。

而 MCP (Model Context Protocol)的出現就是希望解決這樣的問題!MCP 是由 Claude 母公司 Anthropic 提出來的統一規範,讓 LLM 有了「控制」跟「觀察」其他事物的能力。LLM 一樣還是只是會文字的輸入輸出,但只要 LLM 按照規則輸出文字,就會由 MCP (client server host 架構) 把相關文字解讀成指令,去跟其他支援 MCP 的軟硬體互動。就像是有些文字突然變成咒語一般,讓依然只需要負責文字的 LLM 有了更多能力。

▍更好的觀察帶來更好的行動 Better Observations leads to better actions

看完第一段,你可能會用很多方式去描述:「這就是 API 的 API 吧!」「這是 AI 界的 USB!」這些說法都正確,但對有智能的 AI 的來說,改進不僅止「接起來」。

想像一個場景,今天如果我們左手打直拿著手機,再用右手點擊畫面上的一點,相信很多人都能夠輕鬆做到。然而同樣的任務,如果要求你只看一眼後閉上眼,右手再開始動作,要精準點擊到目標的難度就會大大大提升。這是因為一個看似簡單的動作,我們在運動的過程持續透過眼睛觀察去調整。

大腦會根據觀察到的訊號,時時調整每條相關肌肉的發力,最後達成看似簡單的目標。如果不會觀察,就很難把事情做好。繪畫、做菜、音樂、打球等皆是如此。每一次的短暫觀察與動作行為,讓每個任務變簡單,集合在一起就讓人類可以完成各式各樣了不起的事情。

最早將這樣觀察與行動循環帶入 LLM 領域的概念是 Agent。而早期的 Agent 能使用的外界工具有限,例如 Web Search 搜索網路上的結果。而 MCP 大大降低開發工具給 LLM 的門檻,同時賦予 LLM 「觀察」與「控制」外在事物的能力,讓許多任務透過觀察與控制循環得到更多資訊,達成原先 LLM 沒辦法一次就做到的事情。只看一眼後閉上眼睛,就像是我們過去下 prompt 指令一樣,希望 LLM 高表現一次就吐出正確答案。

而有了 MCP 後的 LLM 可以先「試試看」更多事情。例如叫 AI 寫個 3D 遊戲。它可以先試寫一段程式碼,透過 MCP 控制檔案系統跟遊戲編譯器,讓寫出來的程式碼跑起來看看。如果一但發現物理邏輯不如預期、或跑起來光線反射跟原先要求不一樣,可以再換段程式碼寫法,再試一次。

如此往復,讓遊戲越來越靠近用戶的要求。現在支援 MCP 的軟硬體還不算多,但正在以飛速增加中。最基礎如主流資料庫 mysql, postgres, bigquery 都有開源的 MCP 支援。上班族常用的 Excel、短推文媒體 X、財經資訊 Yahoo Finance 也都有 MCP 支援。因為能「試試看」的事情變多了,能做到的複雜任務也比過去多的更多。(ps. 懂寫程式的讀者可以去下載剛出爐的 claude code!寫程式的體驗會有 10x 的感受,看著 AI 自己寫 debug 程式碼試試看為什麼有 bug 的時候,我還記得自己在電腦前叫了出來!)

▍跨領域的網路效應 The Network Effects of Cross-Domain Integration

跨領域的人才能夠做出許多不可思議的事物。例如懂多國料理做法的廚師,能夠融合不同手法創作出新的料理。懂影像、音樂、心理學的講者,或許能把演講帶到下一個高度。人類世界有許多突破性的進展,是因為跨領域的借鏡跟串聯,最後形塑出許多美好事物。

我自己第一次體會到 MCP 震撼的時候,是把多個不同資料庫 MCP (postgres, bigquery) 設定好的第一次提問。原先需要好幾次 LLM 生成 SQL、查表格 、我再手動跑去不同介面執行的問題,支援 MCP 的 claude 一次提問就幫我完成。是 LLM 時代後又一次 10x 效率提升。

這時我想到如果掛上 dashboard (e.g. redash) 的 MCP。瞬間用自然語言產生一張可以持續使用、修改 dashboard 的全過程就被實踐了!這個過程不是簡單的自動化,而是 LLM 有意識的根據當前情境,做出下一步選擇,最後完成的傑出任務。每多一個 MCP,LLM 就對多一個領域有更多理解與控制的能力。

就像是有網路效應一般,能做到的排列組合以非線性增長。想像未來你只需對 AI 說:「幫我規劃一趟京都三日遊,要有美食和景點,而且我去過的地方不要去。」AI 就能自動連上飯店、餐廳訂位網站,甚至直接把行程表送到你的手機裡。現在之所以做起來還有點愚笨,是因為 MCP 不夠充足。

我們沒有及時的景點資訊、飯店跟餐廳訂位也沒有相對應好存取的 MCP。MCP 還在發展的早期,許多服務也因為技術採用速度、穩定性、商業模式考量等尚未支援。MCP 的設定對非工程師族群尚有一些門檻。

上述美好的情景不一定會那麼快發生,甚至因為技術以外的問題不會發生。我仍相信有一天人類能做到或不能做到的事情,都可能會透過 MCP 或其他類似概念,讓 AI 能夠學會,拼湊出更不一樣的世界。很多事情不需要我們再手工一步一步拼接!如果那一天到來,我還是想要叫 AI 去幫我買菜跟洗碗,讓我可以更好享受煮菜創作的過程,這世界總有些 AI 可能做得比我們好,但我們想自己來的事。

▍後記

MCP 或許很快就會像半導體一樣無縫融入生活,下一代的人或許會理所當然地享受它帶來的便利,甚至連這概念本身都無需知道。而我們,正幸運地見證著 AI 世界快速蛻變的關鍵時刻。

作者 : Dcard 有在徵 infra manager~我們有很多大規模併發、底層機構的挑戰~同時如果有對推薦演算法有經驗的人才我們也都很歡迎聊聊!幫忙介紹推薦成功我也會給推薦獎金喔!!https://boards.greenhouse.io/dcard/jobs/6475999

Read more

Sam Altman 被 OpenAI 解雇事件背後的真實故事

Sam Altman 被 OpenAI 解雇事件背後的真實故事

秘密、誤導與信任破裂。科技界當紅 CEO 被閃電開除又戲劇性回歸的內幕。 (改編自 Keach Hagey 所著新書《The Optimist: Sam Altman, OpenAI, and the Race to Invent the Future》(《樂觀主義者:Sam Altman、OpenAI 與創造未來的競賽》),本書將由 W.W. Norton 出版社於 2025 年 5 月 20 日出版。版權所有歸作者 Keach Hagey。) 2023 年 11 月中旬,一個溫暖的夜晚,億萬富翁創投家彼得·提爾(Peter Thiel)在洛杉磯藝術區一家名為

By Fox Hsiao
GPUs融化中!從「畫素註解」到「魔法繪師」:ChatGPT-4o圖像技術有多猛?

GPUs融化中!從「畫素註解」到「魔法繪師」:ChatGPT-4o圖像技術有多猛?

社群媒體上瘋傳著各種以ChatGPT-4o生成的吉卜力風格圖像,熱潮之猛烈,甚至讓OpenAI創辦人Sam Altman在3月28日發推特表示:"看到人們喜愛ChatGPT中的圖像功能真是太有趣了,但我們的GPU正在融化。我們將暫時引入一些使用限制,同時努力提高效率。希望不會太久!"——短短幾天,這則推文已獲得700萬次瀏覽,足見此功能的爆炸性影響。這些作品不僅令人驚嘆於其畫風以及角色連續性,更令人好奇其背後的技術突破。 與此同時 OpenAI 釋出了《GPT-4o系統卡的增補:原生圖像生成》技術報告,首次揭開了這款引爆網路的圖像生成技術的神秘面紗。 報告中的關鍵揭露令人驚訝:與之前的DALL·E系列截然不同,4o圖像生成並非獨立的擴散模型,而是深度嵌入GPT-4o架構中的自迴歸模型。這種根本性的架構差異,讓我們得以一窺AI視覺技術數十年來的演變歷程。 從早期需要人工標記每個像素的繁瑣工作,到如今能自動理解並創造精美圖像的全能模型,這一路徑不僅顯示技術的進步,更代表我們理解智能本質的深刻轉變。本文將帶您了解 AI 圖像訓練方法的演進過程,揭示從語義分割到弱監督學習,再到今日生成式

By Fox Hsiao
哈佛與 P&G 合作研究人工智慧如何徹底改變團隊合作模式

哈佛與 P&G 合作研究人工智慧如何徹底改變團隊合作模式

隨著人工智慧在各領域迅速發展,AI 不僅能提升個人工作效率,更有可能徹底改變團隊協作的本質。哈佛大學數位數據設計研究所(Digital Data Design Institute at Harvard)最新發表的研究成果顯示,AI 不僅是一項工具,更像是一位「數位團隊成員」,正在重新定義專業知識的界限與團隊合作的方式。 原始研究與貼文連結 – > https://www.oneusefulthing.org/p/the-cybernetic-teammate 實驗設計:模擬真實商業環境測試 AI 效能 研究團隊以寶僑公司(Procter & Gamble)為實驗場域,招募了 776 名來自歐美的專業人士參與這項隨機對照試驗。實驗參與者需在一天的工作坊中,為嬰兒用品、女性護理、個人修飾和口腔護理等真實業務部門開發產品創意、包裝和零售策略。優秀的點子將提交給管理層批准,因此結果也具有實際意義。 研究人員隨機組成了由一位商業專家和一位研發專家組成的團隊,這些專業人士平均在寶僑工作超過 10 年。一半的團隊和個人可使用 GPT-4

By Fox Hsiao
NVIDIA CEO 黃仁勳 2025 GTC 演講,下一代 AI 運算效能暴增 40 倍,矽光子技術讓 NVIDIA 再領先 5 年,完整中英文字幕對照影片

NVIDIA CEO 黃仁勳 2025 GTC 演講,下一代 AI 運算效能暴增 40 倍,矽光子技術讓 NVIDIA 再領先 5 年,完整中英文字幕對照影片

NVIDIA 創辦人暨執行長黃仁勳在最新一屆 GTC 大會主題演講中,揭示了 AI 產業的劃時代發展及該公司雄心勃勃的技術藍圖,展現 NVIDIA 如何透過創新技術引領全球 AI 運算革命。 從電競顯卡到 AI 霸主 黃仁勳開場回顧了 GTC 從 25 年前專注於 GeForce 顯示卡的起點,到如今成為全球 AI 技術盛會的歷程。他特別宣布推出新一代旗艦級顯示卡 GeForce 5090,並強調 AI 如何徹底改變電腦繪圖技術,實現 100% 即時路徑追蹤,大幅提升精確度與時間穩定性。 AI 發展邁向「具代理能力」與「物理 AI」新階段 黃仁勳分析了 AI 在近十年的演進,從感知 AI、生成 AI,到現在的「

By Fox Hsiao