狐說八道

雜談科技、商業與創業,反正就是我可能覺得不錯有意思的事情

Latest

圖靈測試 75 年來首次被AI成功突破,GPT-4.5如何辦到的 ?

圖靈測試 75 年來首次被AI成功突破,GPT-4.5如何辦到的 ?

圖靈測試由計算機科學先驅艾倫·圖靈於1950年提出,被視為判斷機器是否具有智能的重要方法。測試的核心是一場「模仿遊戲」:一位人類審問者同時與兩位受試者(一位人類和一位機器)進行文字對話,雙方都嘗試說服審問者自己是真正的人類。如果審問者無法可靠地辨別出誰是人類,那麼機器就被認為通過了測試。 75年來,許多系統嘗試挑戰圖靈測試,但都未能成功。直到現在,研究人員發現大型語言模型(LLM)終於突破了這道門檻。 研究方法與突破性發現 研究團隊評估了四種系統:ELIZA(一種1960年代的規則型聊天機器人)、GPT-4o、LLaMa-3.1-405B和GPT-4.5,讓它們與真人一起參與標準的三方圖靈測試。測試參與者有5分鐘時間與系統和真人同時對話,最後判斷哪一方是人類。 研究結果令人驚訝: 1. GPT-4.5:當被提示採用特定人物角色時,它被判斷為人類的比率高達73%,顯著超過了真人被識別的機率(27%)。 2. LLaMa-3.1-405B:同樣提示詞下,被判斷為人類的比率達56%,與真人不相上下。 3. 對照組:未經特殊提示詞的GPT-4o和ELIZA則表現平平,僅有21

By Fox Hsiao
Sam Altman 被 OpenAI 解雇事件背後的真實故事

Sam Altman 被 OpenAI 解雇事件背後的真實故事

秘密、誤導與信任破裂。科技界當紅 CEO 被閃電開除又戲劇性回歸的內幕。 (改編自 Keach Hagey 所著新書《The Optimist: Sam Altman, OpenAI, and the Race to Invent the Future》(《樂觀主義者:Sam Altman、OpenAI 與創造未來的競賽》),本書將由 W.W. Norton 出版社於 2025 年 5 月 20 日出版。版權所有歸作者 Keach Hagey。) 2023 年 11 月中旬,一個溫暖的夜晚,億萬富翁創投家彼得·提爾(Peter Thiel)在洛杉磯藝術區一家名為

By Fox Hsiao
GPUs融化中!從「畫素註解」到「魔法繪師」:ChatGPT-4o圖像技術有多猛?

GPUs融化中!從「畫素註解」到「魔法繪師」:ChatGPT-4o圖像技術有多猛?

社群媒體上瘋傳著各種以ChatGPT-4o生成的吉卜力風格圖像,熱潮之猛烈,甚至讓OpenAI創辦人Sam Altman在3月28日發推特表示:"看到人們喜愛ChatGPT中的圖像功能真是太有趣了,但我們的GPU正在融化。我們將暫時引入一些使用限制,同時努力提高效率。希望不會太久!"——短短幾天,這則推文已獲得700萬次瀏覽,足見此功能的爆炸性影響。這些作品不僅令人驚嘆於其畫風以及角色連續性,更令人好奇其背後的技術突破。 與此同時 OpenAI 釋出了《GPT-4o系統卡的增補:原生圖像生成》技術報告,首次揭開了這款引爆網路的圖像生成技術的神秘面紗。 報告中的關鍵揭露令人驚訝:與之前的DALL·E系列截然不同,4o圖像生成並非獨立的擴散模型,而是深度嵌入GPT-4o架構中的自迴歸模型。這種根本性的架構差異,讓我們得以一窺AI視覺技術數十年來的演變歷程。 從早期需要人工標記每個像素的繁瑣工作,到如今能自動理解並創造精美圖像的全能模型,這一路徑不僅顯示技術的進步,更代表我們理解智能本質的深刻轉變。本文將帶您了解 AI 圖像訓練方法的演進過程,揭示從語義分割到弱監督學習,再到今日生成式

By Fox Hsiao
哈佛與 P&G 合作研究人工智慧如何徹底改變團隊合作模式

哈佛與 P&G 合作研究人工智慧如何徹底改變團隊合作模式

隨著人工智慧在各領域迅速發展,AI 不僅能提升個人工作效率,更有可能徹底改變團隊協作的本質。哈佛大學數位數據設計研究所(Digital Data Design Institute at Harvard)最新發表的研究成果顯示,AI 不僅是一項工具,更像是一位「數位團隊成員」,正在重新定義專業知識的界限與團隊合作的方式。 原始研究與貼文連結 – > https://www.oneusefulthing.org/p/the-cybernetic-teammate 實驗設計:模擬真實商業環境測試 AI 效能 研究團隊以寶僑公司(Procter & Gamble)為實驗場域,招募了 776 名來自歐美的專業人士參與這項隨機對照試驗。實驗參與者需在一天的工作坊中,為嬰兒用品、女性護理、個人修飾和口腔護理等真實業務部門開發產品創意、包裝和零售策略。優秀的點子將提交給管理層批准,因此結果也具有實際意義。 研究人員隨機組成了由一位商業專家和一位研發專家組成的團隊,這些專業人士平均在寶僑工作超過 10 年。一半的團隊和個人可使用 GPT-4

By Fox Hsiao
NVIDIA CEO 黃仁勳 2025 GTC 演講,下一代 AI 運算效能暴增 40 倍,矽光子技術讓 NVIDIA 再領先 5 年,完整中英文字幕對照影片

NVIDIA CEO 黃仁勳 2025 GTC 演講,下一代 AI 運算效能暴增 40 倍,矽光子技術讓 NVIDIA 再領先 5 年,完整中英文字幕對照影片

NVIDIA 創辦人暨執行長黃仁勳在最新一屆 GTC 大會主題演講中,揭示了 AI 產業的劃時代發展及該公司雄心勃勃的技術藍圖,展現 NVIDIA 如何透過創新技術引領全球 AI 運算革命。 從電競顯卡到 AI 霸主 黃仁勳開場回顧了 GTC 從 25 年前專注於 GeForce 顯示卡的起點,到如今成為全球 AI 技術盛會的歷程。他特別宣布推出新一代旗艦級顯示卡 GeForce 5090,並強調 AI 如何徹底改變電腦繪圖技術,實現 100% 即時路徑追蹤,大幅提升精確度與時間穩定性。 AI 發展邁向「具代理能力」與「物理 AI」新階段 黃仁勳分析了 AI 在近十年的演進,從感知 AI、生成 AI,到現在的「

By Fox Hsiao
🤖 【客座文】 MCP 的發展將取代 AI 工作流平台

🤖 【客座文】 MCP 的發展將取代 AI 工作流平台

作者 : 洪大倫 光明頂創育智庫創辦人,原文發表於臉書 過去幾年,AI自動化的需求暴增,帶動了一波工作流平台的風潮。Make、n8n、Dify 這類工具紅遍半邊天,許多人都靠它們來讓繁瑣的流程變得自動化,但如果你以為工作流平台已經是終極解法,那你可能要準備迎接下一場變革了。MCP(Model Context Protocol)正在悄悄崛起,未來這類架構的發展,很可能讓傳統的工作流平台變成「老時代」的產物。 我不是在唱衰工作流平台,雖然它們的確改變了許多AI的操作方式,讓原本需要人工處理的一大堆步驟變成自動化流程。問題是,這種「線性」的方式終究有它的極限——就像堆積木一樣,每個動作都要按順序來,稍微有一點變化或邏輯不對,整個流程就可能崩掉。 簡單說對許多人而言,串接這些工具與流程,還是非常麻煩的事。你得自己理解邏輯,拉線去串,去個別平台申請帳號,還要設定各種參數,種種區塊的串接並不那麼直覺,總是令人困惑。試想,你如果要解決100種問題,你就得組裝出100個線性的流程,真有可能這會是人類使用AI自動化的未來嗎?我一直都保持高度的質疑。 MCP的架構就完全不同,它以圍繞在一個特定的客

By Fox Hsiao
什麼是氛圍開發 Vibe Coding ?

什麼是氛圍開發 Vibe Coding ?

Andrej Karpathy 是一位知名的電腦科學家,最為人熟知的經歷是他曾任特斯拉的人工智慧總監、也是 OpenAI 的共同創辦人之一,近期他更是連出兩則科普大型語言模型的 Youtube 影片,堪稱是實踐與教育的大神級人物,他在 2 月初的時候在 X 上提出了 Vibe Coding這個字眼,在過去的一個月內顯然成為新的潮流詞彙。 這個字具體是甚麼意思呢?依照他的貼文解釋,他所謂的氛圍開發,是一種相當依賴開發者感覺和直覺的寫程式方式。開發者不再需要深入鑽研每一行程式碼的細節,而是透過自然語言與 AI 工具溝通。想像一下,當開發者只要說出「請將側邊欄的間距縮小一半」這樣的話,AI 就能立即理解並完成相應的程式修改。 這種開發方式主要仰賴 Cursor Composer 搭配 Anthropic 的 Sonnet 模型,以及 SuperWhisper 語音轉文字工具等先進 AI 技術。在直覺程式開發的世界裡,開發流程變得極為簡單。開發者只要用口語或文字描述需求,AI

By Fox Hsiao
🛩️ 揭秘「44死神」:安杜瑞爾與美空軍的無人機革命

🛩️ 揭秘「44死神」:安杜瑞爾與美空軍的無人機革命

美國空軍已正式將通用原子(General Atomics)和安杜瑞爾(Anduril)目前正在開發的無人機分別命名為YFQ-42A和YFQ-44A,這些無人機是協同作戰飛行器(Collaborative Combat Aircraft,CCA)計劃第一階段(或稱增量1)的一部分。這些是美國軍方史上首次使用「戰鬥無人機」的編號,反映美國空軍作戰理念的重大轉變。第一批CCA主要在空對空作戰角色中與有人駕駛戰鬥機密切合作,至少在初期階段如此。 美國空軍參謀長戴維·阿爾文(David Allvin)將軍在空軍與太空軍協會2025年戰爭研討會的主題演講中宣布了這一命名。在美國軍方通用的飛行器和導彈命名系統中,「F」代表「戰鬥機」,「Q」代表無人機,前面的「Y」表示這是原型設計。 值得注意的是,安杜瑞爾工業在官方X平台上發文表示:「這是美國空軍首次為無人戰鬥機發布官方代號。今天,我們離確保美國在未來數十年主宰天空的目標又近了一步。」 有趣的是,安杜瑞爾獲得的YFQ-44A編號在中華文化中可能被視為不吉利,因為安杜瑞爾創辦人 Palmer Luckey 表示,在中華文化中,數字「44」被視為不

By Fox Hsiao
【翻譯文】程式設計的終結,也是新起點:我們所知的程式設計將迎來變革

【翻譯文】程式設計的終結,也是新起點:我們所知的程式設計將迎來變革

作者: Tim O’Reilly 本文出自於此, Tim O’Reilly 是美國科技出版界的重量級人物,他創辦的O'Reilly Media以出版深入淺出的電腦技術書籍而聞名,其書籍封面常以動物圖像為特色。他不僅是成功的出版人,更是科技趨勢的敏銳觀察者,他提出的「Web 2.0」概念,深刻影響了網際網路的發展方向。此外,O’Reilly 也是開放原始碼的積極推動者,他透過出版和會議,促進了開放原始碼社群的發展和壯大。他對科技的遠見和洞察力,使他被譽為「矽谷先知」,他的思想和工作,持續引導著科技界的創新和進步。 本文重點: 1. 程式設計正在演變而非消亡 - 文章指出,雖然媒體聲稱AI將導致程式設計師失業,但歷史告訴我們這只是程式設計形式的轉變,類似於從組合語言到高階語言的轉變。每次技術變革後,我們看到的不是程式設計師減少,而是更多人以新方式參與程式設計。 2. AI將成為程式設計師的輔助工具而非替代者 - 優秀的程式設計師將學會如何有效地使用AI作為協作工具,專注於高價值的系統思考而非機械性的編碼。AI可以處理重複性工作,

By Fox Hsiao
Peter Thiel 才應該在這期 TIME 封面

Peter Thiel 才應該在這期 TIME 封面

看完 All-in Podcast Naval 在講完整段贊許 Elon Musk 後,神來一筆的讚美 Peter Thiel ,讓我更深的確定 TIME 其實搞錯了,不應該把 Elon 放在封面,而是 Peter Thiel。 從 Peter Thiel 體系影響的公司,你可以看到另一個公司命名的特色,從 Mithril 、Narya、Palantir 以及 Anduril,都是小說魔戒裡的物品。就好像你會看到金箍棒、芭蕉扇、七星劍一般自然。從他的早年經歷可以看出,這種命名傳統源自他對托爾金作品的深厚興趣,據說他曾閱讀《魔戒》超過十遍。 Peter Thiel 在 2016 年是矽谷少數公開支持川普的科技巨頭之一,雖然在第二任川普政府沒有擔任任何角色,但跟他直接相關的人跟事務有 : 1. JD Vance:

By Fox Hsiao
安杜瑞爾宣布接管美國陸軍的整合視覺增強系統 (IVAS) 計劃

安杜瑞爾宣布接管美國陸軍的整合視覺增強系統 (IVAS) 計劃

從今天開始,Anduril Industries 將接管歷史上同類計畫裡最大的一個:美國陸軍的整合視覺增強系統 (IVAS) 計劃。 將美國士兵轉變成超級英雄 以下來自 Anduril CEO Palmer Luckey 部落格 對我個人而言,這個消息意義重大。早在 Oculus 時代,我還是個青少年時,就有機會參與陸軍的 BRAVEMIND 項目,從那時起,我就相信每個士兵都會配戴頭戴式裝置,而且會比每個平民都配戴頭戴式裝置還要早。鑑於美國在訓練中損失的士兵比在戰鬥中還多,僅 IVAS 的小隊沉浸式虛擬訓練器 (SiVT) 部分,就有可能比我們想像中任何其他東西都能拯救更多的生命。 將戰士變成科技巫師,並與武器化機器人配對的戰術抬頭顯示器,是 Anduril 最初的提案簡報中的產品之一,這是有原因的。過去八年我們在構建 Lattice 的過程中,讓 Anduril 有能力讓這類事物真正發揮作用,就像軍事戰略家和科技人員自從羅伯特·海因萊因 1959 年的小說《星艦戰士》

By Fox Hsiao