OpenAI Sam Altman 對於 AI 經濟學的三個觀察

OpenAI Sam Altman 對於 AI 經濟學的三個觀察
  • AI 發展迅猛,經濟影響巨大: 文章指出 AI 的智慧程度與投入資源成正比,成本快速下降,但社會經濟價值卻呈超指數級增長,這將對經濟產生深遠影響。
  • AI 代理人將成虛擬同事: AI 代理人,特別是軟體工程師代理人,將在各領域扮演重要角色,它們雖然需要人類監督,但能極大地提高生產力。
  • AGI 將改變社會,帶來機遇與挑戰: AGI 將像電晶體一樣滲透到各行各業,改變人們的生活和工作方式。雖然會帶來經濟繁榮和科學進步,但也可能加劇不平等,需要及早思考應對策略。
  • 本文來源,全文用 Gemini 2.0 Flash 編譯,請贊助訂閱本站選文

我們的使命是確保通用人工智慧(AGI)能為全人類帶來福祉。

隨著越來越多系統開始指向AGI,我們認為重要的是要理解我們所處的時刻。AGI是一個定義較為寬鬆的術語,但一般來說,我們指的是一種能夠在許多領域中,以人類水準處理日益複雜問題的系統。

人類是工具的建造者,天生具有理解和創造的動力,這也促使世界變得對我們所有人更好。每一代人都建立在前幾代人的發現之上,創造出更強大的工具——電力、電晶體、電腦、網際網路,以及即將來臨的AGI。

隨著時間的推移,人類創新的穩步發展,時而進展迅速,時而停滯不前,為人們生活的幾乎各個方面帶來了前所未有的繁榮和改善。

在某種意義上,AGI只是我們共同構建的、不斷增長的人類進步階梯上的另一個工具。但在另一種意義上,它是某種事物的開始,讓人不禁想說「這次不一樣了」;我們面前的經濟成長看起來令人驚嘆,我們現在可以想像一個我們能治癒所有疾病、有更多時間與家人共度,並能充分發揮我們創造潛力的世界。

在十年內,也許地球上的每個人都能夠完成比今天最有影響力的人所能完成的更多的事情。

我們持續看到AI發展的快速進展。以下是我們對AI經濟學的三個觀察:

  1. 通用人工智慧模型的智慧程度大致等於訓練和運行它所使用的資源的對數。這些資源主要是訓練所需的算力、資料和推論所需的算力。似乎你可以花費任意數量的金錢,並獲得持續且可預測的收益;預測這一點的縮放定律在許多數量級上都是準確的。
  2. 使用特定水準通用人工智慧的成本大約每12個月下降10倍,而較低的價格會導致更多的使用。你可以從2023年初GPT-4的token成本,到2024年中GPT-4o的token成本中看到這一點,在那段時間裡,每個token的價格下降了約150倍。摩爾定律以每18個月2倍的速度改變了世界;這比它強大得令人難以置信。
  3. 線性增加的智慧的社會經濟價值本質上是超指數級的。其結果是,我們看不到在不久的將來,指數級增加的投資有任何停止的理由。

如果這三個觀察結果持續成立,那麼對社會的影響將是巨大的。

我們現在開始推出AI代理人,它們最終會感覺像虛擬同事。

讓我們想像一個軟體工程師代理人的案例,我們預計它將特別重要。想像一下,這個代理人最終能夠完成頂級公司擁有幾年經驗的軟體工程師所能做的大部分事情,對於長達幾天的任務。它不會有最大的新想法,它需要大量的人工監督和指導,它會在某些事情上做得很好,但在另一些事情上卻出乎意料地糟糕。

儘管如此,還是把它想像成一個真實但相對初級的虛擬同事。現在想像一下有1,000個這樣的同事。或者100萬個。現在想像一下在每個知識工作領域都有這樣的代理人。

在某些方面,AI可能最終會像電晶體一樣在經濟上發揮作用——一項大規模的科學發現,它能很好地擴展,並滲透到經濟的幾乎每個角落。我們不會過多地考慮電晶體,或電晶體公司,而且收益分布非常廣泛。但我們確實期望我們的電腦、電視、汽車、玩具等都能創造奇蹟。

世界不會一下子改變;它從來沒有這樣過。在短期內,生活將基本照常進行,2025年的人們將主要以他們在2024年所做的方式度過他們的時間。我們仍然會墜入愛河、組建家庭、在網路上爭吵、在大自然中徒步旅行等等。

但未來將以一種我們無法忽視的方式向我們走來,而我們社會和經濟的長期變化將是巨大的。我們將找到新的事情要做,新的方式來互相幫助,以及新的競爭方式,但它們可能與今天的工作看起來不太一樣。

能動性、意願和決心可能非常寶貴。正確決定做什麼,並弄清楚如何在不斷變化的世界中導航將具有巨大的價值;韌性和適應能力將是值得培養的有用技能。通用人工智慧將是有史以來對人類意願的最大槓桿,並使個人比以往任何時候都更有影響力,而不是減少。

我們預計通用人工智慧的影響將是不均衡的。儘管一些產業的變化很小,但科學進展可能比今天快得多;通用人工智慧的這種影響可能超越其他一切。

許多商品的價格最終將大幅下降(目前,智慧的成本和能源成本限制了很多東西),而奢侈品和一些固有有限的資源(如土地)的價格可能會更大幅地上漲。

從技術上講,我們面前的道路看起來相當清晰。但關於我們應該如何將通用人工智慧融入社會的公共政策和集體意見非常重要;我們提早且頻繁地推出產品的原因之一,是為了讓社會和技術有時間共同發展。

AI將滲透到經濟和社會的各個領域;我們將期望一切都變得智慧。我們中的許多人期望需要給予人們比我們歷史上更多的對技術的控制權,包括開放更多的原始碼,並接受在安全和個人授權之間存在一個需要權衡的平衡。

雖然我們絕不想魯莽行事,而且可能會有與通用人工智慧安全相關的一些重大決定和限制不受歡迎,但從方向上來說,隨著我們越來越接近實現通用人工智慧,我們相信傾向於個人授權更為重要;我們能看到的另一個可能的途徑是AI被專制政府用來通過大規模監控和喪失自主權來控制其人口。

確保通用人工智慧的利益得到廣泛分配至關重要。技術進步的歷史影響表明,我們關心的大多數指標(健康結果、經濟繁榮等)平均而言,從長遠來看會變得更好,但提高平等似乎並非由技術決定,而要做好這一點可能需要新的想法。

特別是,資本和勞動力之間的權力平衡很容易就會被搞亂,這可能需要早期干預。我們對一些聽起來很奇怪的想法持開放態度,例如給予一些「算力預算」,使地球上的每個人都能使用大量的AI,但我們也可以看到很多方法,只要不斷降低智慧的成本,就能達到預期的效果。

2035年的任何人都應該能夠調動相當於2025年所有人的智力能力;每個人都應該能夠獲得無限的才華,並按照他們想像的方式來引導。現在有大量的才華沒有充分表達自己的資源,如果我們改變這一點,世界由此產生的創造力將為我們所有人帶來巨大的利益。

特別感謝Josh Achiam、Boaz Barak和Aleksander Madry審閱了本文草稿。

*此處使用AGI一詞,旨在清晰地溝通,我們無意改變或解釋定義我們與微軟關係的定義和流程。我們完全期望與微軟長期合作。這個腳註似乎很愚蠢,但另一方面,我們知道一些記者會試圖透過寫一些愚蠢的東西來獲得點擊率,所以我們在這裡預先阻止這種愚蠢的行為……

Read more

AI 顯微鏡解密語言模型思維:窺探語言模型「大腦」的運作方式

AI 顯微鏡解密語言模型思維:窺探語言模型「大腦」的運作方式

語言模型(如Claude)的運作方式一直以來都像是一個黑盒子,Anthropic 最新發表的兩篇研究論文揭露他們如何嘗試「打開」這個黑盒子,了解AI系統內部的思考過程。這項研究不只具有科學價值,也能幫助人類確保AI系統的可靠性與安全性。 AI的「思考」是如何形成的? 大型語言模型不像傳統程式那樣由人類直接編寫,而是透過大量數據訓練而成。在這個過程中,模型自行發展出解決問題的策略,這些策略隱藏在模型執行的數十億次計算中。因此,即使是開發者也不完全了解模型如何完成各種任務。 研究人員從神經科學獲得靈感,嘗試建立一種「AI顯微鏡」,用於識別AI中的活動模式和資訊流動。透過這種方法,他們發現了一些令人驚訝的結果: 關鍵發現 1. 跨語言的「思維語言」 Claude能說數十種語言,那麼它「腦中」使用的是什麼語言?研究顯示,當處理不同語言時,Claude會使用共享的概念空間。 例如,當用不同語言詢問「small的反義詞是什麼」時,模型啟動相同的核心特徵來表示「小」和「相反」的概念,然後觸發「大」的概念,最後將結果翻譯成問題使用的語言。

By Fox Hsiao
圖靈測試 75 年來首次被AI成功突破,GPT-4.5如何辦到的 ?

圖靈測試 75 年來首次被AI成功突破,GPT-4.5如何辦到的 ?

圖靈測試由計算機科學先驅艾倫·圖靈於1950年提出,被視為判斷機器是否具有智能的重要方法。測試的核心是一場「模仿遊戲」:一位人類審問者同時與兩位受試者(一位人類和一位機器)進行文字對話,雙方都嘗試說服審問者自己是真正的人類。如果審問者無法可靠地辨別出誰是人類,那麼機器就被認為通過了測試。 75年來,許多系統嘗試挑戰圖靈測試,但都未能成功。直到現在,研究人員發現大型語言模型(LLM)終於突破了這道門檻。 研究方法與突破性發現 研究團隊評估了四種系統:ELIZA(一種1960年代的規則型聊天機器人)、GPT-4o、LLaMa-3.1-405B和GPT-4.5,讓它們與真人一起參與標準的三方圖靈測試。測試參與者有5分鐘時間與系統和真人同時對話,最後判斷哪一方是人類。 研究結果令人驚訝: 1. GPT-4.5:當被提示採用特定人物角色時,它被判斷為人類的比率高達73%,顯著超過了真人被識別的機率(27%)。 2. LLaMa-3.1-405B:同樣提示詞下,被判斷為人類的比率達56%,與真人不相上下。 3. 對照組:未經特殊提示詞的GPT-4o和ELIZA則表現平平,僅有21

By Fox Hsiao
Sam Altman 被 OpenAI 解雇事件背後的真實故事

Sam Altman 被 OpenAI 解雇事件背後的真實故事

秘密、誤導與信任破裂。科技界當紅 CEO 被閃電開除又戲劇性回歸的內幕。 (改編自 Keach Hagey 所著新書《The Optimist: Sam Altman, OpenAI, and the Race to Invent the Future》(《樂觀主義者:Sam Altman、OpenAI 與創造未來的競賽》),本書將由 W.W. Norton 出版社於 2025 年 5 月 20 日出版。版權所有歸作者 Keach Hagey。) 2023 年 11 月中旬,一個溫暖的夜晚,億萬富翁創投家彼得·提爾(Peter Thiel)在洛杉磯藝術區一家名為

By Fox Hsiao
GPUs融化中!從「畫素註解」到「魔法繪師」:ChatGPT-4o圖像技術有多猛?

GPUs融化中!從「畫素註解」到「魔法繪師」:ChatGPT-4o圖像技術有多猛?

社群媒體上瘋傳著各種以ChatGPT-4o生成的吉卜力風格圖像,熱潮之猛烈,甚至讓OpenAI創辦人Sam Altman在3月28日發推特表示:"看到人們喜愛ChatGPT中的圖像功能真是太有趣了,但我們的GPU正在融化。我們將暫時引入一些使用限制,同時努力提高效率。希望不會太久!"——短短幾天,這則推文已獲得700萬次瀏覽,足見此功能的爆炸性影響。這些作品不僅令人驚嘆於其畫風以及角色連續性,更令人好奇其背後的技術突破。 與此同時 OpenAI 釋出了《GPT-4o系統卡的增補:原生圖像生成》技術報告,首次揭開了這款引爆網路的圖像生成技術的神秘面紗。 報告中的關鍵揭露令人驚訝:與之前的DALL·E系列截然不同,4o圖像生成並非獨立的擴散模型,而是深度嵌入GPT-4o架構中的自迴歸模型。這種根本性的架構差異,讓我們得以一窺AI視覺技術數十年來的演變歷程。 從早期需要人工標記每個像素的繁瑣工作,到如今能自動理解並創造精美圖像的全能模型,這一路徑不僅顯示技術的進步,更代表我們理解智能本質的深刻轉變。本文將帶您了解 AI 圖像訓練方法的演進過程,揭示從語義分割到弱監督學習,再到今日生成式

By Fox Hsiao