幫一百個國家建立模型——Stability...

首頁
專家專欄
幫一百個國家建立模型——Stability.AI爭議CEO的野望

幫一百個國家建立模型——Stability.AI爭議CEO的野望

發表於 2024-04-22 13:33 作者： Empower Labs

來源：Empower Labs

3月23日，飽受爭議的Stability AI CEO Emad Mostaque 宣布辭職，未來將全身心投入去中心化AI事業。這一消息引起了市場上不小的震動。

Stability AI一方面曾獨自扛起开源AI的旗幟，爲开源AI做出了重要的貢獻；另一方面又不斷被指責將其他研究團隊的成果攬在自己頭上。而CEO Emad虛假學歷的曝光和在社交媒體上頻繁的大話令其聲譽進一步受損。曾經擁有閃耀的投資人支持和巨額融資，Stability.AI卻早已深陷財務困境，命懸一线。

辭職後，Emad透露自己仍持有Stability.AI的大部分股份，足以控制董事會。他不是被迫辭職，而是認爲在AI領域，權力的高度集中對每個人都是有害的，因此選擇辭職以促進Stability.AI的改變。由於Emad有着不光彩的吹牛史，大多數人都認爲事情並不僅如此簡單。不過比起Stability.AI，我更想探討Emad將要投身的去中心化AI。

幾周前，我與Emad一同參與了一場圍繞去中心化AI的討論。之後我又整理了他過去關於這一議題的諸多發言，粗略的梳理出了他的視角。

誰控制了模型，誰就控制了思想

如果人類的行動是由操作系統驅動，AI正快速成爲這個操作系統的外部核心組件。因爲人類已經逐漸適應將思考負擔外包給AI，這個技術構成了我們思考方式的一部分。然而AI所帶來的便利和賦能，也伴隨着顯著的風險——誰控制了AI模型，誰就一定程度上控制了這個世界的思想。

如果大衆對這些智能工具的工作原理和默認設置缺乏認識，我們的決策和觀點可能會悄無聲息地受到影響。AI模型的控制者可以通過設定特定默認選項，潛移默化地引導人們的選擇、觀點及行爲。AI作爲下一個時代的基礎設施，如果只被少數商業團體所控制，後果可能是災難性的。這就是Emad所強調的，去中心化AI的重要性和迫切性所在。

每個國家都需要有自己的模型

當OpenAI投入巨大的精力在超級對齊(Super Alignment)項目時,誰來負責OpenAI本身和全世界每個國家，每個行業，每種文化的對齊？

沒有人。

OpenAI的Super Alignment在基礎安全和人類共同的倫理道德方面做出了很大的努力,但面對不同國家和文化的多樣性,這樣的努力是否足夠? 不同民族和文化往往有着與硅谷精英迥異的價值觀,而這些多元價值觀能否公平地反映到AI模型中？當像肯尼亞這樣的國家,他們的下一代學生开始大規模使用硅谷AI學習時,他們獨特的國家文化特色是否會逐漸消失？

答案很不樂觀。因此Emad認爲每個國家、每個行業、每種文化,都應該擁有代表自己特色的AI模型。這些模型應該深深扎根於當地,充分吸收和體現這個國家、行業和文化的集體智慧。這個概念大家應該也不陌生，因爲兩個月前英偉達也在各種場合講了主權AI的概念，本質上是一個東西。不過Emad早在一兩年前就开始在各種場合來講這個事，還是比英偉達早了很多。

這個世界上的絕大部分國家根本沒有能力創建自己的AI模型，而這恰恰就是Emad瞄准的市場。他希望通過創建一個底層堆棧來支持每個國家、民族、行業創建的AI模型。而在堆棧上，則希望用去中心化集體協作的方式來實現模型的發展。

Emad曾表示可能會啓動/孵化一系列的公司，每個公司會有不同的專業人才聚焦在不同的關鍵領域，如教育，醫療，金融，當然也包括針對不同國家的AI模型。而作爲去中心化AI的實踐，這些公司更多扮演的是啓動器的角色。通過提供基礎模型、標准化的框架，來引入社區人才參與貢獻。如果能吸引到一個國家的大量優秀人才來參與貢獻，這些集體智慧最終會匯聚爲一個優秀的國家模型。

核心是數據

用一個簡單的比喻，AI模型的配方就是算法和數據，然後用一些算力把它們攪拌在一起，數據越多，需要攪動這些數據的算力越大。目前市場上的絕大部分團隊都在追求更好的模型算法，拿到更多的數據，然後配以更大的算力。但實踐已經證明，如果數據質量高，用更少的數據量同樣能取得優秀的效果。換句話說，人們在通過堆算力給低質量數據擦屁股。

這構成了Emad推崇的去中心化AI體系的一個優點。他相信，如果能建立一個結構來引導一個國家的優秀人才共同參與，就能集結出高質量的國家數據集，同時這些數據可以做到可驗證、所有權清晰，並可以由此設計圍繞數據的激勵模式。

通過這種方式，我們能收集到過去根本接觸不到的數據。這些數據不僅質量更高，能更真實和公正地代表大衆的聲音和需求。

小模型集群 vs 單一大模型

在AI領域，Scaling laws 幾乎成了一條鐵律，無論我們是否選擇追求它，都無法回避它。

很顯然，採用去中心化的方式來組織資源，再通過Scalling Law實現通用人工智能（AGI）短期內並不現實。在相當長的一段時間內，以社區爲導向的AI模型也難以與像OpenAI這樣的巨頭競爭，爭奪最強大模型的桂冠。

然而，追求AGI和創造廣泛適用的AI是兩回事。隨着技術的不斷進步，社區驅動的中小型模型正在迅速提升能力。預計一兩年之內，中小模型就足以勝任大部分日常任務。也許它不是最強，但它足夠實用，成本也足夠低，可以打开廣闊的應用場景。就像我們买的大部分網購並不需要用順豐隔日達一樣，模型的混合使用未來會逐漸主流化。

這就帶來極爲重要的一個變化，當集體智慧驅動的模型被廣泛應用時，就大幅減少了單一大模型由單一機構控制帶來的潛在風險。如果大型模型的數據出現污染，這些基於集體智慧的模型也能輕松扮演校准器的角色，進行必要的糾正。這不僅僅是關於實用性和成本節約，更是集體智慧與AI上帝之間的博弈。

從技術角度看，小型模型也並不完全是劣勢。規模小使得他們更容易針對垂直領域進行額外的訓練。在這些領域內，盡管綜合能力可能不及大型模型，但它們能作爲專家級工具發揮出色的性能。而一個由衆多專家模型構成的小模型集群，在與單一大模型的競爭中還真不一定會輸。

更加重要的是模型小能夠有效促進部署的去中心化。在談到去中心化時，我們不僅指的是模型的建設和數據來源的去中心化，還包括治理的去中心化以及部署的去中心化。如果开源模型能很方便的部署在個人的筆記本電腦甚至是手機上，這會構成AI平權。即使是中心化的服務提供者如果關閉了服務，用戶仍然可以依靠本地AI繼續操作。讓人們可以不受限的廣泛使用AI也是去中心化AI的重要目標。

AI + Web3 – 騙子還是未來

毫無疑問，Emad正在積極推動的去中心化AI計劃與加密技術密切相關。他已經表明要設計一種Web3協議，以整合並實現他的這些構想。這是因爲AI領域目前缺乏的幾個關鍵元素——數據的可驗證性、數據所有權、大規模協調與激勵機制、以及集體治理能力——正是Web3技術所擅長的領域。

在這裏我想着重提一下治理。因爲從來沒有一種技術像今天的人工智能這樣強大，並且即將廣泛且深入地影響世界的各個角落。誰應該決定這項技術的未來方向？誰能有效地掌控它？由少數公司如OpenAI的董事會來治理人工智能一定不是最有效的方案。簡單地由監管層對AI模型設置一些硬枷鎖也不一定能有效應對挑战。集體治理可能才是真正的解決之道。

在Web3領域，集體治理的實驗正興盛發展，覆蓋了數據治理、應用治理、網絡治理以及組織治理等多個層面。雖然大部分嘗試仍處於探索階段，也經歷了多次失敗，但這裏是人類治理發展的最前沿。

在過去的五年中，加密領域裏，特別是圍繞去中心化自治組織（DAO），人們幾乎嘗試了人類歷史上所有的治理模式。OpenAI採用的由非盈利基金會控制盈利公司的創新結構，在DAO裏早已經被廣泛實踐過。在我看來，Web3世界的人們在過去幾年就像是打了一場治理速通遊戲。人們在短短幾年內重新演繹了人類幾千年的治理歷程。

一個最常見的批評是大部分Web3治理不過是把過去人類已有的治理模式復制了一遍然後加上了個鏈上投票。不過歷史已經告訴我們，當擁有如此快的成長速度和很高的人才密度的時候，很快就會進化出全新的事物。

一個不那么恰當的例子是互聯網廣告。記得互聯網剛剛興起的那幾年，打开新聞網站，一個巨大的全屏廣告會突然出現然後緩慢消退，而網頁上布滿了密密麻麻的廣告塊，這成了早期互聯網的標志性記憶。因爲那時候人們並不知道什么是更加有效的互聯網推廣方式，所以幹脆就是把傳統媒體上的廣告方式簡單搬到了互聯網上。然而隨着場景的進步，隨着人們對互聯網技術以及文化理解的加深，很快就進化出了人類歷史上從未有過的高效推廣模式，並迅速在互聯網上淘汰掉了傳統廣告。

在我看來對技術的治理也會走過類似互聯網廣告的路徑。區塊鏈技術帶來了大幅加強的協調和治理能力，人類歷史上從未有過的集體治理方案將從中生長出來，對此我充滿了信心。