原創:舉大名耳
來源:AI新智能
圖片來源:由無界AI工具生成
在生成式AI、云計算等技術逐漸抹平大企業與中小企業之間的技術、成本差距后,各企業真正比拼的,只剩下人才、創意與執行力。
目前,隨著AI技術的快速迭代,各種基于AIGC技術的產品不斷涌向社會,而其中最普遍的,則莫過于大量的AI繪圖模型,如Midjourney、Dreambooth、NovelAI和StableDiffusion等。
雖然AI繪圖領域,看似進入了百花齊放的時代,但目前業內的頂流,仍然是Midjourney和StableDiffusion為代表兩大龍頭。
今年4月,Midjourney進一步宣布推出針對二次元、動漫風格的繪圖模型Niji-journeyV5。
這一模型與以往最大的不同,就是它能“取代”高級原畫師了。
憑借著出眾的造型張力和色彩使用、以及豐富的風格化表現力,NijiV5不光看傻一眾吃瓜群眾,甚至驚艷了業內畫師,讓人直呼其已經具有了大師插畫的味道。
之所以能夠如此質變,一大原因在于相較此前版本,NijiV5支持了風格化參數設置。
簡而言之,在該版本下,用戶只需使用風格化命令,就能引用不同藝術家設計風格產出圖片。
在NijiV5的助力下,人們輕易地生成了許多“大師級”的作品。
以太銘文協議創建者Middlemarch發布ESIP-1:7月12日消息,以太銘文協議創建者Middlemarch發布ESIP-1,已于區塊高度17672762上線(7月12日04:30),生效后合約能夠實現以太銘文轉移,即用戶可在OpenSea形式的市場上交易以太銘文。[2023/7/12 10:49:48]
NijiV5產出圖片的品質相當優秀,幾乎覆蓋市面上的常見風格。在此基礎上,使用者只需要微調設計,基本能夠達到大部分優秀高級原畫的工作需求。
如此出色的技術,不禁讓人對其背后的Midjourney公司產生了強烈的興趣。
實際上,雖然Midjourney和StableDiffusion同為當前AI繪畫的兩大領軍者,但其當下的境遇卻有著天壤之別。
StableDiffusion背后的明星公司——StabilityAI,目前正面臨嚴重的財政困境,由于沒有明確的盈利途徑,公司正面臨倒閉的危機。
相較之下,Midjourney卻運行得風生水起,憑借著付費訂閱的商業模式,Midjourney不僅獲得了每年1億美元的營收,并且在Discord上已經積累了1000多萬用戶。
同為開發繪畫AI的團隊,Midjourney是怎么取得今天的成就的呢?
延伸人類想象力
雖然Midjourney在不融資的情況下就實現了盈利,但從創建的背景來看,創始人大衛?霍爾茨,并不像那種鉆進錢眼里的人。
他為Midjourney設立了一個非常不“銅臭”的宗旨:AI不是現實世界的復刻,而是人類想象力的延伸。
而這樣充滿科幻色彩的宗旨,和大衛的背景、經歷有著很大的關系。
Cardano正在推出新的隱私區塊鏈Midnight和dust代幣:金色財經報道,Cardano背后的公司IOG正在發布一個名為Midnight的新的以隱私為中心的區塊鏈和一個名為dust的代幣。IOG首席執行官Charles Hoskinson周五在蘇格蘭愛丁堡大學舉行的活動表示,Midnight以零知識證明技術為基礎,是目前圍繞Cardano部署的眾多側鏈之一,并將通過提供零知識證明智能合約超越之前的隱私幣項目,該網絡將努力保護隱私,同時允許監管機構和審計員訪問。[2022/11/19 13:23:51]
MidJourney的創始人大衛?霍爾茨
作為一個數學專業的博士生,大衛曾在大學期間研究激光雷達、大氣科學和火星任務,可謂是一個涉獵甚廣,且充滿好奇心的“怪才”。
經過了廣泛的探索后,大衛似乎找到了自己真正的興趣所在,于是,在2010年便創立了一家研發手部跟蹤技術為主的公司——LeapMotion。
然而,由于與之相關的VR/AR技術一直不成熟,LeapMotion也始終沒能做出有具體應用場景的產品。
大衛之前研發的手部追蹤產品
最終,2019年,大衛把LeapMotion公司賣給了競爭對手Ultrahaptics。隨后,他成立了一個工作室來探索新的機會,
恰巧在這時,AI在生成藝術方面取得了突破。
Transformer架構的出現,徹底改寫了圖像合成的歷史。從此,多模態深度學習整合了NLP和計算機視覺的技術,成為圖像合成的藝術方法。
a16z普通合伙人Chris Dixon登頂《福布斯》2022年全球最佳風險投資家“Midas List”榜首:4月13日消息,Andreessen Horowitz(a16z)普通合伙人Chris Dixon榮登《福布斯》(Forbes)2022年全球最佳風險投資家“Midas List”榜首。據福布斯4月12日報道,Dixon將3.5億美元的加密基金I(Crypto Fund I)在2021年轉化為60億美元的已實現和未實現收益。據“了解該基金財務狀況的消息人士”稱,這相當于17.7倍的驚人收益。
相比之下,整個加密貨幣市場市值僅從2021年1月1日的7800億美元增長到同年12月底的2.3萬億美元,增幅為200%。(Cointelegraph)[2022/4/13 14:21:39]
于是,借著生成式AI的東風,大衛創建了Midjourney。
公司團隊成員僅11人,其中1位創始人、8位研發人員、1位法務、1位財務。
在公司的構成中,完全沒有產品經理、市場銷售人員,除了創始人、兩個支持性崗位,80%的人員都是研發人員。
而作為中堅力量的研發成員,一半都是尚未畢業的本科生。
Polygon 推出基于STARK零知識證明的擴容方案 Miden,采用Facebook開源技術且兼容EVM:11月16日消息,Polygon宣布推出基于零知識的、與 EVM 兼容的擴容解決方案Miden,同時也將開源其核心組件的早期原型版本Polygon Miden 虛擬機 (VM) 。Polygon Miden 是一個基于 STARK 的 ZK Rollup,Polygon Miden VM 是完全開源的基于 STARK 的虛擬機,它的作用是驗證程序執行并為DApp 部署提供增強的盡職調查。Miden VM 通過利用Facebook的Novi開發的STARK證明器/驗證器Winterfell 對基于Rust語言編寫的零知識虛擬機 Distaff VM進行了擴展。Distaff VM和Winterfell的核心開發人員Bobbin Threadbare將加入 Polygon 作為 Miden Lead,致力于重新整合 Distaff,將 Distaff 和 Winterfell 結合起來,并繼續開發 Miden VM 及其周圍的生態系統。
除Polygon Miden外,Polygon價值10億美元的ZK策略資金還孵化Polygon Hermez和Polygon Nightfall。Polygon Hermez是此前收購的Hermez Network,Polygon Nightfall是與安永共同開發構建的以隱私為重點保護的Rollup。[2021/11/17 21:56:06]
雖然這四位本科生都有一些實操甚至是創業經歷,但是確實經驗有限,而且也非畢業頂尖名校。
剩下來的幾位研發人員,都有著比較豐富的職業經歷。
動態 | 美國證券交易委員會正在尋求凍結Reggie Middleton的資產:美國證券交易委員會正在尋求凍結Reggie Middleton的資產,Reggie Middleton是價值1480萬美元的Veritaseum(VERI)ICO的組織者。[2019/8/14]
在聚攏人才后,大衛也進一步明確了自己對于Midjourney的理念。
大衛將公司Logos設計成了一艘在波浪中航行的帆船,意為水既危險,又是文明的驅動力。
懂得如何與水一起生活和工作的人類,將有能力在水中游泳、做船、筑壩發電,從而更好的生活,因此,大衛認為AI是人類想象力的引擎。
然而,在當時生成式AI的競爭格局上,有這類“雄心壯志”的團隊,可不只Midjourney一家。
例如StableDiffusion的母公司Stability.AI,在創立時也聲稱要將自己的使命定格為成為世界領先的開源AI公司,并發揚將AI共享于全世界的理念。
然而,口號喊得震天響,理念終歸是不能當飯吃的啊。
情懷滿滿的大衛,之后是怎么解決一系列公司融資、盈利的問題的呢?
開源VS閉源
從今天來看,Midjourney的盈利模式看上去十分簡單,即通過付費訂閱的商業模式,按月向用戶收取費用,其標準有3種套餐,分別是10/30/60美元/月。
不過,這樣的模式要想行得通,得解決兩大關鍵問題:
1.憑什么讓用戶產生付費的意愿?
2.大模型訓練所需要的高昂成本怎么解決?
先來說說第一點,實際上,當AI圖像生成技術開始方興未艾之時,很多使用者并不覺得這種技術是需要“付費”的。
原因就在于,當時像StableDiffusion這樣的行業龍頭,為了吸引大量的開發者,最大程度的把模型用起來,因此采取了開源的模式。
和Dall?E、Midjourney不同,StableDiffusion是完全免費、不限次數、任何人都可用的。
雖然對硬件有著一定要求,但也能在幾秒鐘內生成高清圖像。
這樣的好處在于,開源社區會齊心協力地完善模型文檔,共同解決技術難題。這使得代碼的迭代速度非常快,優化效率遠遠高于閉源系統。
但缺點也很顯而易見,那就是商業化不夠直接,可能為別人“做了嫁衣”。
而相較之下,Midjourney卻采用了不那么開放的“閉源系統”。
如果說閉源系統真的有什么好處,那就是針對性更強了。
因為模型閉源,并通過龐大的用戶量積累了獨有的數據集,可以根據用戶需求不斷地針對性訓練模型,長期來看更有利于建立競爭壁壘。
在探索用戶需求這點上,大衛采取了產品上線后邊測試邊改進的辦法。
例如Midjourney模型最開始很慢,需要20分鐘才能出一張高質量的圖片。后來團隊推出了一個做15秒生產圖片,但是質量沒那么高的版本,
經過多輪測試,團隊了解到,速度和質量其實都只是表象,因為不同用戶的選擇,實際上是多維度的。
在針對用戶需求進行調整后,無論是創意行業設計者,還是普通愛好者,都能通過Midjourney滿足自身的繪畫需求。
除了了解用戶需求外,在使用流程方面,Midjourney也并不像StableDiffusion需要本地部署,操作十分便捷,對顯卡和硬件性能也幾乎沒有要求。
雖為閉源,但Midjourney在使用難易度上,卻更像一個“親民”的大眾產品。
于是,Midjourney獲得大量用戶后,養成了用戶使用習慣,且在開啟付費訂閱后就進一步加強了用戶粘性。
算力難題
剛才提到,Midjourney在硬件方面,對用戶幾乎沒什么要求。而這樣的原因,則是由于Midjourney所有的圖片都是在云上完成并訓練的。
但如此龐大的云計算量,必然需要高昂的成本,這就回到了剛才的第二個問題:
在沒有融資的情況下,在云上進行大模型訓練所需要的高昂,該成本怎么解決?
實際上,大衛解決這個問題的方式很簡單,也很不可思議。
當大衛需要找到一個云供應商提供10,000個GPU時,他直接給云供應商的負責人發了封電子郵件,結果對方就直接給到了這些資源,完全不需要風險投資。
看到這兒,也許有人驚得下巴都掉了,這種事在現實中真的可能嗎?
當然,供應商并不是抽風了,而是看中了大衛之前的成就和聲譽。
大衛之前的創業已經獲得了聲譽,大衛打從創辦LeapMotion的時候起就有一個觀點,他覺得技術的最大限制不是規模、成本或速度,而是人們如何與之互動。
LeapMotion的手勢互動是一個嘗試,到了Midjourney這里,他開始使用更短的繪畫關鍵詞來催動AI產出。
這樣的理念,吸引了每一個了解大衛的人,也讓他得到了云供應商的支持。
然而,在獲得了供應商的鼎力支持后,大衛也仍然要面對算力捉襟見肘的問題。
從成本來說,Midjourney大約10%的云成本用于訓練,90%是用戶制作圖像的推理。所以幾乎所有的成本都在制作圖像上。
為解決這一點,Midjourney在世界上八個不同的地區,設立了自己的服務器,比如韓國、日本或荷蘭等,在每個時區的夜間,當地人都在睡覺,沒有人使用GPU。Midjourney就可以充分利用這些算力,實現GPU負載平衡。
實際上,這種依靠云端服務器來降低成本、加快模型訓練的做法,與目前騰訊訓練大模型的策略十分相似。
在算力已經愈發成為大模型訓練瓶頸的今天,如果在訓練開發環節,直接調用云端的大模型和AI算力資源,完成后一鍵分發到用戶終端上,就可以大大降低成本,減少工作量。
因此,Midjourney“云上計算”的這一步棋,著實是摸準了時代的方向。
互聯網的演進之路,已經說明,無論ToB還是ToC行業,都在追求越來越集約精簡的終端硬件、越來越低門檻的交互入口、越來越輕盈的軟件應用。
所以說,大模型從云入端,是模型服務商實現商業化的必爭之地。
總結
從Midjourney看似不可思議的創業經歷,我們可以發現,在這次AIGC時代的浪潮中,能夠脫穎而出的企業、團隊,未必是財大氣粗的頭部大廠。
因為在生成式AI、云計算等技術逐漸抹平大企業與中小企業之間的技術、成本差距后,各企業真正比拼的,只剩下人才、創意與執行力。
而這也是為什么,Midjourney這類僅有寥寥十幾人的小團隊能脫穎而出的原因。因為這樣依靠少數尖端人才組建的團隊,具有大企業所沒有的靈活性、創見和魄力。
而這類小團隊的創意、靈感,若要真正在市場、社會中扎下根,就離不開對用戶多樣化、個性化需求的追蹤。
這是因為,AIGC技術的“泛用性”,決定了其絕不是針對某一行業、人群,或是某一類企業的技術。
只有在這多樣化的需求中,盡可能地滿足不同層級用戶的特定需求,一款產品才能真正地具有長遠的生命。
既服務所有人,又不忽視每一個特殊的人,這或許就是Midjourney成功的最大原因。
文:卞純 經濟學家指出,如果沒有加密貨幣,經濟會更好,會有更多的錢用于消費和投資。自比特幣誕生以來,人們對于這一加密貨幣的看法一直存在著巨大的分歧.
1900/1/1 0:00:00作者:畢良寰 距離以太坊Shapella升級僅剩一天的時間!自2015年以太坊上線以來,它已成為世界排名第二的加密虛擬資產,以太坊誕生于行業的意義在于它能夠讓開發者構建智能合約和去中心化應用.
1900/1/1 0:00:00原文作者:Leo,BlockBeatsWeb3錢包追蹤應用Context宣布其推出的NFT鑄造聚合器mint.fun已開放通行證鑄造,用戶可在其官網免費mint!fundrop通行證.
1900/1/1 0:00:00藍色光標2022年年度報告出爐,巨虧21.75億元,其中20.38億虧損因商譽、無形資產及其他資產減值造成,而在實際虧損業務中,元宇宙占比不小.
1900/1/1 0:00:00原文:《WhatisShardeumandHowDoesItWork?》By?CJ,CoinGecko編譯:餅干,ChainCatcherShardeum是一個基于EVM的Layer1網絡.
1900/1/1 0:00:00近日在HongKongWeb3大會的舉辦中,我們看到香港的繁華和煥發的同時,也有人不禁發問:「為什么V神沒去香港的萬向大會?」畢竟我們都知道以太坊和香港Web3大會的主辦方萬向有著深厚淵源:在以.
1900/1/1 0:00:00