比特幣行情 比特幣行情
Ctrl+D 比特幣行情
ads
首頁 > ICP > Info

FACE:一張照片生成 3D 頭像!蘋果新模型擊敗 StyleGAN2,表情光線都能調

Author:

Time:1900/1/1 0:00:00

來源:量子位

隨便一張照片,就可生成3D頭像。而且光線真實,任意角度可調。

這是蘋果的最新黑科技生成框架FaceLit。

正如其名,FaceLit的特色就是可以將人臉“點亮”。

“自帶光環”的FaceLit在易用性上也不輸同類,甚至更勝一籌——

進行3D建模時,需要的照片素材無需專門選擇角度,數量上也只需一張。

甚至對表情、發型、眼鏡等元素進行調節時,也不需要額外素材。

而傳統的頭像合成工具或者需要多張圖片才能工作,或者對照片角度有刁鉆的要求。

正是憑借這一創新,FaceLit獲得了3.5的FID評分,較同類產品直接高出了25%。

深圳開出第一張區塊鏈代理出口貨物證明:7月26日消息,24日深圳地區開出了全國第一張基于區塊鏈技術的“代理出口貨物證明”,這是區塊鏈技術在出口退稅領域的首次應用,標志著深圳市稅務局圓滿完成了稅務總局證明類業務區塊鏈上鏈的試點任務。(鳳凰網)[2021/7/26 1:16:00]

改進式EG3D合成人像,光線信息單獨處理

下面就來看一下FaceLit具體是如何實現頭像合成的。

總的來說,蘋果采用了將人物本體與光線分別處理再進行疊加的策略。

早期的三維人像合成工具在轉換過程中可能產生形變。

而爆火的NeRF通過將場景拆分成具體因素,提高了3D圖像合成效果,改善了這一問題。

但蘋果團隊認為,在可控性方面,NeRF仍存有不足之處。

于是,在EG3D框架的基礎上,蘋果創造了FaceLit的合成模型。

EG3D通過三平面解碼器,賦予了二維卷積神經網絡生成渲染3D模型所需深度參數的能力。

東港股份開具出北京市第一張區塊鏈電子發票:東港股份公告稱:在北京市稅務局的主導下,子公司東港瑞宏提供了基于區塊鏈技術的應用和支持,于2020年3月3日開具出了北京市第一張區塊鏈電子發票。[2020/3/3]

蘋果團隊對標準的EG3D訓練方式進行了擴展,并將之轉化成了FaceLit框架。

△FaceLit與傳統EG3D渲染流程對比圖

標準的ED3G使用相機位置p參數作為基本輸入參數。

在建立GAN2操作時,蘋果在EG3D的基礎上加入了光照參數l。

不同p(左→右)與l(上→下)值下的初始圖像

動態 | 農業農村部:利用區塊鏈等信息技術 實現全國農藥質量追溯“一張網”:據農業農村部2月12日消息,為貫徹落實中央農村工作會議、全國農業農村廳局長會議及全國農藥管理工作會議精神,農業農村部于近日印發《2020年農藥管理工作要點》。其中提到2020年農藥管理工作包括完善質量追溯體系。利用區塊鏈等現代信息技術,加快構建全國統一的質量追溯系統,逐步實現全國農藥質量追溯“一張網”。完善標簽管理辦法,推行農藥內外包裝二維碼關聯,逐步實現農藥生產、經營、使用全鏈條可追溯。[2020/2/12]

蘋果選擇了經過球形諧波方式簡化后的Phong反射模型作為處理光源的物理基礎。

光照參數l就是在這一基礎之上獨立處理得到的。

在自然界中,反射包括鏡面反射和漫反射兩種形式。

動態 | 云南近日開出全國第一張區塊鏈電子冠名發票:近日,在由云南省人民政府主辦的2019年首屆“數字云南”區塊鏈國際論壇上,云南省省長阮成發與騰訊副總裁、騰訊云總裁邱躍鵬一道,通過“游云南”平臺共同開出全國第一張區塊鏈電子冠名發票。這是云南省與騰訊公司將區塊鏈應用于稅務領域的一次新探索。(科技日報)[2019/8/6]

△不同鏡面反射率條件下的效果對比

因此,蘋果在ED3G模型中加入了鏡面反射解碼器和漫反射解碼器。

它們替代了可以直接得到顏色c、密度σ數據的三平面解碼器。

△反射解碼器流程示意圖

通過對GAN2產生的數據進行再次解碼,可以得到鏡面反射率ks和漫反射率kd。

然后再通過兩種反射著色器得到顏色c,密度σ則由漫反射解碼器計算得出。

獨家 | 一張圖看懂ETF提案對數字貨幣市場的影響:2017年至今,ETF提案與BTC價格聯動,金色內參團隊發現:每一次向SEC提交比特幣ETF申請,短期內都會推動比特幣價格的上漲;每一次SEC拒絕比特幣ETF的申請,絕大多數情況下,都會導致比特幣價格的下跌。欲查看全部內參內容,點擊原文鏈接。[2018/8/24]

最終,FaceLit以與三平面解碼器相同的參數渲染圖像,并進行分辨率優化。

有的放矢設計訓練策略,數據無需人工標注

生成框架已有,那就來到訓練階段,其特點在于訓練過程中無需人工標注。

方法論層面,在訓練時,團隊使用了FFHQ、MetFaces和CelebA-HQ數據集。

對于不同的數據集,蘋果使用了不同的訓練方式。

FFHQ包含了7萬余條人臉數據,其訓練分為兩個階段:先在較低的分辨率下訓練,再提高分辨率再次進行。

對于包含2萬數據量的CelebA-HQ,訓練不需要分階段進行。

而對于更小的MetFAces,則只需要通過ADA擴容的方式,使用預訓練的FFHQ進行優化調整即可。

定性地看,訓練結果在機位、光源和反射高光等方面都有出色的表現,圖中的細節也有所增強。

△FaceLit生成的頭像唇齒部位的細節進行了明顯重構

定量結果同樣表明,FaceLit在FID、KID等指標上均優于包括標準EG3D在內的傳統生成方式。

在使用FFHQ作為訓練集的條件下,各生成方式的表現如下表,不難看出FaceLit擁有最低的FID和KID值。

而相比于英偉達的StyleGAN2,FaceLit的表現依舊出色:

光線準確度方面,FaceLit在使用三種不同訓練數據集的情況下,與人工設定的標準值平均均方誤差均低于0.01。

網友:人們低估了蘋果AI

消息發出后,便有網友認為“這是對更重磅產品的預熱”。

更有網友直接推測,FaceLit的出現標示著人工智能將進軍AR和VR領域,蘋果的混合現實將最終實現商用……

也有網友認為,FaceLit不會商用,否則蘋果才不會以論文的形式發表。

針對FaceLit本身,也有網友表示,除了LLM,其他都是浮云,他們如果不開發LLM,就沒有未來。

但這位網友同時也說,蘋果可能已經在做了。

相應的,也有網友稱人們“低估了蘋果在AI領域的深度”。

所以各位網友對蘋果在AI領域還有什么樣的期待呢?

論文地址:https://arxiv.org/abs/2303.15437

GitHub地址:https://github.com/apple/ml-facelit

參考鏈接:https://twitter.com/AlphaSignalAI/status/1648361623004774400

Tags:FACECELACEELITfacedao幣怎么樣cel幣項目官網Space Pig CoinElite

ICP
EOS:沖“土狗”遇到貔貅盤 Meme熱潮下你需要注意什么?

近期,Meme狂熱,也帶動各種“土狗幣”亂飛。不明真相的吃瓜群眾,跟著“沖土狗”,結果卻誤入“貔貅盤”,資金也無法取回。下圖則是近期一位“貔貅盤”受害者來找到Beosin求助.

1900/1/1 0:00:00
比特幣:一文概覽吉爾吉斯斯坦的比特幣挖礦現狀

吉爾吉斯斯坦與比特幣礦工的關系很復雜。如果做得好,比特幣開采對吉爾吉斯斯坦來說可謂是一個巨大的機會。吉爾吉斯斯坦,一個位于中亞山區的小型發展中國家,比特幣正成為其出口貿易越來越重要的組成部分.

1900/1/1 0:00:00
比特幣:蘋果為何做不好AI?

作者:舉大名耳,來源:?阿爾法工場研究院導語:面對蘋果今天在AI上的種種困境,人們不禁在想,倘若面對這些難題的是喬布斯,他又會如何決斷呢?在今年爆發的AI大戰中,微軟、谷歌、亞馬遜等各個大廠.

1900/1/1 0:00:00
以太坊:以太坊超越比特幣有望?BRC20的出現或帶來一場拉鋸戰

在大多數領域中,“老大與老二的爭奪戰”往往都是異常激烈。主導加密領域的比特幣和以太坊亦開始了“社區共識份額”的競爭。 在大多數領域中,“老大與老二的爭奪戰”往往都是異常激烈.

1900/1/1 0:00:00
ADA:Adaverse年度總結與展望:面向希望,橋接亞非洲與Cardano生態

Adaverse從2021年起就以非洲為起點開始謀篇布局,為面對2022年變動布局的行業演變,Adaverse進一步深耕并連接亞洲、非洲市場并逐步拓展到全球市場.

1900/1/1 0:00:00
比特幣:晚間必讀 | SEC對加密貨幣的打擊其實是利好消息

1.教程:如何在比特幣上注冊.sats域名、發行并鑄造BRC-20代幣最近幾個月來,比特幣生態最大的事件就是比特幣Ordinals協議和銘文的爆發.

1900/1/1 0:00:00
ads