找什麼物件啊,我每天100次愛上性轉的自己

找什麼物件啊,我每天100次愛上性轉的自己

全都是不存在的人丨參考文獻1

有隻AI能捏出不存在的人臉,不論男女,不論老幼,幾乎可以亂真。

這就是地表最強的人臉生成器,英偉達的StyleGAN2。從它出生到現在,足有三個月了。如此漫長的一段日子,還趕上病毒把大量人類憋瘋在家裡,就沒人把這隻AI玩壞麼?

不可能。

至少有些沉迷於性轉的死宅,是不會放過它的。

一小撮來自俄羅斯的戰鬥少年,就把StyleGAN2的性別變幻技能,單獨釋放了出來。哈利波特娘就此誕生:

找什麼物件啊,我每天100次愛上性轉的自己

圖丨參考文獻2

於是,少年們一鼓作氣,用同樣的原理把膚色/種族以及年齡變幻大法,都從本體上分離開來:

找什麼物件啊,我每天100次愛上性轉的自己

圖丨參考文獻2

執行每一個任務的小AI,都能和當下成績最好的演算法媲美,令人感到幸福。

如何挖掘性轉技能

來自俄羅斯的網際網路公司Yandex以及莫斯科物理技術學院的三個少年,是怎麼從一個隨意生成人臉的演算法裡,把性轉這個特殊功能分離出來的?

他們用的是“蒸餾”(Distillation)技法。

蒸餾的思路,是讓StyleGAN2來當老師,它生成的影象裡包含了知識,可以拿來訓練出一個學生模型。性轉AI就是這個學生,作為一個小模型,能夠快速完成自己特定的任務。

但問題是,StyleGAN2生成的只是一張一張圖,不是一組一組男女對照的圖。但學生需要的偏偏是成對的訓練資料,該怎麼辦?

要從人臉生成器的工作方式上入手。生成器其實是依靠一種叫做“潛碼”的東西來生產影象的。潛碼是一個隨機生成的向量(有長度、有方向),只要把它輸入給生成器,便得到一張對應的圖片。所以需要探索的是,怎樣的潛碼對應了怎樣的性別。

這個問題,可以用一個辨別男女的影象分類AI輕鬆解決。每輸入一張人像,AI就會輸出一個性別。

找什麼物件啊,我每天100次愛上性轉的自己

AI除了給出分類結果,還會告訴你它的判斷有多篤定。置信分數(Confidence)在0~1之間,分數越高,表示AI越肯定一張圖是男是女。為了保證訓練資料的質量,分值太低的圖會被丟棄丨參考文獻2

當然,只判斷每一張圖的性別是不夠的。因為目標是性轉,不是把男生變成一個長相完全不同的女生。

接下來,要把所有男生放到一起、所有女生放到一起觀察。每人都是一個向量,在空間裡對應一個自己的位置。

把男生的中心和女生的中心位置算出來,得出兩個位置之間的差,依然是個向量。而這個向量的方向,就是性轉的方向了。

既有了方向,便很容易造出一組一組男女對應的圖:還是隨機生成潛碼,然後給潛碼加上這個向量,減去這個向量,加上向量的1/2,減去向量的1/2。這樣,每一張照片可以得到5張圖,再按照影象分類器的判斷,選出“最男”和“最女”(AI置信分最高)的圖片,成對的性轉資料集就是這樣做好的。

找什麼物件啊,我每天100次愛上性轉的自己

右 = 最男 & 最女丨參考文獻2

資料集裡有5萬個樣本,每個樣本包括了2張源圖(性轉前),和1張目標圖(性轉後)。拿它去訓練學生模型,成效斐然:

找什麼物件啊,我每天100次愛上性轉的自己

圖丨參考文獻2

除了性別變幻之外,膚色改和年齡改也是用同樣的原理蒸餾的,幾隻小AI的成績都媲美了當下最強的演算法。

注意,AI們的訓練資料,全部是StyleGAN2出品的合成影象,而測試內容卻是修改真實照片。AI表現優良,的確值得少年們驕傲;而這也表示,他們當初選擇信任StyleGAN2的影象生成能力,沒有選錯。

在巨人的肩膀上

可能有些同學還不太認識StyleGAN2,這裡就認真介紹一下這隻閃閃發光的AI。

從名字能看出它是隻GAN,就是生成對抗網路(Generative Adversarial Network)。

所謂對抗,指的是AI身體裡住著一位畫家(生成器),和一位鑑賞家(判別器),相愛相殺:畫家看了人類的畫作或者照片,努力生成逼真的影象,讓鑑賞家以為那就是人類的作品;鑑賞家努力不被騙,激勵畫家產出更逼真的影象。一來二去兩者都變得更強,GAN的畫作漸漸以假亂真。

StyleGAN也有這樣的雙重人格。

只是它身體裡的畫家與眾不同,是用一張圖的風格(比如色調、紋理)來改造另一張圖。

找什麼物件啊,我每天100次愛上性轉的自己

修改圖片風格的方法叫“風格遷移”,是Leon Gatys團隊的名作,能把貓片變成油畫丨Joss Whittle

StyleGAN的開發者把人像照片的風格分成了三種尺度

:在粗糙尺度上固定臉型、朝向、髮型;在中等尺度上固定髮色和五官特徵;而在精細尺度上,只是圖片的配色會有改變,人不會再變成另一個人了。

找什麼物件啊,我每天100次愛上性轉的自己

左上=粗糙尺度,左中=中等尺度,左下=精細尺度丨參考文獻3

初代StyleGAN,其實已經成為了最強的人臉生成器,甚至支援1024×1024高畫質大圖生成。可開發者們依然從演算法裡挑出了缺憾,並在二代演算法中有效填補了缺憾。

比如奇怪的“水滴”瑕疵不見了:

找什麼物件啊,我每天100次愛上性轉的自己

找什麼物件啊,我每天100次愛上性轉的自己

上=初代,下=二代丨參考文獻1

五官不同步(比如臉的朝向變了,牙齒朝向卻沒有一起變)的問題也改善了:

找什麼物件啊,我每天100次愛上性轉的自己

找什麼物件啊,我每天100次愛上性轉的自己

下=二代,牙齒和眼球能隨著臉的朝向一起轉動丨參考文獻1

另外,科學家說,三種尺度之間的配合也比從前要自然一些:

找什麼物件啊,我每天100次愛上性轉的自己

圖丨參考文獻1

於是,新的巔峰出現了。技術宅們自然要抓住調戲它的機會,這才有開頭看到的一幕。

生生不息的性轉

其實,就算沒有StyleGAN,人類拿AI做性轉的行徑也早就開始了。

2016年,一個叫FaceApp的手機應用降臨,幾乎舉世震驚。“Gender Swap”可能是它最驕傲的功能:

找什麼物件啊,我每天100次愛上性轉的自己

找什麼物件啊,我每天100次愛上性轉的自己

雷布斯娘,王健林娘丨FaceApp

與之相比,就是讓十幾歲的少年看到自己垂暮的樣子,也不會激起更熱烈的迴響了。

人類對性轉(尤其是娘化)這件事的熱忱,大概也是技術發展不可缺少的動力吧。

史蒂夫·喬布子表示同意(誤)。

找什麼物件啊,我每天100次愛上性轉的自己

圖 | Choco

參考文獻

[1] Karras, T。, Laine, S。, Aittala, M。, Hellsten, J。, Lehtinen, J。, & Aila, T。 (2019)。 Analyzing and improving the image quality of stylegan。 arXiv preprint arXiv:1912。04958。

[2] Viazovetskyi, Y。, Ivashkin, V。, & Kashin, E。 (2020)。 StyleGAN2 Distillation for Feed-forward Image Manipulation。arXiv preprint arXiv:2003。03581。

[3] Karras, T。, Laine, S。, & Aila, T。 (2019)。 A style-based generator architecture for generative adversarial networks。 InProceedings of the IEEE Conference on Computer Vision and Pattern Recognition(pp。 4401-4410)。

作者:栗子

編輯:Odette

一個AI

除了自己,你比較想看誰娘化呢?

找什麼物件啊,我每天100次愛上性轉的自己