幾天不見(jiàn),大模型又有新玩法了。世超最近發(fā)現(xiàn)了兩個(gè)在 P 圖界超強(qiáng)的文生圖模型:FLUX 和即夢(mèng) 3.0。
它們各有各的優(yōu)勢(shì),F(xiàn)LUX 在生成一致性方面沒(méi)有敵手,而即夢(mèng)在中文修圖方面理解更佳。
這么說(shuō)吧,如果上一次 4o 的出現(xiàn)讓設(shè)計(jì)師失業(yè),這回它們就要讓 P 圖師失業(yè)了。
下面世超就帶大家伙兒看看,這兩個(gè)模型具體有啥區(qū)別,方便差友后續(xù)挑選使用。
咱先說(shuō)說(shuō)啥叫生成的一致性?簡(jiǎn)單來(lái)講,就是你給模型一張圖和提示詞,讓它改東,它就不能改西。改的風(fēng)格還得和原圖一樣,不能帶AI味。
比如這會(huì)兒世超想魔改一下公司的燈牌,把 “差評(píng)” 改成 “X.PIN”。我們分別用 FLUX、GPT-4o 和即夢(mèng)對(duì)燈牌進(jìn)行修改,它們給出的結(jié)果是這樣的:
1 原圖,2 FLUX,3 GPT-4o,4 即夢(mèng)
GPT-4o 改的這張圖吧,單獨(dú)看只是有點(diǎn)平面,但和其它模型放一起對(duì)比就很慘烈了。很明顯,對(duì)于燈牌的顏色、支架、墻面材質(zhì)和窗戶(hù)的樣式,4o 有它自己的主見(jiàn)。
即夢(mèng)夾在中間,屬于單看不錯(cuò),和 FLUX 相比還有差距的程度。窗戶(hù)稍微魔改了一點(diǎn),外墻材質(zhì)也變光滑了。
只有 FLUX,不該動(dòng)的一筆沒(méi)動(dòng),該細(xì)節(jié)的地方,連燈牌支架在 X 的哪個(gè)位置都安排的明明白白,前后一致性、對(duì)物理世界的理解都強(qiáng)的可怕。
而且 FLUX 可能因?yàn)橛脩?hù)不多,速度超快。基本半分鐘使命必達(dá),體驗(yàn)極佳。
FLUX 生成過(guò)程
既然 FLUX 改圖這么好用,我有一個(gè)大膽的想法。。。
我宣布,秦始皇來(lái)了,這也是原圖。
出去旅游總是人山人海景色不好?不如來(lái)試試真 · 一鍵消除功能。
雖然人在的時(shí)候都沒(méi)看見(jiàn)這樣的景,至少回家以后能擁有一張發(fā)朋友圈的好片。
“我要讓所有人知道,今天的長(zhǎng)城,被我承包了。”
有一說(shuō)一,下面這兩張圖,放在找茬游戲里也只能有一處不同。
世超把整的活兒發(fā)到群里,立刻向大家伙兒成功安利了 FLUX。于是有了下面的群友返圖:
上面是原圖,下面是 FLUX(手動(dòng)狗頭)
本著財(cái)不外露的原則,很少有差友知道我們的真正實(shí)力。沒(méi)錯(cuò),這就是差評(píng)在海外的。。。
其實(shí)在進(jìn)行圖片編輯時(shí),世超測(cè)試過(guò)的絕大部分模型,都對(duì)提示詞存在理解偏差,能按照指示把分內(nèi)事做好就不錯(cuò)了,對(duì)不該改的地方瞎發(fā)揮一通那是很常見(jiàn)的。
而 FLUX 就是能根據(jù)提示詞精準(zhǔn)定位到需要修改的位置,其它地方一點(diǎn)不動(dòng),非常神奇。
看眼睛,有彩蛋。
但是別看 FLUX 一致性做得好,一到需要中文創(chuàng)作的環(huán)境,它直接原地宕機(jī)。
讓 FLUX 把 “差評(píng)” 改成 “好評(píng)”
所以做中文修圖,魔改設(shè)計(jì)的活兒,還是得即夢(mèng)來(lái)。
比如世超想做個(gè)表情包,這要求大模型不但要對(duì)圖片內(nèi)容理解到位,還要懂中文語(yǔ)境,才可能 P 對(duì) P 好。
不知道最近某位蔡姓頂流的新歌各位差友聽(tīng)沒(méi)聽(tīng),為表這么多年做小黑子的歉意,世超直接掏出編輯部特供表情包,原地爆改坤坤粉絲包。
左上原圖,右上即夢(mèng),下 FLUX
可以看到,即夢(mèng)不僅編輯前后字體保持一致,還在背景上補(bǔ)充了很多小星星和小心心。放到別的場(chǎng)景下這屬于一致性缺點(diǎn),但在這里,世超覺(jué)得即夢(mèng)改得很有情緒。
反觀 FLUX,在中文理解上做的簡(jiǎn)直是一坨,原圖裁一下就返回來(lái)了,一點(diǎn)沒(méi)動(dòng)。
另外,有的老差友可能知道,差評(píng)最近迎來(lái)十周年啦。世超立刻用即夢(mèng)生成了一組十周年表情包,平均每張圖耗時(shí)一分鐘,再也不用先摳后 P 了。
而在這種創(chuàng)造性的活兒上,肯定少不了一些藝術(shù)加工,這時(shí)候一致性就沒(méi)那么重要了。前后圖片不一樣沒(méi)關(guān)系,如果貓貓眼睛變圓變亮可以更好地傳遞情緒的話(huà),這屬于優(yōu)點(diǎn)。
再看看下面這一組 slogan 設(shè)計(jì),不得不說(shuō),即夢(mèng) AI 的審美實(shí)屬超前。
總的來(lái)講,在修圖方面,這些大模型確實(shí)干得又快又好。不過(guò)好工具得用在對(duì)的場(chǎng)景,才能發(fā)揮出最強(qiáng)實(shí)力。
在這里世超建議大家,P 圖拯救旅游廢片找 FLUX,中文表情包制作和字體修改設(shè)計(jì)找即夢(mèng)。
比較過(guò) FLUX 和即夢(mèng),世超覺(jué)得現(xiàn)階段的文生圖還是不能既要又要。FLUX 和即夢(mèng)在一致性和創(chuàng)造力之間,很難兼得。和語(yǔ)言大模型類(lèi)似,來(lái)點(diǎn)幻覺(jué)才有創(chuàng)造力,發(fā)揮卻會(huì)變得不穩(wěn)定。
目前,Black Forest Labs 開(kāi)源了一部分 FLUX.1 版本,但最新最好用的 FLUX.1 Context [pro] 還是收費(fèi)的,即夢(mèng)則是閉源。
好消息是,現(xiàn)在 FLUX 官網(wǎng)新用戶(hù)注冊(cè)就送 200 積分。每生成或者編輯一張圖片消耗 4 點(diǎn)積分,填充或者擴(kuò)展圖片一張消耗 5 點(diǎn),200 分還是夠咱玩一陣的。
即夢(mèng)每天都送 60 積分,每次生成圖片消耗 1 積分,編輯圖片 2 積分。
感興趣的差友可以去白嫖一下,試完了別忘回評(píng)論區(qū)返圖哦。
撰文:莫莫莫甜甜
編輯:江江 & 面線(xiàn)
美編:萱萱
圖片、資料來(lái)源:
莫莫實(shí)測(cè)
https://playground.bfl.ai/image/generate
https://jimeng.jianying.com/ai-tool/home
https://github.com/black-forest-labs/flux
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.