文章来源:AI先锋官
近日,AI绘画圈迎来了新的王者:
黑森林工作室(BlackForestLabs)发布了最新的FLUX1.1 pro模型
不说废话,先说结论:
速度飙升:比之前的 FLUX.1 pro]快6倍,比FLUX.1 schnell 快了两倍。
霸榜基准测试榜单:FLUX1.1 pro,代号“蓝莓”,在人工分析图像领域取得了最高的Elo评分
性能增强:图像质量更好,提示词遵循得更好。
支持高分辨率:FLUX1.1 pro原生支持快速生成高达2K的超高分辨率。
不过是骡子还是马,测一测才知道!
依旧是是我们的三位老选手:Mijourney、Flux1.1、Ideogram2.0
测试内容:“文字渲染能力”,“语言义理解能力”,“人物写实”三大板块。
文字渲染能力:
提示词:一张动画海报草稿,展示了一群人在水中赛龙舟,划桨喷洒,中国传统山水风格,浅绿色,超高清。海报标题:“端午节快乐”,海报底部剧情简介:“端午节是为了纪念屈原”
Midjourney:
Ideogram2.0:
Flux1.1:
从这三张图片可以看出,Flux1.1遗传了Flux1.0的陋习,在文字渲染方面简直惨不忍睹。同为难兄难弟的Midjourney效果和Flux1.1一样的惨不忍睹。。。。
Ideogram2.0在文字渲染方面依旧处于遥遥领先的地位,一骑绝尘。
最后还是忍不住想要吐槽一番:Ideogram2.0生成出来的图片风格怎么大多是日本风格。。。
语言义理解能力
提示词:一个穿着白色连衣裙的小女孩站在窗户前,手里拿着一杯牛奶,正面照,戴着一顶红色的棒球帽,一只黑白相间的猫躺在小女孩的头上,窗户上有一个白虎图案。
Midjourney:
Ideogram2.0:
Flux1.1:
Midjourney依旧是老毛病,随着提示词中元素的增多,会将提示词中的内容弄混淆,这不“黑白相间的小猫咪猫咪变成了一头黑白相间的老虎”
不过这次Flux1.1和Ideogram2.0在语义理解方面效果一致,都完美的还原了提示词中的所表达的元素。
那这不得再加赛一场!!!
提示词:男生穿着印有蜘蛛侠照片的白色卫衣坐在桌子上,手拿一支笔,有一个水杯放到桌子上。一个长头发的女孩拿着一本书,戴着黄色帽子从男生背后走过,帽子上有“开心”的单词。一只小猫趴在桌子上。
Ideogram2.0:
Flux1.1:
哦豁!从对语义的理解上,貌似Flux1.1的效果要更加出色,Ideogram2.0并没有生成出趴在桌子上喵咪这个元素。
人物写实
提示词:一位中国男性股票投资者,神情专注地坐在电脑前查看股市数据。穿着商务衬衫,戴着眼镜,在办公室环境中,由上方明亮的人造光照亮,采用三分构图原则,背景为清晰的电脑屏幕和图表,侧视图,长焦镜头,写实风格,酷蓝灰色配色,屏幕上的细节表达和数据。
Midjourney:
Ideogram2.0:
Flux1.1:
从结果来看,在写实方面,Midjourney这位老大哥要更胜一筹,表情、神色都表现的更加自然。
总的来说,从测评结果我们可以看到,Flux1.1的综合能力并没有像官网发出的数据报告那么强。
相反,依旧存在这不少短板,不过此次的语义理解能力的确是大幅度增强了不少。同样也有不少其他的亮点。
说个题外话。未来AI绘画领域还会有其他的黑马出现吗?
从Ideogram2.0的问世,再到Flux1.0,似乎都在慢慢动摇着Midjourney的霸主地位。