AI画图，脸又崩了？别怕！新神器FLUX.1来了，8倍速把GPT甩八条街，SOTA记录刷到爆！

老铁们，咱用AI画图、P图的时候，是不是经常遇到这种抓狂的情况：想整个故事连环画，或者给一个角色换换场景、改改动作，结果好家伙，那主角的脸，变起来比川剧变脸还快，上一秒是吴彦祖，下一秒就成了苏大强（没说苏老师不好的意思啊），这谁受得了啊？眼瞅着一套大片就要成了“换头怪”集锦，简直让人想砸键盘！

别慌，别慌！今天就给大家介绍一款新鲜出炉的“AI画图界新晋卷王”——FLUX.1 Kontext！这家伙，简直就是来专治各种“AI脸盲症”和“角色串台”的！官方都说了，它不仅能让你的AI角色“从一而终”，速度更是快到飞起，直接把GPT家的图像模型（比如GPT-Image-1）甩开八条街，在多个方面把行业最佳纪录（SOTA）又往上拔了一大截！

这FLUX.1 Kontext到底是何方神圣？

简单说，FLUX.1 Kontext是一个能同时处理“看图说话”和“听话作图”的新一代AI模型。它牛就牛在，能一边听你说话（文本指令），一边看你给的参考图（图像提示），然后刷刷刷给你生成新的、风格统一的图片。主角换场景不换脸，服装道具细节也给你拿捏得死死的。

想象一下这个场景：

你给AI一张美美的生活照 (a)。
说：“把挡着脸的墨镜去了！” (b) —— 咔嚓，墨镜没了，脸还是那张脸。
再说：“把人挪到德国弗赖堡（一个漂亮小镇）去！” (c) —— 嗖，背景换了，人没变。
最后：“整点气氛，下场雪！” (d) —— 哗，雪花飘飘，意境拉满，主角的样貌、姿势、衣服，甚至照片的整体感觉，都保持高度一致！

这操作，行云流水，简直不要太丝滑！

FLUX.1 Kontext有啥独门绝技？

“全能选手”：不管是P掉图上某个东西（局部编辑），还是根据一张参考图生成全新场景（上下文生成），它一个模型全搞定！
“脸盲终结者”：保持角色一致性是它的拿手好戏。就算你来回折腾好几轮，主角也不会轻易“走丢”。妈妈再也不用担心我的AI角色“串脸”了！
“快如闪电”：不管是从文字生成图片，还是图片到图片的转换，一张1024x1024的高清大图，官方说也就3到5秒！这速度，比老大哥GPT-Image-1快了整整8倍！以前P个图，喝杯咖啡回来可能还在转圈圈，现在？眨眨眼的功夫，图就出来了！
“迭代大师”：因为快，而且效果稳定，你可以放心地对一张图进行连续多次编辑，基本不会出现“改着改着就不是那味儿了”的尴尬。

听着挺玄乎，它是怎么做到的？（技术宅请进，小白可略过）

这FLUX.1 Kontext属于一种叫做“校正型流变换器”（rectified flow transformer）的狠角色，它是在图像自编码器的“潜空间”里修炼内功的。研发团队给它设计了一套聪明的“双流”（double stream）和“单流”（single stream）模块混合结构。

“双流”模块：图像和文字信息，先在各自的“专用通道”里跑，然后通过一种叫“注意力机制”的“立交桥”进行信息融合。
“单流”模块：融合之后，文字信息“功成身退”，只留下图像信息，在38个“单行道”模块里继续精雕细琢。
位置编码也讲究：为了让模型知道图片里哪个部分是哪个部分，它用了一种叫“因式分解三维旋转位置编码（3D RoPE）”的技术，给每个小块都编上号。

说白了，就是想让模型学会：你给我一段文字（指令c），再给我一张参考图（图像y），我就能给你画出一张新的、符合你要求的图（图像x）。如果没给参考图（y=∅），那它也能像普通AI一样，根据文字从零开始画。

更牛的是，为了让出图又快又好，它还用上了一种叫“对抗式扩散蒸馏采样”的技术。这就像给模型请了个“魔鬼教练”，通过对抗训练，不仅图片质量蹭蹭涨，出图速度也大大提升，减少了来回计算的步骤。

是骡子是马，拉出来遛遛！—— 真实世界的考验

为了证明自己不是吹牛，FLUX.1团队还特地搞了个“武林大会”——KontextBench。这可不是随便拿几张网图糊弄事儿，里面全是真实用户在实际P图时遇到的老大难问题，一共1026个图像和指令的组合，源自108张不同类型的原始图（生活照、艺术品、AI生成图都有），涵盖了局部修改、整体风格调整、P字、换风格、保角色等五大“魔鬼级”考验。

结果怎么样？

速度上：FLUX.1 Kontext确实快，无论文生图还是图生图，都很有竞争力。
效果上：

FLUX.1 Kontext还能玩出什么花？

除了常规操作，它还有些“独门秘技”：

风格迁移（S-Ref）：想把梵高的《星空》风格用到你的风景照上？没问题！它能提取参考图的艺术风格，生成一张内容是你想要的、风格是参考图的新画作。

“指哪打哪”：你可以在图上画个红圈圈或者其他标记，告诉模型：“嘿，就改这个地方！”它就能心领神会。
文字编辑大师：图片里的文字写错了？想换个字体？FLUX.1 Kontext都能帮你调整，而且周围的图像内容还不会乱。

看上面这张产品图效果：(a) 是原始的穿搭照，(b) 模型把裙子单独抠出来，换上白色背景，搞出专业产品图的感觉，(c) 还能给你个裙子面料的特写，纹理细节都清清楚楚。

总结一下，这FLUX.1 Kontext牛在哪？

一个顶俩：一个模型，多种图像任务通吃。
脸不崩了：P来P去，角色还是那个角色。
快就一个字：交互速度快，灵感不等待。
有据可查：发布了KontextBench这个真实的“考场”，让大家评判。

虽然研发团队也坦言，FLUX.1 Kontext在连续P太多次图后，也可能出现点小瑕疵（毕竟，再牛的P图大师也有手抖的时候嘛！），但总的来说，它在解决“角色脸崩”、P图慢、效果差这些老大难问题上，迈出了一大步！

这FLUX.1 Kontext和KontextBench的发布，无疑是给AI图像生成和编辑领域打了一针强心剂，以后咱们想用AI搞点故事创作、产品展示、个性化表情包啥的，可就方便多啦！期待这个“P图神器”能越来越强，给咱们带来更多惊喜！

FLUX

精选评论

评论加载中…