目前最火、最知名的 AI 文生图「Stable Diffusion」其中的一位开发者独立创业新公司 Black Forest Lab 黑森林实验室,开发了一款新的文生图模型项目「FLUX.1」并且支持中文输入,拥有超强的语言理解和文本控制能力,共 3 款图片生成模型,其中有 2 个开源。
- FLUX.1 [pro]:闭源版本,只能通过API调用。
- FLUX.1 [dev]:开发板模型,以非商业许可的方式开源,适合开发者,个人玩家。
- FLUX.1 [schnell]:基础模型的精简版本,运行速度快,采用 Apache 2 许可证,可以商用。
模型对比
用 Midjourney 最新的 v6.1 模型与 FLUX.1 Pro 进行了出图对比。虽然 FLUX.1 在艺术性和风格多样性上不及 Midjourney 丰富,但在清晰度、细节逼真度,复杂场景生成等方面与最新的 v6.1 模型不相上下,甚至在一些方面的表现超过了 v6.1。对比来源:优设 @夏花生。
尤其是在复杂英文文本生成、多人场景、提示词理解遵循等方面,FLUX.1 Pro 的表现会明显比 v6.1 好。Pro 可以准确处理多人场景,面部、手部细节不会扭曲崩坏;生成超长文本的时候,无论是内容还是排版都非常标准到位;还能有效防止提示词泄露的情况发生,准确生成画面内容。
一键整合包
一键整合包「FLUX.1」的 WebUI 就是基于 Stable Difussion WebUI forge,模型是 nf4 量化版轻量模型,nf4 比 nf8 在更小的体积下,实现了比 nf8 更好的生成效果,实测 6G 显存可玩,20 步出图大概在 30 秒左右。
下载好后解压出来,然后运行"启动webui.bat",等待自动跳转到 webui 界面,然后 Checkpoint 选择 FLUX.1 的 nf4 模型。
在线体验
如果你的电脑配置跑不动「FLUX.1」模型,也可以通过在线的方式来体验文生图,提供了三个版本 pro、dev、schnell,你可以输入文本内容、设置图像比例来生成图片。
下载地址
- 在线体验:
https://replicate.com/black-forest-labs - 整合包(夸克):
https://pan.quark.cn/s/dfb87e83d459 - 整合包(度盘):
https://pan.baidu.com/s/1yObLpTp8iXA7xaXYiHCxkw?pwd=yfhm - 官方网站:
https://blackforestlabs.ai