Flux:一种与 Midjourney 相当的先进(开源)文本转图像模型

Flux:一种与 Midjourney 相当的先进(开源)文本转图像模型

Barry Lv6

新的一天,新模型!我将为您概述FLUX的功能,并解释如何在本地或使用API进行尝试。

我用Flux制作的第一张图片

介绍

Flux 是由 Black Forest Labs 开发的最新 开源 文本到图像模型的发布版本,其中包括一些 Stable Diffusion 的创作者。

它拥有令人印象深刻的 120亿 个参数,提供与 Midjourney 相当的能力(我听说过很多次;Flux 确实似乎非常相似)。

来自 schnell 版本的示例

模型变体

Flux 有三种版本,它们在许可证类型、大小和可用性上有所不同。以下是快速回顾:

  • FLUX.1 [dev]: 基础模型,采用非商业开源许可证供社区使用。
  • FLUX.1 [schnell]: 基础模型的更快、精简版本,采用 Apache 2 许可证,速度快达 10 倍。
  • FLUX.1 [pro]: 通过 API 访问的闭源版本。

关键特性

  • 图像质量提升:能够生成高分辨率、视觉上令人愉悦的图像,堪比 Midjourney。
  • 准确的人体解剖和照片真实感:提供高度真实和解剖学准确的视觉效果(这是 Stable Diffusion 3 所缺乏的)。
  • 改进的提示遵循性:根据输入描述提供更准确的输出,包括长且复杂的提示。
  • 卓越的速度:处理速度显著,特别是在 schnell 版本中,适合于要求苛刻的应用。
  • 商业用途:较小版本附带 Apache 许可证,意味着可以用于商业用途!
  • NSFW 过滤器可以移除,因此对 Flux 的审查似乎有限。

直接来自 公告

请注意,尽管有所改进,该模型仍然相当庞大,最小版本需要高达 24GB 的 RAM

所以不要指望在低 RAM 的 GPU 上运行——希望能推出一个精简和轻量的版本!

还有一点评论:虽然 dev 版本是非商业的,但 pro 版本是盈利的,我认为这是支持开发的合理方法(训练新模型是昂贵的!)。

下载和测试

模型权重可以从 Black Forest Labs on HuggingFace 下载,您可以使用 ComfyUI 在本地运行它们。

您可以从他们的 FLUX 示例 获取 ComfyUI 工作流示例。无需自定义节点,模型已原生支持。

ComfyUI 的 Flux 工作流,请注意 UNETs 节点的使用

不幸的是,我无法在本地生成任何图像,因为我的 GPU 功能不足。

如果您也处于同样的情况,可以通过他们的 API 或在 Replicate 上尝试该模型(价格:$0.003 的 _schnell_,$0.03 的 dev 和 $0.055 的 _pro_);

  • 标题: Flux:一种与 Midjourney 相当的先进(开源)文本转图像模型
  • 作者: Barry
  • 创建于 : 2024-08-02 00:53:32
  • 更新于 : 2024-08-31 06:59:45
  • 链接: https://wx.role.fun/2024/08/02/fa864aa0268646e7bfe0c18a56511075/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。
此页目录
Flux:一种与 Midjourney 相当的先进(开源)文本转图像模型