Fal 团队发布了最大的真正开源文本到图像模型——AuraFlow!支持ComfyUI中使用

模型地址:https://huggingface.co/fal/AuraFlow

官方博客:https://blog.fal.ai/auraflow/

AuraFlow v0.1 简介,对大型整流模型的开放式探索

开源 AI 正处于危险之中。在过去的一年里,随着社区对人工智能模型的兴趣激增,我们注意到新的开源基础模型的开发停止了。有些人甚至大胆地宣布开源人工智能已经死了。没那么快!

我们很高兴向您介绍我们的 AuraFlow 模型系列的第一个版本,这是最大但完全开源的基于流程的生成模型,能够生成文本到图像。AuraFlow 是对开源社区的韧性和不懈决心的重申。

Fal 团队发布了最大的真正开源文本到图像模型——AuraFlow!支持ComfyUI中使用

Auraflow 非常擅长快速跟随。提示 1:“一张穿着绿色连衣裙的美女的照片。在她旁边有三个独立的盒子。右边的盒子里装满了柠檬。中间的盒子里有两只小猫。左边的盒子里装满了粉红色的橡胶球。在背景中,有一棵盆栽室内植物,旁边是一架三角钢琴。提示 2:“一只一半是橙色虎斑猫,一半是黑色的猫,从中间分裂开来。拿着一个马提尼酒杯,里面有一团毛线。他的左眼戴着单片眼镜,戴着一顶蓝色的礼帽,新艺术风格

如果您想使用模型构建一些很酷的 Comfy 工作流程,请获取最新版本的 Comfy 并从我们的 HuggingFace 页面下载模型权重。

Simo是我们在生成媒体模型的狂野世界中最喜欢的研究人员之一。您可能从 LoRA 论文对文本到图像模型的惊人改编中认识他。几个月前,Simo 想从头开始实现 MMDiT,看看他是否能够重现它。他对 https://github.com/cloneofsimo/minRF 的最初尝试及其初步结果 Lavenderflow-v0 被证明是有希望的。很快,他发现了可以优化的各个方面,以便更有效地在更大规模上训练模型。

时机再好不过了。就在这个时候,我们确信SOTA开源模型是这个领域向前发展的方向。我们希望引入大量资源和计算来扩展模型。我们配合得很好,因此开始了合作。

AuraFlow 表明,协作、透明的 AI 开发不仅充满活力,而且蓬勃发展,随时准备应对未来 AI 领域的挑战和机遇。

Fal 团队发布了最大的真正开源文本到图像模型——AuraFlow!支持ComfyUI中使用

你的GPU转备好了吗🤯16G