首页 Metaverse 只有20亿参数,Stability AI发布最新的文生图模型Stable Diffusion 3 Medium
只有20亿参数,Stability AI发布最新的文生图模型Stable Diffusion 3 Medium

只有20亿参数,Stability AI发布最新的文生图模型Stable Diffusion 3 Medium

  近日,据海外媒体报道,生成式人工智能创业公司Stability AI发布了全新的文本转图片(text-to-image)的开源AI模型Stable Diffusion 3 Medium。

  新的Stable Diffusion 3 Medium模型旨在成为一个更小,但能力非常突出的模型,可以在消费级GPU上运行。这一能力能够使那些资源受限的用户和组织是一种更有吸引力的选择,而他们也希望运行一个功能强大的图像生成AI技术。

  目前,Stable Diffusion 3 Medium模型可以通过API试用,以及通过Discord在Stable Artisan上试用。也可以在Hugging Face上用于非商业用途。

  据Stability AI的联席首席执行官Christian Laforte表示,Stable Diffusion 3 (SD3) Large有80亿的参数,而Stable Diffusion 3 Medium模型则只有20亿参数。后者可以在5GB的GPU VRAM上进行运行,在这个级别上,新模型可以在各种消费级个人电脑和高端笔记本电脑上运行。而之前的许多生成式人工智能模型则长期以来英伟达功能更加强大的GPU。

  Christian Laforte补充道,在能力上,Stable Diffusion 3 Medium模型在所有功能上都表现出色,并且可以与的Stable Diffusion 3 (SD3) Large相媲美。在快速依从性方面,Stable Diffusion 3 Medium模型能够在很大程度上快速理解自然语言。这包括对元素的空间理解,例如图像中元素的定位。另外,较小的模型也更易于微调,该模型具有不错的适应性,可以有效地从微调数据集中捕获细节。

延伸阅读:

Powered by Froala Editor