只有20亿参数，Stability AI发布最新的文生图模型Stable Diffusion 3 Medium-Metaverse-映魅咨询-imconsultancy

只有20亿参数，Stability AI发布最新的文生图模型Stable Diffusion 3 Medium

　　近日，据海外媒体报道，生成式人工智能创业公司Stability AI发布了全新的文本转图片（text-to-image）的开源AI模型Stable Diffusion 3 Medium。

　　新的Stable Diffusion 3 Medium模型旨在成为一个更小，但能力非常突出的模型，可以在消费级GPU上运行。这一能力能够使那些资源受限的用户和组织是一种更有吸引力的选择，而他们也希望运行一个功能强大的图像生成AI技术。

　　目前，Stable Diffusion 3 Medium模型可以通过API试用，以及通过Discord在Stable Artisan上试用。也可以在Hugging Face上用于非商业用途。

　　据Stability AI的联席首席执行官Christian Laforte表示，Stable Diffusion 3 (SD3) Large有80亿的参数，而Stable Diffusion 3 Medium模型则只有20亿参数。后者可以在5GB的GPU VRAM上进行运行，在这个级别上，新模型可以在各种消费级个人电脑和高端笔记本电脑上运行。而之前的许多生成式人工智能模型则长期以来英伟达功能更加强大的GPU。

　　Christian Laforte补充道，在能力上，Stable Diffusion 3 Medium模型在所有功能上都表现出色，并且可以与的Stable Diffusion 3 (SD3) Large相媲美。在快速依从性方面，Stable Diffusion 3 Medium模型能够在很大程度上快速理解自然语言。这包括对元素的空间理解，例如图像中元素的定位。另外，较小的模型也更易于微调，该模型具有不错的适应性，可以有效地从微调数据集中捕获细节。

延伸阅读：

只有20亿参数，Stability AI发布最新的文生图模型Stable Diffusion 3 Medium

Google Gemini推出个人健康场景大语言模型PH-LLM，在某些能力已超过人类专家

法国人工智能初创公司Mistral AI融资6亿欧元，英伟达、三星和Salesforce等多家机构参与投资

只有20亿参数，Stability AI发布最新的文生图模型Stable Diffusion 3 Medium

Google Gemini推出个人健康场景大语言模型PH-LLM，在某些能力已超过人类专家

法国人工智能初创公司Mistral AI融资6亿欧元，英伟达、三星和Salesforce等多家机构参与投资

相关推荐

与量子计算公司Multiverse Computing合作，博世将在西班牙打造“数字孪生”智能工厂

英伟达分享在元宇宙领域的最新技术进展，并推出新的3D内容开发工具包

以色列数字孪生及计算机视觉公司Resonai融资2000万美元，提供数字化的建筑空间资产解决方案