相比此前发布的Large版本(80亿参数)和Large Turbo版本,Medium版本采用了经过优化的模型架构,参数量降至25亿,可生成0.25至2百万像素分辨率的图像。这一改进显著降低了硬件门槛,使消费级显卡也能够运行该模型。
在授权方面,该模型对研究用途和非商业用途完全开放,同时允许年收入低于100万美元的个人或组织进行商业使用。
此次发布是Stability AI重振市场地位的重要一步。此前该公司发布的Stable Diffusion 3 Medium版本表现不及预期,导致部分用户转向FLUX等竞品。新版本在提示词准确性和图像质量方面都有显著提升,有望重新赢得社区支持。
除了开放模型权重供用户自行部署外,Stability AI还与Replicate、ComfyUI和DeepInfra等平台达成合作,为用户提供更多便捷的使用渠道。
|