腾讯混元近期针对其文生图开源模型,推出了一组「加速库」,经过实测,该加速库使生图时间缩短了75%,且生图速度提升了4倍,极大地提高了模型的运行效率。值得注意的是,这是业界首个由官方推出的加速库。 加速器的两大核心优势
这款加速器集成了两套关键技术: 知识蒸馏:通过减少扩散模型迭代的步数来实现加速。这类似于通过学习学霸的笔记,跳过一些训练步骤,直接吸收复杂模型的经验,快速掌握核心要点。应用蒸馏权重后,可以在生成同等质量图像的同时,将迭代步数减半。 TensorRT推理加速:通过工程优化,减少冗余计算,合并层次,精简精度,从而让模型更高效地处理数据。此外,它还支持与模型权重解耦,使得开发者能够在不影响模型权重的前提下,对模型进行优化和调整,以满足不同的应用需求。
提升开源模型的易用性
为了进一步提升开源模型的易用性,腾讯混元也做出了以下努力: 简化使用方式:用户现在可以通过ComfyUI的图形化界面,基于腾讯混元文生图模型进行操作。ComfyUI是一款专为文生图领域设计的WebUI界面,它通过图像化的工作流方式,大幅降低了开发者的使用门槛。
丰富生态组件:用户仅需三行代码,即可在Hugging Face的官方模型库Diffusers中调用混元DiT模型,无需下载原始代码库。
获取混元DiT模型的途径
腾讯混元文生图开源大模型(混元DiT模型)现已全面开放,您可以通过以下链接获取更多信息:
|