什么是Latent Consistency Models?在最新的AI模型和研究领域,一种名为Latent Consistency Models(LCMs)的新技术正迅速推动文本到图像人工智能的发展。与传统的Latent Diffusion Models(LDMs)相比,LCMs在生成详细且富有创意的图像方面同样出色,但仅需1-4步骤,而不是数百步骤。这一创新正在为文本到图像AI迈向重要的飞跃,LCMs的突破在于极大地减少了生成图像所需的步骤。相比于LDMs数百步骤的费时生成,LCMs在仅需1-4步骤的情况下达到了相似的质量水平。这一高效性是通过将预训练的LDMs精炼成更加简化的形式实现的,从而大大降低了计算资源和时间的需求。
(摘自https://latent-consistency-models.github.io)
搭建平台简介
本次搭建OpenVINO™平台使用到的算力魔方®是一款可以DIY的迷你主机!它采用了抽屉式设计,后续组装、升级、维护只需要拔插模块。通过选择计算模块的版本,再搭配不同的IO模块就可以组成丰富的配置,适应不同场景。性能不够时,可以升级计算模块提升算力,IO接口不匹配时,可以更换IO模块调整功能,而无需重构整个系统。
加速成绩
基于OpenVINO在算力魔方®上实现Latent Consistency Models模型的推理加速,获得了最快单次12秒出图的良好成绩(不含模型初始化的性能)。
在文本到图像生成过程中:CPU占用76%,内存占用14.5GB。
接下来,让我们通过NNCF将量化层添加到模型图中,然后使用训练数据集的子集来初始化这些附加量化层的参数来实现训练后量化。量化运算会在INT8中执行而非FP32/FP16 中执行,使模型推理速度更快。
(量化模型首次加载中)
(加载完成点击URL链接进行文生图量化速度对比)
在未量化前进行文生图,单次图片生成时间需要42秒。
而在量化后进行文生图,单次图片只需要生成时间13秒。
在使用了INT8的量化模型后,未量化前42秒和量化后13秒的出图速度,量化模型让图片生成速度提升了30%!
测试代码如下所示,方便大家在算力魔方上复现:https://github.com/openvinotoolkit/openvino_notebooks/tree/main/notebooks/263-latent-consistency-models-image-generation
总结
“好船配好帆,好马配好鞍。”随着人工智能(AI)的发展日益迅猛,对硬件设备的要求也越来越高,硬件作为支撑其运行和实现的基础,在拉高算力,内存,显卡,存储等各方面要求的同时,最好还能兼备组合配置、便于升级、多场景切换应用等更具性价比的能力。这也促进了硬件设备的创新和发展,为AI技术的大规模普及和应用提供了更加坚实的基础。
算力魔方AIPC提供企业级与工业级温度支持,多种不同的配置可选,实现丰富的算力组合,同时提供整机的贴牌与模块定制服务。实现多种行业和场景解决方案!
网友评论