扩散模型归档 - 酥酥的温柔乡

发布于 7 天前

19 热度无~ 技术交流

有哪些Classifier-Free Guidance的变式工作？

摘要

一、标准的Classifier-Free Guidance是怎么做的？（一）Classifier-Free Guidance在做 …

发布于 7 天前

20 热度无~ 技术交流

LoRA在图像生成中有哪些优秀的变式工作？

摘要

LoRA在图像生成中有哪些优秀的变式工作？一、回归定义：LoRA是什么？ LoRA（Low-Rank Adaptation）是一 …

发布于 7 天前

14 热度无~ 技术交流

Diffusion和Autoregressive做生成哪个上限更高？

摘要

Diffusion和Autoregressive做生成哪个上限更高？先说结论：没有绝对的上限最高，这里都要结合具体的语境来进行讨 …

发布于 16 天前

34 热度无~ 技术交流

扩散模型预测噪声、x0、velocity的不同训练目标之间有什么区别和侧重？

摘要

扩散模型预测噪声、x0、velocity的不同训练目标之间有什么区别和侧重？一、Diffusers中的代码实现是怎样的？在Di …

发布于 2026-01-13

85 热度无~ 技术交流

NeurIPS 2025 oral：DiT魔改指南

摘要

论文标题：Exploring Diffusion Transformer Designs via Grafting 论文地址：ht …

发布于 2025-05-01

318 热度无~ 技术交流

CFG-Zero*：流匹配时代的新版 Classifier-Free Guidance

摘要

这个方法可以提升所有流匹配模型的生成质量，比如文生图模型 SD3, FLUX.1，以及视频生成模型 WAN-2.1。以下是 SD3 …

发布于 2025-04-22

241 热度无~ 技术交流

Sora is here

摘要

Bring your imagination to life with text,image,or video. Feature …

发布于 2025-04-19

219 热度无~ 技术交流

论文精读Block Diffusion:Interpolating Between Autoregressive and Diffusion Language Models

摘要

块离散去噪扩散语言模型（BD3-LMs）结合自回归模型和扩散模型的优势，解决了现有扩散模型生成长度受限、推理效率低和生成质 …

发布于 2025-03-31

222 热度无~ 技术交流

EmoEdit:Evoking Emotions through Image Manipulation

摘要

EmoEdit 由深圳大学可视计算研究中心黄惠教授课题组完成，第一作者为杨景媛助理教授。深圳大学可视计算研究中心（VCC）以计算机 …

发布于 2025-02-24

209 热度无~ 技术交流

扩散模型的推理时优化：分享近期几篇噪声搜索类论文

摘要

大语言模型（LLM）社区近期的一大热点研究课题是推理时扩展 (Inference-time scaling)，这一热点也逐渐传播到 …

梦回温柔乡

有哪些Classifier-Free Guidance的变式工作？

LoRA在图像生成中有哪些优秀的变式工作？

Diffusion和Autoregressive做生成哪个上限更高？

扩散模型预测噪声、x0、velocity的不同训练目标之间有什么区别和侧重？

NeurIPS 2025 oral：DiT魔改指南

CFG-Zero*：流匹配时代的新版 Classifier-Free Guidance

Sora is here

论文精读Block Diffusion:Interpolating Between Autoregressive and Diffusion Language Models

EmoEdit:Evoking Emotions through Image Manipulation

扩散模型的推理时优化：分享近期几篇噪声搜索类论文