发布于 7 天前
摘要
一、标准的Classifier-Free Guidance是怎么做的? (一)Classifier-Free Guidance在做 …
一、标准的Classifier-Free Guidance是怎么做的? (一)Classifier-Free Guidance在做 …
LoRA在图像生成中有哪些优秀的变式工作? 一、回归定义:LoRA是什么? LoRA(Low-Rank Adaptation)是一 …
Diffusion和Autoregressive做生成哪个上限更高? 先说结论:没有绝对的上限最高,这里都要结合具体的语境来进行讨 …
扩散模型预测噪声、x0、velocity的不同训练目标之间有什么区别和侧重? 一、Diffusers中的代码实现是怎样的? 在Di …
论文标题:Exploring Diffusion Transformer Designs via Grafting 论文地址:ht …
这个方法可以提升所有流匹配模型的生成质量,比如文生图模型 SD3, FLUX.1,以及视频生成模型 WAN-2.1。以下是 SD3 …
Bring your imagination to life with text,image,or video. Feature …
块离散去噪扩散语言模型(BD3-LMs)结合自回归模型和扩散模型的优势,解决了现有扩散模型生成长度受限、推理效率低和生成质 …
EmoEdit 由深圳大学可视计算研究中心黄惠教授课题组完成,第一作者为杨景媛助理教授。深圳大学可视计算研究中心(VCC)以计算机 …
大语言模型(LLM)社区近期的一大热点研究课题是推理时扩展 (Inference-time scaling),这一热点也逐渐传播到 …