技术交流归档 - 酥酥的温柔乡

发布于 6 天前

18 热度无~ 技术交流

DPO可否拆分为两个阶段的SFT，一个最小化正样本loss，一个最大化负样本loss？

摘要

DPO可否拆分为两个阶段的SFT，一个最小化正样本loss，一个最大化负样本loss？一、DPO是什么？ DPO（Direct …

发布于 7 天前

19 热度无~ 技术交流

有哪些Classifier-Free Guidance的变式工作？

摘要

一、标准的Classifier-Free Guidance是怎么做的？（一）Classifier-Free Guidance在做 …

发布于 7 天前

19 热度无~ 技术交流

Vision Transformer中的Attention热力图可视化原理是什么？

摘要

Vision Transformer中的Attention热力图可视化原理是什么？一、ViT的注意力可视化在做一件什么事情？实 …

发布于 7 天前

20 热度无~ 技术交流

LoRA在图像生成中有哪些优秀的变式工作？

摘要

LoRA在图像生成中有哪些优秀的变式工作？一、回归定义：LoRA是什么？ LoRA（Low-Rank Adaptation）是一 …

发布于 7 天前

14 热度无~ 技术交流

Diffusion和Autoregressive做生成哪个上限更高？

摘要

Diffusion和Autoregressive做生成哪个上限更高？先说结论：没有绝对的上限最高，这里都要结合具体的语境来进行讨 …

发布于 7 天前

13 热度无~ 技术交流

Training-free的多模态大模型研究方向目前有哪些比较适合学生？

摘要

Training-free的多模态大模型研究方向目前有哪些比较适合学生？一、前言开始之前，说说自己对training-f …

发布于 8 天前

15 热度无~ 技术交流

如何看待「多模态大模型的幻觉缓解」这一方向？

摘要

如何看待「多模态大模型的幻觉缓解」这一方向？一、MLLM Hallucination在做一件什么事情？ Hallucinatio …

发布于 16 天前

34 热度无~ 技术交流

扩散模型预测噪声、x0、velocity的不同训练目标之间有什么区别和侧重？

摘要

扩散模型预测噪声、x0、velocity的不同训练目标之间有什么区别和侧重？一、Diffusers中的代码实现是怎样的？在Di …

发布于 2026-01-13

85 热度无~ 技术交流

NeurIPS 2025 oral：DiT魔改指南

摘要

论文标题：Exploring Diffusion Transformer Designs via Grafting 论文地址：ht …

发布于 2026-01-13

100 热度无~ 技术交流

预训练数据太差怎么办？Bengio团队引入显式贝叶斯，无梯度实现In-Context RL

摘要

在 In-Context RL 的研究热潮中，往往存在一种惯性思维，认为只要把 Transformer 做大，把上下文窗口拉长，模 …

梦回温柔乡

DPO可否拆分为两个阶段的SFT，一个最小化正样本loss，一个最大化负样本loss？

有哪些Classifier-Free Guidance的变式工作？

Vision Transformer中的Attention热力图可视化原理是什么？

LoRA在图像生成中有哪些优秀的变式工作？

Diffusion和Autoregressive做生成哪个上限更高？

Training-free的多模态大模型研究方向目前有哪些比较适合学生？

如何看待「多模态大模型的幻觉缓解」这一方向？

扩散模型预测噪声、x0、velocity的不同训练目标之间有什么区别和侧重？

NeurIPS 2025 oral：DiT魔改指南

预训练数据太差怎么办？Bengio团队引入显式贝叶斯，无梯度实现In-Context RL