技术交流归档 - 酥酥的温柔乡

发布于 24 天前

37 热度无~ 技术交流

ICLR 2026 杰出论文：LLM 在多轮对话中会迷路

摘要

跟 ChatGPT 多聊几轮、边聊边补需求，是不是常常感觉它越聊越走偏？这不是你的错觉。ICLR 2026 这篇杰出论文用 20 …

发布于 2026-05-21

27 热度无~ 技术交流

扩散模型Classifer Guidance中classifier的梯度是如何传给U-Net的？

摘要

扩散模型Classifer Guidance中classifier的梯度是如何传给U-Net的？这是一个常见的误区：Classi …

发布于 2026-03-03

166 热度无~ 技术交流

DPO可否拆分为两个阶段的SFT，一个最小化正样本loss，一个最大化负样本loss？

摘要

DPO可否拆分为两个阶段的SFT，一个最小化正样本loss，一个最大化负样本loss？一、DPO是什么？ DPO（Direct …

发布于 2026-03-03

124 热度无~ 技术交流

有哪些Classifier-Free Guidance的变式工作？

摘要

一、标准的Classifier-Free Guidance是怎么做的？（一）Classifier-Free Guidance在做 …

发布于 2026-03-03

126 热度无~ 技术交流

Vision Transformer中的Attention热力图可视化原理是什么？

摘要

Vision Transformer中的Attention热力图可视化原理是什么？一、ViT的注意力可视化在做一件什么事情？实 …

发布于 2026-03-03

144 热度无~ 技术交流

LoRA在图像生成中有哪些优秀的变式工作？

摘要

LoRA在图像生成中有哪些优秀的变式工作？一、回归定义：LoRA是什么？ LoRA（Low-Rank Adaptation）是一 …

发布于 2026-03-03

141 热度无~ 技术交流

Diffusion和Autoregressive做生成哪个上限更高？

摘要

Diffusion和Autoregressive做生成哪个上限更高？先说结论：没有绝对的上限最高，这里都要结合具体的语境来进行讨 …

发布于 2026-03-02

67 热度无~ 技术交流

Training-free的多模态大模型研究方向目前有哪些比较适合学生？

摘要

Training-free的多模态大模型研究方向目前有哪些比较适合学生？一、前言开始之前，说说自己对training-f …

发布于 2026-03-02

120 热度无~ 技术交流

如何看待「多模态大模型的幻觉缓解」这一方向？

摘要

如何看待「多模态大模型的幻觉缓解」这一方向？一、MLLM Hallucination在做一件什么事情？ Hallucinatio …

发布于 2026-02-21

101 热度无~ 技术交流

扩散模型预测噪声、x0、velocity的不同训练目标之间有什么区别和侧重？

摘要

扩散模型预测噪声、x0、velocity的不同训练目标之间有什么区别和侧重？一、Diffusers中的代码实现是怎样的？在Di …

梦回温柔乡

ICLR 2026 杰出论文：LLM 在多轮对话中会迷路

扩散模型Classifer Guidance中classifier的梯度是如何传给U-Net的？

DPO可否拆分为两个阶段的SFT，一个最小化正样本loss，一个最大化负样本loss？

有哪些Classifier-Free Guidance的变式工作？

Vision Transformer中的Attention热力图可视化原理是什么？

LoRA在图像生成中有哪些优秀的变式工作？

Diffusion和Autoregressive做生成哪个上限更高？

Training-free的多模态大模型研究方向目前有哪些比较适合学生？

如何看待「多模态大模型的幻觉缓解」这一方向？

扩散模型预测噪声、x0、velocity的不同训练目标之间有什么区别和侧重？