发布于 24 天前
摘要
跟 ChatGPT 多聊几轮、边聊边补需求,是不是常常感觉它越聊越走偏?这不是你的错觉。ICLR 2026 这篇杰出论文用 20 …
计算机相关技术分享
跟 ChatGPT 多聊几轮、边聊边补需求,是不是常常感觉它越聊越走偏?这不是你的错觉。ICLR 2026 这篇杰出论文用 20 …
扩散模型Classifer Guidance中classifier的梯度是如何传给U-Net的? 这是一个常见的误区:Classi …
DPO可否拆分为两个阶段的SFT,一个最小化正样本loss,一个最大化负样本loss? 一、DPO是什么? DPO(Direct …
一、标准的Classifier-Free Guidance是怎么做的? (一)Classifier-Free Guidance在做 …
Vision Transformer中的Attention热力图可视化原理是什么? 一、ViT的注意力可视化在做一件什么事情? 实 …
LoRA在图像生成中有哪些优秀的变式工作? 一、回归定义:LoRA是什么? LoRA(Low-Rank Adaptation)是一 …
Diffusion和Autoregressive做生成哪个上限更高? 先说结论:没有绝对的上限最高,这里都要结合具体的语境来进行讨 …
Training-free的多模态大模型研究方向目前有哪些比较适合学生? 一、前言 开始之前,说说自己对training-f …
如何看待「多模态大模型的幻觉缓解」这一方向? 一、MLLM Hallucination在做一件什么事情? Hallucinatio …
扩散模型预测噪声、x0、velocity的不同训练目标之间有什么区别和侧重? 一、Diffusers中的代码实现是怎样的? 在Di …