WeChat QR Code

Display

如振落叶 160,114 次

映雪囊萤 753,465 字

流光迁徙 1,634 天

上次在线 2 天前

所有文章都支持转载，标明出处即可，合作可联系站长。

技术交流

技术交流

科学技术是第一生产力

工具分享

工具分享

君子生非异也善假于物也

文字控

文字控

文字是沉默者的翅膀

Article

发布于 7 天前

19 热度无~ 技术交流

DPO可否拆分为两个阶段的SFT，一个最小化正样本loss，一个最大化负样本loss？

摘要

DPO可否拆分为两个阶段的SFT，一个最小化正样本loss，一个最大化负样本loss？一、DPO是什么？ DPO（Direct …

发布于 7 天前

19 热度无~ 技术交流

有哪些Classifier-Free Guidance的变式工作？

摘要

一、标准的Classifier-Free Guidance是怎么做的？（一）Classifier-Free Guidance在做 …

发布于 7 天前

21 热度无~ 技术交流

Vision Transformer中的Attention热力图可视化原理是什么？

摘要

Vision Transformer中的Attention热力图可视化原理是什么？一、ViT的注意力可视化在做一件什么事情？实 …

发布于 7 天前

20 热度无~ 技术交流

LoRA在图像生成中有哪些优秀的变式工作？

摘要

LoRA在图像生成中有哪些优秀的变式工作？一、回归定义：LoRA是什么？ LoRA（Low-Rank Adaptation）是一 …

发布于 7 天前

15 热度无~ 技术交流

Diffusion和Autoregressive做生成哪个上限更高？

摘要

Diffusion和Autoregressive做生成哪个上限更高？先说结论：没有绝对的上限最高，这里都要结合具体的语境来进行讨 …

发布于 8 天前

16 热度无~ 技术交流

Training-free的多模态大模型研究方向目前有哪些比较适合学生？

摘要

Training-free的多模态大模型研究方向目前有哪些比较适合学生？一、前言开始之前，说说自己对training-f …

发布于 8 天前

17 热度无~ 技术交流

如何看待「多模态大模型的幻觉缓解」这一方向？

摘要

如何看待「多模态大模型的幻觉缓解」这一方向？一、MLLM Hallucination在做一件什么事情？ Hallucinatio …

发布于 16 天前

25 热度无~ 文字控

初一，见了一些多年未见的老同学，才发现读博这几年人生仿佛按下了暂停键，很多同龄人已经工作落定，有房有车，结婚生子……

摘要

在学校里面待久了，对很多东西没概念，总觉得自己还是学生，即便到了一定年纪，也不觉得需要考虑太多事情，感觉离自己还很遥远，但是回了老 …

发布于 16 天前

36 热度无~ 文字控

对于读博群体来说，最应该感谢的是自己的家庭，哪有什么岁月静好，不过是有人在负重前行

摘要

“我不必费力解释为什么三十岁还不急着结婚，为什么选择清贫但热爱的学术道路，为什么享受独处胜过热闹聚会，博士身份成了最便捷的解释理由 …

发布于 17 天前

36 热度无~ 技术交流

扩散模型预测噪声、x0、velocity的不同训练目标之间有什么区别和侧重？

摘要

扩散模型预测噪声、x0、velocity的不同训练目标之间有什么区别和侧重？一、Diffusers中的代码实现是怎样的？在Di …

更早的文章