发布于 3 天前
摘要
跟 ChatGPT 多聊几轮、边聊边补需求,是不是常常感觉它越聊越走偏?这不是你的错觉。ICLR 2026 这篇杰出论文用 20 …
莫贪几两钱 误了月儿圆
科学技术是第一生产力
君子生非异也善假于物也
文字是沉默者的翅膀
跟 ChatGPT 多聊几轮、边聊边补需求,是不是常常感觉它越聊越走偏?这不是你的错觉。ICLR 2026 这篇杰出论文用 20 …
扩散模型Classifer Guidance中classifier的梯度是如何传给U-Net的? 这是一个常见的误区:Classi …
1 其实要形容这部《给阿嬷的情书》挺难的。 它显然不像现在市面上的绝大多数主流电影,它没有无所不用其极地想要吸引眼球,或者试图弄一 …
读博一定要避免自己的情绪被课题绑定。 读博最大的陷阱,不是能力不够,而是把全部情绪押在课题上。 实验成功了,天就是晴的,觉得自己还 …
很多朋友刚读博的时候好高骛远,总想一口气吃成大胖子,找导师要了很多有挑战性的课题,目标是冲击正刊,甚至还不止做一个这样的课题。 有 …
同一个领域和方向,有的课题组很高产,学生也基本不会延毕,毕业后自然能找到更好的工作。而有些课题组延毕率高,出的成果也不尽人意,而且 …
DPO可否拆分为两个阶段的SFT,一个最小化正样本loss,一个最大化负样本loss? 一、DPO是什么? DPO(Direct …
一、标准的Classifier-Free Guidance是怎么做的? (一)Classifier-Free Guidance在做 …
Vision Transformer中的Attention热力图可视化原理是什么? 一、ViT的注意力可视化在做一件什么事情? 实 …
LoRA在图像生成中有哪些优秀的变式工作? 一、回归定义:LoRA是什么? LoRA(Low-Rank Adaptation)是一 …