发布于 2026-02-01
摘要
世界是一曲宏大的交响乐,有人是激昂的小号,有人是低沉的大提琴,有人天生就是聚光灯的中心,享受着万众瞩目的时刻;但也有人习惯了安静, …
莫贪几两钱 误了月儿圆
科学技术是第一生产力
君子生非异也善假于物也
文字是沉默者的翅膀
世界是一曲宏大的交响乐,有人是激昂的小号,有人是低沉的大提琴,有人天生就是聚光灯的中心,享受着万众瞩目的时刻;但也有人习惯了安静, …
论文标题:Exploring Diffusion Transformer Designs via Grafting 论文地址:ht …
在 In-Context RL 的研究热潮中,往往存在一种惯性思维,认为只要把 Transformer 做大,把上下文窗口拉长,模 …
她胖了,属于压力胖,办了一张健身卡。下次见面,问她去健身了吗?她说没有,还是忙。等赚够了钱,就去少有人住的海岛,过闲云野鹤的生活, …
作为 AI 领域顶会中的顶会,NeurIPS 2025 的 Best Paper 历来是引领行业方向的 “风向标”。今年这篇题为《 …
过去一年来, o1和DeepSeek-R1 的神话,结合媒体的宣传,让 RL 特别像武侠小说里的绝世功法:给个 reward,堆上 …
网上有一种流行说法,当一个人想要改变生活的时候,往往会从“重启人生三件套”开始:健身、读书、学外语。 还有个新火的方法,就是把小时 …
在上篇博文中,我分享了近期较火的 JiT 论文,它从理论和实验上证明了:像素空间 DiT 难训练的原因是 patch size 太 …
近期何恺明团队的论文提出了一种叫做 Just image Transformers (JiT) 新式 DiT (Diffusion …
刷社交平台本该是件轻松的事:睡前浏览一会儿,看看别人种草什么好物,顺便了解一下当下流行的生活方式。可不知从什么时候起,我竟把自己活 …