技术交流归档 - 第4页共21页

发布于 2025-02-24

174 热度无~ 技术交流

一个有趣却撤稿 ICLR 2025 的工作：并非所有扩散模型噪声本质相同

摘要

自从 ChatGPT o1 在 2024 年 9 月发布后，人们逐渐把研究重点放在了推理时扩展 (Inference-time s …

发布于 2025-02-24

185 热度无~ 技术交流

一文比较 Kimi 和 deepseek 的两篇稀疏注意力机制论文

摘要

就在昨天，Kimi 和 Deepseek 分别发布了一篇论文，发布时间和论文主题内容都高度相似。我第一时间把两篇论文阅读完了，急忙 …

发布于 2025-02-24

254 热度无~ 技术交流

何凯明：扩散模型不一定需要噪声条件

摘要

一直以来，研究者普遍认为，去噪扩散模型要想成功运行，噪声条件是必不可少的。而大神何恺明的一项最新研究，对这个观点提出了「质疑」。 …

发布于 2025-02-19

293 热度无~ 技术交流

从Policy Gradient到REINFORCE++

摘要

强化学习的核心目标是通过不断调整策略（即根据当前状态选择动作的规则），使智能体表现得更好。在强化学习中，有几个关键元素至关重要：首 …

发布于 2025-02-19

153 热度无~ 技术交流

统计学基础 | 因果推断之双网络深度因果模型

摘要

双网络深度因果模型（Doubly Robust Deep Causal Models, DR-DCM）是一种用于因果推断的机器学 …

发布于 2025-02-17

161 热度无~ 技术交流

统计学基础 | 因果推断之反事实生成对抗网络

摘要

反事实生成对抗网络（Counterfactual GANs, CF-GANs）是统计学因果推断中的一种深度学习方法，主要用于模 …

发布于 2025-02-17

191 热度无~ 技术交流

统计学基础 | 因果推断之深度倾向得分模型

摘要

深度倾向得分模型（Deep Propensity Score Models, DPSM）是一种基于深度学习的方法，用于估计倾向得分 …

发布于 2025-02-15

253 热度无~ 技术交流

deepseek技术解读(3)-MoE的演进之路

摘要

0. 引言本篇讲讲deepseek在MoE（Mixture-of-Experts）上的演进过程。DeepSeek是MoE稀疏模型 …

发布于 2025-02-15

217 热度无~ 技术交流

deepseek技术解读(2)-MTP（Multi-Token Prediction）的前世今生

摘要

0.引言最近整理deepseek的技术线，针对MTP（Multi-Token Prediction）方法做了些扩展的阅读和学 …

发布于 2025-02-15

227 热度无~ 技术交流

deepseek技术解读(1)-彻底理解MLA（Multi-Head Latent Attention）

摘要

deepseek最近比较出圈，本人也一直关注deepseek发布的一些技术报告。在模型训练、推理性能和计算成本上一直能给大家惊喜。 …

梦回温柔乡

一个有趣却撤稿 ICLR 2025 的工作：并非所有扩散模型噪声本质相同

一文比较 Kimi 和 deepseek 的两篇稀疏注意力机制论文

何凯明：扩散模型不一定需要噪声条件

从Policy Gradient到REINFORCE++

统计学基础 | 因果推断之双网络深度因果模型

统计学基础 | 因果推断之反事实生成对抗网络

统计学基础 | 因果推断之深度倾向得分模型

deepseek技术解读(3)-MoE的演进之路

deepseek技术解读(2)-MTP（Multi-Token Prediction）的前世今生

deepseek技术解读(1)-彻底理解MLA（Multi-Head Latent Attention）