发布于 2025-02-24
摘要
自从 ChatGPT o1 在 2024 年 9 月发布后,人们逐渐把研究重点放在了推理时扩展 (Inference-time s …
莫贪几两钱 误了月儿圆
科学技术是第一生产力
君子生非异也善假于物也
文字是沉默者的翅膀
自从 ChatGPT o1 在 2024 年 9 月发布后,人们逐渐把研究重点放在了推理时扩展 (Inference-time s …
就在昨天,Kimi 和 Deepseek 分别发布了一篇论文,发布时间和论文主题内容都高度相似。我第一时间把两篇论文阅读完了,急忙 …
一直以来,研究者普遍认为,去噪扩散模型要想成功运行,噪声条件是必不可少的。 而大神何恺明的一项最新研究,对这个观点提出了「质疑」。 …
新年伊始,我想和年轻人分享三句话。这三句话,就像三句神奇的咒语,关于成长、关于协作,会让我们发生重大改变。 我不会,我可以学 “我 …
强化学习的核心目标是通过不断调整策略(即根据当前状态选择动作的规则),使智能体表现得更好。在强化学习中,有几个关键元素至关重要:首 …
双网络深度因果模型(Doubly Robust Deep Causal Models, DR-DCM)是一种用于因果推断的机器学 …
反事实生成对抗网络(Counterfactual GANs, CF-GANs)是统计学因果推断中的一种深度学习方法,主要用于模 …
深度倾向得分模型(Deep Propensity Score Models, DPSM)是一种基于深度学习的方法,用于估计倾向得分 …
01 大学毕业后在南京工作两年后,我辞掉工作,退掉租的房子,准备回家考研。那时,母亲要上班,平时不在家,想到要长期和父亲共处一室, …
0. 引言 本篇讲讲deepseek在MoE(Mixture-of-Experts)上的演进过程。DeepSeek是MoE稀疏模型 …