发布于 2025-02-24
摘要
自从 ChatGPT o1 在 2024 年 9 月发布后,人们逐渐把研究重点放在了推理时扩展 (Inference-time s …
计算机相关技术分享
自从 ChatGPT o1 在 2024 年 9 月发布后,人们逐渐把研究重点放在了推理时扩展 (Inference-time s …
就在昨天,Kimi 和 Deepseek 分别发布了一篇论文,发布时间和论文主题内容都高度相似。我第一时间把两篇论文阅读完了,急忙 …
一直以来,研究者普遍认为,去噪扩散模型要想成功运行,噪声条件是必不可少的。 而大神何恺明的一项最新研究,对这个观点提出了「质疑」。 …
强化学习的核心目标是通过不断调整策略(即根据当前状态选择动作的规则),使智能体表现得更好。在强化学习中,有几个关键元素至关重要:首 …
双网络深度因果模型(Doubly Robust Deep Causal Models, DR-DCM)是一种用于因果推断的机器学 …
反事实生成对抗网络(Counterfactual GANs, CF-GANs)是统计学因果推断中的一种深度学习方法,主要用于模 …
深度倾向得分模型(Deep Propensity Score Models, DPSM)是一种基于深度学习的方法,用于估计倾向得分 …
0. 引言 本篇讲讲deepseek在MoE(Mixture-of-Experts)上的演进过程。DeepSeek是MoE稀疏模型 …
0.引言 最近整理deepseek的技术线,针对MTP(Multi-Token Prediction)方法做了些扩展的阅读和学 …
deepseek最近比较出圈,本人也一直关注deepseek发布的一些技术报告。在模型训练、推理性能和计算成本上一直能给大家惊喜。 …