发布于 2025-03-12
摘要
01 我的主业是写文案,写商业稿之余,也发展副业:写一些随笔和新媒体文去投稿,偶有发表。 大概是主副业互补的缘故,业余写稿思路比较 …
01 我的主业是写文案,写商业稿之余,也发展副业:写一些随笔和新媒体文去投稿,偶有发表。 大概是主副业互补的缘故,业余写稿思路比较 …
小时候,我是那种迟钝型的孩子,对于周围人的目光,总是缺乏敏锐的感应力。虽然遭受到一些冷落与无视,常常好久后才感到几丝难过。 长大后 …
大语言模型(LLM)社区近期的一大热点研究课题是推理时扩展 (Inference-time scaling),这一热点也逐渐传播到 …
自从 ChatGPT o1 在 2024 年 9 月发布后,人们逐渐把研究重点放在了推理时扩展 (Inference-time s …
就在昨天,Kimi 和 Deepseek 分别发布了一篇论文,发布时间和论文主题内容都高度相似。我第一时间把两篇论文阅读完了,急忙 …
一直以来,研究者普遍认为,去噪扩散模型要想成功运行,噪声条件是必不可少的。 而大神何恺明的一项最新研究,对这个观点提出了「质疑」。 …
新年伊始,我想和年轻人分享三句话。这三句话,就像三句神奇的咒语,关于成长、关于协作,会让我们发生重大改变。 我不会,我可以学 “我 …
强化学习的核心目标是通过不断调整策略(即根据当前状态选择动作的规则),使智能体表现得更好。在强化学习中,有几个关键元素至关重要:首 …
双网络深度因果模型(Doubly Robust Deep Causal Models, DR-DCM)是一种用于因果推断的机器学 …
反事实生成对抗网络(Counterfactual GANs, CF-GANs)是统计学因果推断中的一种深度学习方法,主要用于模 …