Article

post_img

推理时强化学习TTRL

摘要

在大语言模型(LLMs)竞争日趋白热化的今天,「推理能力」已成为评判模型优劣的关键指标。OpenAI 的 o 系列、Anthrop …

post_img

珍·古道尔的传奇一生

摘要

有人说,她是课本上的传奇,因为她的名字出现在我们的科学、生物、英语教科书上; 有人说,她颠覆了关于“人类”的定义。也因此,她被称为 …

post_img

FlashAttention

摘要

以 Attention 计算为核心的 Transformer 模型是当今深度学习的基石。虽然 Attention 计算十分有效,但 …