Article

post_img

多 “玩”,少内耗

摘要

网上有一种流行说法,当一个人想要改变生活的时候,往往会从“重启人生三件套”开始:健身、读书、学外语。 还有个新火的方法,就是把小时 …

post_img

推理时强化学习TTRL

摘要

在大语言模型(LLMs)竞争日趋白热化的今天,「推理能力」已成为评判模型优劣的关键指标。OpenAI 的 o 系列、Anthrop …