发布于 7 天前
摘要
Training-free的多模态大模型研究方向目前有哪些比较适合学生? 一、前言 开始之前,说说自己对training-f …
Training-free的多模态大模型研究方向目前有哪些比较适合学生? 一、前言 开始之前,说说自己对training-f …
作为 AI 领域顶会中的顶会,NeurIPS 2025 的 Best Paper 历来是引领行业方向的 “风向标”。今年这篇题为《 …
近期何恺明团队的论文提出了一种叫做 Just image Transformers (JiT) 新式 DiT (Diffusion …
在大语言模型(LLMs)竞争日趋白热化的今天,「推理能力」已成为评判模型优劣的关键指标。OpenAI 的 o 系列、Anthrop …
创新点 提出了 极性感知线性注意力 (Polarity-aware Linear Attention),显式建模 query-ke …
0. 引言 本篇讲讲deepseek在MoE(Mixture-of-Experts)上的演进过程。DeepSeek是MoE稀疏模型 …
「RAG 技术通过在 AI 生成过程中引入外部知识检索,从基础的文档查询发展到多模态、Multi-Agent 体协同的智能架构,让 …
— 文章来源 速览多模态模型 Transfusion 和 Show-o:用 Transformer + 扩散模型同时处理文本和 …
—文章来源 锐评能模拟射击游戏的扩散模型 GameNGen 作者:周弈帆
— 文章来源 解读何恺明新作:不用向量离散化的自回归图像生成(Autoregressive Image Generation …