• 工具箱整理
      • MikuTools
      • 刘明野的工具箱
      • 七月辰的工具箱
      • 小影的工具箱
      • Healer的工具箱
      • 奇迹秀工具箱
      • 顾乾坤的实验室
      • 在线工具人
      • 孟坤工具箱
      • 开发工具箱
      • 工具资料箱
      • 超实用工具箱
      • 永恒君的百宝箱
      • 945KM
      • 945软件库
      • 哆啦A梦的神奇口袋
      • 哆啦A梦的神奇口袋目录
      • 爱达杂货铺
    • 实习日记
      • 第一次上课
      • 第一次机房上课
      • 教育实习 3.10 第一次批改作业
      • 实习周记三
      • 实习周记四3.30
      • 实习周记4.8
      • 实习周记六4-14
      • 实习周记八4-27
      • 实习周记七4-21
    • 动手学深度学习
      • 动手学深度学习教材配套网站
      • 动手学深度学习torch版
      • 动手学深度学习tensorflow版
    酥酥的温柔乡
    酥酥的温柔乡
    • 工具箱整理
      • MikuTools
      • 刘明野的工具箱
      • 七月辰的工具箱
      • 小影的工具箱
      • Healer的工具箱
      • 奇迹秀工具箱
      • 顾乾坤的实验室
      • 在线工具人
      • 孟坤工具箱
      • 开发工具箱
      • 工具资料箱
      • 超实用工具箱
      • 永恒君的百宝箱
      • 945KM
      • 945软件库
      • 哆啦A梦的神奇口袋
      • 哆啦A梦的神奇口袋目录
      • 爱达杂货铺
    • 实习日记
      • 第一次上课
      • 第一次机房上课
      • 教育实习 3.10 第一次批改作业
      • 实习周记三
      • 实习周记四3.30
      • 实习周记4.8
      • 实习周记六4-14
      • 实习周记八4-27
      • 实习周记七4-21
    • 动手学深度学习
      • 动手学深度学习教材配套网站
      • 动手学深度学习torch版
      • 动手学深度学习tensorflow版
    搜索
    随机换张背景
    avatar
    登录 注册
    header_user_avatar
    登录

    梦回温柔乡

    疯狂造句中......

    莫贪几两钱 误了月儿圆

  • WeChat QR Code
  • QQ QR Code
  • bilibili
  • cloudmusic
  • github
  • zhihu
  • E-mail
  • transformer

    post_img
    发布于 7 天前
    19 热度 无~ 技术交流

    Vision Transformer中的Attention热力图可视化原理是什么?

    摘要

    Vision Transformer中的Attention热力图可视化原理是什么? 一、ViT的注意力可视化在做一件什么事情? 实 …

    post_img
    发布于 8 天前
    15 热度 无~ 技术交流

    如何看待「多模态大模型的幻觉缓解」这一方向?

    摘要

    如何看待「多模态大模型的幻觉缓解」这一方向? 一、MLLM Hallucination在做一件什么事情? Hallucinatio …

    post_img
    发布于 2025-12-05
    107 热度 无~ 技术交流

    给 JiT 加上像素级解码器:三篇近期 Pixel DiT 论文对比解读

    摘要

    在上篇博文中,我分享了近期较火的 JiT 论文,它从理论和实验上证明了:像素空间 DiT 难训练的原因是 patch size 太 …

    post_img
    发布于 2024-12-11
    179 热度 无~ 技术交流

    让预训练 Transformer 生成更长的文本/图像:位置编码长度外推技术

    摘要

    —文章来源周弈帆的博客

    post_img
    发布于 2024-12-10
    154 热度 无~ 技术交流

    位置编码背后的理论解释——傅里叶特征 (Fourier Feature)与核回归

    摘要

    —文章来源周弈帆的博客

    loading_svg

    互联网ICP备案:浙ICP备2021031116号-2

    加载耗时 0.259 秒 | 查询 96 次 | 内存使用 16.27 MB

    Theme Sakurairo by Fuukei

    attention (6) causal (3) css (4) datetime (4) deeplearning (57) deepseek (3) diffusers (3) Diffusion (7) Django (18) excel (7) html (4) JavaScript (2) life (3) LLM (11) middleware (2) numpy (3) orm (4) OS (13) pandas (4) PPO (3) python (112) reinforcement learning (5) RLHF (3) scrapy (12) sklearn (12) Stable Diffusion (4) tableau (4) torch (46) transformer (5) vba (3) yolo (4) 人生 (3) 冬季星空 (5) 夏夜星空 (4) 大模型 (7) 大语言模型 (6) 天文 (35) 强化学习 (8) 思考 (47) 扩散模型 (28) 教育 (7) 教育学 (3) 文字 (4) 爬虫 (6) 生成式人工智能 (8)