• 工具箱整理
      • MikuTools
      • 刘明野的工具箱
      • 七月辰的工具箱
      • 小影的工具箱
      • Healer的工具箱
      • 奇迹秀工具箱
      • 顾乾坤的实验室
      • 在线工具人
      • 孟坤工具箱
      • 开发工具箱
      • 工具资料箱
      • 超实用工具箱
      • 永恒君的百宝箱
      • 945KM
      • 945软件库
      • 哆啦A梦的神奇口袋
      • 哆啦A梦的神奇口袋目录
      • 爱达杂货铺
    • 实习日记
      • 第一次上课
      • 第一次机房上课
      • 教育实习 3.10 第一次批改作业
      • 实习周记三
      • 实习周记四3.30
      • 实习周记4.8
      • 实习周记六4-14
      • 实习周记八4-27
      • 实习周记七4-21
    • 动手学深度学习
      • 动手学深度学习教材配套网站
      • 动手学深度学习torch版
      • 动手学深度学习tensorflow版
    酥酥的温柔乡
    酥酥的温柔乡
    • 工具箱整理
      • MikuTools
      • 刘明野的工具箱
      • 七月辰的工具箱
      • 小影的工具箱
      • Healer的工具箱
      • 奇迹秀工具箱
      • 顾乾坤的实验室
      • 在线工具人
      • 孟坤工具箱
      • 开发工具箱
      • 工具资料箱
      • 超实用工具箱
      • 永恒君的百宝箱
      • 945KM
      • 945软件库
      • 哆啦A梦的神奇口袋
      • 哆啦A梦的神奇口袋目录
      • 爱达杂货铺
    • 实习日记
      • 第一次上课
      • 第一次机房上课
      • 教育实习 3.10 第一次批改作业
      • 实习周记三
      • 实习周记四3.30
      • 实习周记4.8
      • 实习周记六4-14
      • 实习周记八4-27
      • 实习周记七4-21
    • 动手学深度学习
      • 动手学深度学习教材配套网站
      • 动手学深度学习torch版
      • 动手学深度学习tensorflow版
    搜索
    随机换张背景
    avatar
    登录 注册
    header_user_avatar
    登录

    梦回温柔乡

    疯狂造句中......

    莫贪几两钱 误了月儿圆

  • WeChat QR Code
  • QQ QR Code
  • bilibili
  • cloudmusic
  • github
  • zhihu
  • E-mail
  • 技术交流

    计算机相关技术分享

    post_img
    发布于 6 天前
    18 热度 无~ 技术交流

    DPO可否拆分为两个阶段的SFT,一个最小化正样本loss,一个最大化负样本loss?

    摘要

    DPO可否拆分为两个阶段的SFT,一个最小化正样本loss,一个最大化负样本loss? 一、DPO是什么? DPO(Direct …

    post_img
    发布于 7 天前
    19 热度 无~ 技术交流

    有哪些Classifier-Free Guidance的变式工作?

    摘要

    一、标准的Classifier-Free Guidance是怎么做的? (一)Classifier-Free Guidance在做 …

    post_img
    发布于 7 天前
    19 热度 无~ 技术交流

    Vision Transformer中的Attention热力图可视化原理是什么?

    摘要

    Vision Transformer中的Attention热力图可视化原理是什么? 一、ViT的注意力可视化在做一件什么事情? 实 …

    post_img
    发布于 7 天前
    20 热度 无~ 技术交流

    LoRA在图像生成中有哪些优秀的变式工作?

    摘要

    LoRA在图像生成中有哪些优秀的变式工作? 一、回归定义:LoRA是什么? LoRA(Low-Rank Adaptation)是一 …

    post_img
    发布于 7 天前
    14 热度 无~ 技术交流

    Diffusion和Autoregressive做生成哪个上限更高?

    摘要

    Diffusion和Autoregressive做生成哪个上限更高? 先说结论:没有绝对的上限最高,这里都要结合具体的语境来进行讨 …

    post_img
    发布于 7 天前
    13 热度 无~ 技术交流

    Training-free的多模态大模型研究方向目前有哪些比较适合学生?

    摘要

       Training-free的多模态大模型研究方向目前有哪些比较适合学生? 一、前言 开始之前,说说自己对training-f …

    post_img
    发布于 8 天前
    15 热度 无~ 技术交流

    如何看待「多模态大模型的幻觉缓解」这一方向?

    摘要

    如何看待「多模态大模型的幻觉缓解」这一方向? 一、MLLM Hallucination在做一件什么事情? Hallucinatio …

    post_img
    发布于 16 天前
    34 热度 无~ 技术交流

    扩散模型预测噪声、x0、velocity的不同训练目标之间有什么区别和侧重?

    摘要

    扩散模型预测噪声、x0、velocity的不同训练目标之间有什么区别和侧重? 一、Diffusers中的代码实现是怎样的? 在Di …

    post_img
    发布于 2026-01-13
    85 热度 无~ 技术交流

    NeurIPS 2025 oral:DiT魔改指南

    摘要

    论文标题:Exploring Diffusion Transformer Designs via Grafting 论文地址:ht …

    post_img
    发布于 2026-01-13
    100 热度 无~ 技术交流

    预训练数据太差怎么办?Bengio团队引入显式贝叶斯,无梯度实现In-Context RL

    摘要

    在 In-Context RL 的研究热潮中,往往存在一种惯性思维,认为只要把 Transformer 做大,把上下文窗口拉长,模 …

    更早的文章
    loading_svg

    互联网ICP备案:浙ICP备2021031116号-2

    加载耗时 0.252 秒 | 查询 101 次 | 内存使用 16.43 MB

    Theme Sakurairo by Fuukei

    attention (6) causal (3) css (4) datetime (4) deeplearning (57) deepseek (3) diffusers (3) Diffusion (7) Django (18) excel (7) html (4) JavaScript (2) life (3) LLM (11) middleware (2) numpy (3) orm (4) OS (13) pandas (4) PPO (3) python (112) reinforcement learning (5) RLHF (3) scrapy (12) sklearn (12) Stable Diffusion (4) tableau (4) torch (46) transformer (5) vba (3) yolo (4) 人生 (3) 冬季星空 (5) 夏夜星空 (4) 大模型 (7) 大语言模型 (6) 天文 (35) 强化学习 (8) 思考 (47) 扩散模型 (28) 教育 (7) 教育学 (3) 文字 (4) 爬虫 (6) 生成式人工智能 (8)