大白话AI | 图像生成模型之DDPM | 扩散模型 | 生成模型 | 概率扩散去噪生成模型 | Diffusion Model

Поделиться
HTML-код
  • Опубликовано: 25 окт 2024

Комментарии • 50

  • @EpromLee
    @EpromLee 3 месяца назад +5

    up主真的很厉害,你就是中国的andrej karpathy。我看李宏毅的课看得懵懵懂懂,跑去复习了很多知识,但是一直没有串起来,公式看了好几遍还是懵懵懂懂。后来在李宏毅的评论里有人推荐了你这个频道就点开看了,没想到居然把所有知识点串起来了,我的脑袋扑哧一声就炸开了,我开窍了,超级神奇。非常感谢up主,爱你爱你么么哒!

    • @大白话AI
      @大白话AI  3 месяца назад

      "脑袋扑哧一声就炸开了" 恐怖片。。。

  • @yuehpo-peng
    @yuehpo-peng 8 месяцев назад +8

    目前看過講解的最好的!期待看到更多新影片~

  • @大白话AI
    @大白话AI  7 месяцев назад +1

    Introduction of DDPM for high-school students
    Episode I: ruclips.net/video/zEZOYZeIPUs/видео.html
    Episode II: ruclips.net/video/C1WkW1Q6Iok/видео.html
    Episode III: ruclips.net/video/2vWQUkUlKIE/видео.html
    Episode IV(paid required): www.bilibili.com/video/BV1gK421b7W9/
    Online demo:wangjia184.github.io/diffusion_model/
    Source code: github.com/wangjia184/diffusion_model/

  • @am-hp6sn
    @am-hp6sn Год назад +7

    不错的视频!之前总是奇怪为什么要从一片噪声中生成图像,原来这种无中生有是有道理的。
    “从x0到xt的关系式中可以看到,对于大T时刻,α bar值接近0,所以xT约等于ε,也就是说xT的图像近似于标准正态分布。因此可以认为任何一张标准正态分布的噪声图片,都是某张x0的原图加噪后得来的,只需要用标准正态分布随机采样就能生成xT时刻的图片。”

  • @chaixincha
    @chaixincha Год назад +3

    好厉害,之前看的东西什么都看不懂,看这个一下就看懂了!

  • @马岩-f2e
    @马岩-f2e Год назад +4

    写的深入浅出,大神太厉害了,期待下一集

  • @miata2022
    @miata2022 Год назад +2

    做的太好了!Please keep up with good work!

  • @CG-bj5pq
    @CG-bj5pq Год назад +1

    非常清晰,谢谢大刘

  • @TheGongjie437
    @TheGongjie437 18 дней назад

    非常感谢。 希望出一期关于transformer的。

  • @zhaoqiansu
    @zhaoqiansu Год назад

    非常期待接下来更多视频!

  • @danli5341
    @danli5341 10 месяцев назад +1

    请再出一些其他的系列吧?讲的太好了!!求联系方式!

  • @ivylijie
    @ivylijie 8 месяцев назад +3

    我看过的讲得最好,没有之一。我数学基础不好,DDPM的论文下载了看来3天,外加台大李宏毅的课,都不甚了了,up主是真懂的,所以才能如此深入浅出。建议动画可以简单一点,制作起来太费时间了,能不能找到一种花时间少的表达方式,比如就用几页PPT来讲,大道致简的思想表达才是核心。AI方向可以讲的内容会越来越多,但真懂人的稀缺,在表达工具上太花时间了,负担会太重,难以持续。

    • @大白话AI
      @大白话AI  8 месяцев назад +5

      哈哈,在我看来,能够形象化地表达才算真正意义上的理解。比如爱因斯坦当年狭义相对论的火车试验,广义相对论的电梯试验,以及EPR paradox,都可以用最浅显生动的例子来洞察高深的物理学本质,比起公式推导更能体现爱因斯坦敏锐的直觉和洞察力。所以,后面我会尝试绕过公式,直接用三维动画展示整个扩散过程,无须理解公式也能去理解整个模型的原理,我觉得这点非常有意思。

  • @zhewang5786
    @zhewang5786 Год назад

    很棒,希望能够讲解更多的AI相关数学知识!

  • @qiaolinghe3003
    @qiaolinghe3003 6 месяцев назад

    讲得太好了!!!!

  • @Bhllllll
    @Bhllllll 5 месяцев назад

    真的很clean 好多视频推来推去不知道在推什么 如果用类似VAE的ELBO去推 多了一堆式子 再自圆其说的把有些项说不重要再cross out掉 这个视频告诉我们做来做去其实一个bayesian rule就解释清楚了 牛逼

  • @qqD-h2r
    @qqD-h2r Год назад

    我又来催更了,每天进youtube第一件事就是 看您有没有更新内容

  • @夏目的猫
    @夏目的猫 6 месяцев назад

    厉害了学习了很多。有教程的其他链接吗,比如公众号、知乎啥的

  • @catallen-dg1lh
    @catallen-dg1lh 4 месяца назад

    哦,看到后面恍然大悟了。有一个很重要的信息,就是正态分布。本质是像素点的不同正态分布叠加。

  • @tsupeichen693
    @tsupeichen693 Год назад

    講得真好

  • @rikki146
    @rikki146 Год назад +4

    這麼卷的嗎.. 中學生也懂 DDPM
    不妨多作一期 DPM++ 2M SDE Solver 😀

  • @ZoeSong-cl6by
    @ZoeSong-cl6by 7 месяцев назад

    好牛的视频

  • @虫洞之间
    @虫洞之间 Год назад

    讲的不错兄弟

  • @jasonlin8549
    @jasonlin8549 5 месяцев назад +1

    有DDIM相關視頻嗎

  • @zhangbo0037
    @zhangbo0037 5 месяцев назад

  • @fklds
    @fklds 2 месяца назад +2

    完了,我的高中数学可能白学了,因为我还是看不懂

  • @rx3694
    @rx3694 Год назад

    还有训练过程呢?亟待更新呢,做的特别好

  • @brook7071
    @brook7071 5 месяцев назад

    想請問,這樣生成出來的東西是無限個還是有限的?
    假設是有限的,所以最終會生成出重複的畫面對嗎?

  • @danli5341
    @danli5341 10 месяцев назад

    毫不夸张的说,这是我看到关于stable diffusion数学原理方面最好的视频,没有之一。

  • @cncclay7473
    @cncclay7473 Год назад

    牛牛牛。

  • @taiwanSmart
    @taiwanSmart 10 месяцев назад

    念成投子,確實是第一次聽到

  • @clarkxiao2182
    @clarkxiao2182 7 месяцев назад

    太厉害了,不过我中学数学肯定没学好🥲

  • @qqD-h2r
    @qqD-h2r Год назад

    很不错啊,很清晰了属于是,这个可以送礼物吗?。。下半部分呢,没找到诶,是还没更新吗?

  • @spes9850401
    @spes9850401 Год назад +2

    25:17 為何不用這個等式直接從Xt求得X0

    • @大白话AI
      @大白话AI  Год назад +1

      在DDPM中,每个像素的噪声分布是独立的,也就是说,噪声$\epsilon_t$对于不同的像素是不相关的。因此,给定$x_t$和$\epsilon_t$,我们可以很容易地计算出$x_0$. 然而,在实际应用中,我们并不知道每个像素的噪声值,因此也无法直接从$x_t$推断出$x_0$。相反,我们需要通过神经网络模型来学习每个像素的噪声分布,从而能够正确地生成样本。这里很重要的一点,神经网络预测的并不是图像,而是它的概率分布。比如知道彩票的概率分布,但无法预知下次的开奖结果一样。

    • @SiyuanYuan-m1q
      @SiyuanYuan-m1q 6 месяцев назад

      @@大白话AI 那为什么不能用神经网络直接学习出从x0到xt的噪声分布从而直接从xt得到x0呢

  • @oliversivan3257
    @oliversivan3257 Год назад +1

    真抱歉,感觉讲的深入浅出,但奈何数学全部还给老师了,渐渐就看不懂了。。。

  • @huazhu
    @huazhu Год назад +1

    看起来很白痴的视频却是最深刻的视频!清楚地看到了数学模型在AI中的运用。大概是用概率反推吧。

  • @Paul-yl5uv
    @Paul-yl5uv 9 месяцев назад

    nb!

  • @KimPop1984
    @KimPop1984 Год назад

    虽然一点没听懂,但是我听得不亦乐乎

  • @rc_youtubeaccount1331
    @rc_youtubeaccount1331 Год назад +2

    这典型的收费质量啊

  • @康海翔
    @康海翔 Год назад

    原来这才是所谓的预测?

  • @strafidamo9703
    @strafidamo9703 Год назад

    讲的太棒了