หลักการทำงานของ Policy Gradient

Поделиться
HTML-код
  • Опубликовано: 24 янв 2025

Комментарии • 10

  • @TON--zk3jx
    @TON--zk3jx 2 года назад +1

    ขอบคุณครับกำลังหาอยู่พอดีเลย

    • @ECodingShare
      @ECodingShare  2 года назад

      ขอบคุณครับ

    • @TON--zk3jx
      @TON--zk3jx 2 года назад +1

      @@ECodingShare ขอ Step by step ของ Policy Gradient ได้ไหมครับ

  • @FakertoYou
    @FakertoYou Год назад +1

    ช่วยสอน Proximal Policy Optimization หน่อยครับ

  • @tanedsinglow6725
    @tanedsinglow6725 2 года назад +1

    7 เดือนที่รอคอย

    • @ECodingShare
      @ECodingShare  2 года назад +1

      ขอบคุณครับ 😀
      ช่วงนี้วุ่นๆ เลยไม่ค่อยได้โพสน์เลยครับ

    • @tanedsinglow6725
      @tanedsinglow6725 2 года назад +1

      @@ECodingShare รอดูคอน​เทนท์​ต่อๆไปอยู่ครับ สู้ๆ

    • @ECodingShare
      @ECodingShare  2 года назад

      @@tanedsinglow6725 ขอบคุณครับ 😁

  • @bohem7298
    @bohem7298 Год назад

    DQN ใช้ การคำนวณ Q learning มาปรับค่า output แล้ว PG train ยังไงครับ