Jak działają modele językowe i jak zbudować własne ChatGPT / Aleksander Smywiński-Pohl / 18. SFI

Поделиться
HTML-код
  • Опубликовано: 8 сен 2024
  • Celem wykładu jest zaprezentowanie najważniejszych metod i modeli wykorzystywanych do trenowania dużych modeli językowych. Wykład rozpocznie się od przedstawienia kluczowego mechanizmu wykorzystywanego przez sieci neuronowe posiadające zdolność analizy i syntezy tekstu, tj. modelowania języka w wersji kauzalnej i maskowanej. Następnie przedstawiony zostanie najistotniejszy mechanizm sieci neuronowych typu transformer, czyli mechanizm atencji. Zostanie on porównany z innymi architekturami neuronalnymi, w szczególności sieciami rekurencyjnymi. W kolejnej części wykładu autor przedstawi działanie mechanizmu RLHF, stojącego za spektakularnym sukcesem narzędzia ChatGPT. Autor wskaże również najistotniejsze przeszkody związane z „chałupniczym” tworzeniem modeli językowych. Wykład zostanie zakończony rozważaniami dotyczącymi kwestii prawnych związanych z tworzeniem sztucznej inteligencji, w tym w szczególności ochroną praw autorskich.
    SOCIAL MEDIA:
    👉 Facebook: www.facebook.c...
    👉 Instagram: / sfikrakow
    👉 X: / sfikrakow
    👉 LinkedIn: / sfikrakow
    KONTAKT:
    🌐 sfi.pl
    📧 kontakt@sfi.pl
    📲 messenger: m.me/sfikrakow

Комментарии •