Introduction to RAG, retrieval augmented generation

Поделиться
HTML-код
  • Опубликовано: 18 окт 2024
  • 🙏 Se questo video ti è stato utile fai una donazione col pulsante "Grazie" o abbonati per supportarlo: / @raffaelegaito
    È da diverso tempo che mi chiedete di parlare dei RAG, Retrieval Augmented Generation.
    Si tratta di un framework/infrastruttura che consente di migliorare i risultati delle AI generative che usiamo tutti i giorni.
    Grazie all'utilizzo di una fonte esterna di dati i RAG consentono di risolvere alcuni problemi più comuni che abbiamo con l'IA.
    Ne parlo in questo video, cercando di spiegare il concetto in maniera semplice anche per i meno esperti e tecnici.
    Buona visione 😎
    Video realizzato con Tella, usa questo link per il 30% di sconto:
    gaito.link/tella
    Hai bisogno di una VPN? Prova NordVPN da questo link e hai 4 mesi gratuiti extra: nordvpn.com/ra...
    Un grazie speciale a questi abbonati al canale:
    Vincenzo Paolo
    Stefania Giordani
    Alberto Negro
    Maria Francesca Belcaro
    Alessio Farinella
    #ia #intelligenzaartificiale #rag
    __________
    🤖 Studia l'IA con me:
    gaito.link/y-i...
    📈 Entra nella mia academy:
    gaito.link/y-a...
    💻 Guarda i miei corsi:
    gaito.link/y-c...
    📚 Scopri i miei libri:
    gaito.link/y-l...
    ✉️ Iscriviti alla mia newsletter:
    gaito.link/y-n...

Комментарии • 70

  • @RaffaeleGaito
    @RaffaeleGaito  2 месяца назад

    Vuoi formarti sull'intelligenza artificiale? Entra nella mia academy IA360: ia360.academy/

  • @nugh1975
    @nugh1975 2 месяца назад +8

    ottimo, grazie. Aspetto il video sull'embedding.

    • @RaffaeleGaito
      @RaffaeleGaito  2 месяца назад +3

      aspetto di vedere se interessa anche ad altre persone

  • @FrancescoCataniaGroup
    @FrancescoCataniaGroup Месяц назад

    Ottimo video. Io ho utilizzato i rag inzieme ai db vettoriali e gpt e sql per creare un bot per un ristorante per un servizio di informazioni listino e gestione prenonatazione

  • @nazariodelia3247
    @nazariodelia3247 2 месяца назад

    Non so se per caso o perché avevi letto un mio commento precedente, ma grazie per la tua precisazione nell'ultima parte del video. Poiché devo creare un tool ai da addestrare sia con il prompt che con dei documenti e non posso permettermi di fare più di un abbonamento (altrimenti farei chatgpt, Claude e la tua Academy senza pensarci due volte😂), avevo chiesto cosa scegliere tra i gpts di open ai, project di Claude o azure (che però è più impegnativo). Direi che a questo punto, per ora, lo strumento migliore per creare un tool da poter fare usare a terzi è il gpts, quindi dovrò fare l'abbonamento a quello poiché project di claude mi sembra di capire che sia limitato al singolo account e che non può essere usato da terzi (anche se Claude mi piace molto di più per tutte le altre attività di lavoro). Grazie mille!

  • @AntonioForte-hu7hv
    @AntonioForte-hu7hv 6 дней назад

    Bravo

  • @AdrianoFemiano
    @AdrianoFemiano 2 месяца назад +1

    Per quato detto al min 4:34 diceva un grande scusate se la mia ignoranza è superiore alla vostra! Grazie Raf per farmi capire a grandi linee concetti che da ignorante con me non avrei mai capito. Grazie

  • @GiornalediSistema
    @GiornalediSistema 2 месяца назад +1

    Ottimo video; si al confronto RAG/Fine-tuning, e fosse possibile un video anche sull'embedding sarebbe il massimo. 🙂

  • @paolo_fantinel
    @paolo_fantinel 2 месяца назад +7

    Non vedo l'ora di vedere l'intelligenza artificiale in ambiente industriale, sopratutto a livello operativo. Penso al settore della manutenzione o della semplice (per modo di dire) risoluzione di problemi tecnici meccanici. Inserire tutti i manuali si macchinari costruiti assemblando 5/6 macchinari distinti dei quali do ogniuno abbiamo decine di manuali spesso tradotti dal tedesco in maniera un po grossolana. Mi immagino di radunare tutte le informazioni, i manuali, la componentistica, i pdf dei progettisti e tramite una domanda o magari una foto, mi estrae tutte le soluzioni applicabili a quel specifico particolare della macchina, recuperando i codici dei componenti impiegati e alle possibili soluzioni, non solo, una volta aggiornato la casistica dei problemi/soluzioni poter accorciare sensibilmente le tempistiche di risoluzione dei problemi e magari programmare in maniera più adeguata la manutenzione programmata. A breve mi iscriverò ad ingegneria gestionale e vorrei incentrare il tutto sull'intelligenza artificiale e la cua applicabilità in tutti i settori dell'industria

    • @RaffaeleGaito
      @RaffaeleGaito  2 месяца назад +1

      Grande! In bocca al lupo per questa tua nuova avventura allora!

    • @alessandrosalvaggio6772
      @alessandrosalvaggio6772 2 месяца назад +1

      i rag servono proprio anche per questo

    • @fmina76
      @fmina76 2 месяца назад +2

      Io mi occupo proprio di questo e il mondo dell’ Industrial AI (con requisiti diversi da quella generalista) è ancora tutto da esplorare e costruire nelle Operations. In bocca al lupo per la tua avventura universitaria con un piccolo avviso ai naviganti : non metterei al centro l’AI ma i processi (di manutenzione, analisi affidabilità, Fmeca, OEE, miglioramento continuo, etc) e le competenze e cultura nuova da costruire all’interno della workforce aziendale… le tecnologie a quel punto ne amplificheranno l’efficienza .. Ad Maiora

  • @vincorsaro
    @vincorsaro 2 месяца назад

    Grazie mille davvero Raffaele per questi tuoi contenuti, io uso quotidianamente l'IA per i miei studi in giurisprudenza, attualmente uso Gemini Pro, ChatGPT 4o, Perplexity (che ho conosciuto grazie a te) e Claude, li uso tutti e 4 in contemporanea proprio per confrontarli e mettermi al riparo il più possibile da allucinazioni ed errori, e ciononostante mi è capitato di ricevere allucinazioni da tutti e 4 (anche se va detto che Perplexity ne soffre di meno rispetto agli altri.
    In Academy si parla solo di programmazione dell'IA o vengono trattati anche altri temi, come appunto l'approccio allo studio e più in generale l'approccio al mondo del diritto?
    Io a tal proposito dal loro lancio ho creato due GPTs, ma non avendo conoscenze di programmazione non mi hanno dati grandissimi risultati finora, ma ora proverò a seguire il tuo tutorial su come caricare dei documenti sui miei GPTs.

  • @direttoreetico
    @direttoreetico 2 месяца назад +7

    Si fai un video con la differenza tra rag e file tuning thanks

    • @RaffaeleGaito
      @RaffaeleGaito  2 месяца назад +7

      vediamo un po' se interessa anche ad altri

  • @andreadeambrosis7336
    @andreadeambrosis7336 2 месяца назад

    Grazie.

  • @domenicopratico8141
    @domenicopratico8141 2 месяца назад

    Dopo questo video, ho deciso: MI SONO ISCRITTO ALLA TUA ACADEMY.
    See you on board :)

  • @lavoromeglio
    @lavoromeglio 2 месяца назад

    Grazie Raf, ottimo video. Domanda ignorante: sbaglio o un RAG e NotebookLM si assomigliano?

    • @RaffaeleGaito
      @RaffaeleGaito  2 месяца назад +1

      in un certo senso potremmo dire che NotebookLM è un RAG "leggero", con tutte i distinguo del caso ovviamente

  • @andnegr
    @andnegr 2 месяца назад

    Thanks!

  • @geronimocapo
    @geronimocapo 2 месяца назад +3

    Si confronto rag fine tuning grazie

    • @RaffaeleGaito
      @RaffaeleGaito  2 месяца назад

      vediamo se interessa anche ad altri e decido

  • @AnnaDustfield
    @AnnaDustfield 2 месяца назад

    Ok ma come si usa il RAG nella pratica? Si può usare anche per la musica, video e le immagini?

  • @GiuseppeCommisso-u4e
    @GiuseppeCommisso-u4e 14 дней назад

    Domanda: posso creare RAG A PARTIRE DA LIBRI DI TESTO IN PDF? Esempio vorrei fare copia pdf di tutti i testi del corso di laurea in medicina per poterli consultare tramite chat. E’ possibile?

  • @andrealamacchia8165
    @andrealamacchia8165 2 месяца назад

    Ciao Raff, una curiosità: se conosci i lavori di Borzacchiello, se dai in pasto a chat GPT il libro La Parola Magica e chiedessi al bot, per esempio, di rielaborare i vari decoding and profiling di Leonard Want in versione non vedente in modo da raggiungere gli stessi risultati del libro, chat GPT riuscirebbe a farlo, secondo te?
    Sinceramente usare le AI per farci dare una mano ulteriore alle riletture di libri di crescita personale sarebbe una bomba, non trovi?

    • @RaffaeleGaito
      @RaffaeleGaito  2 месяца назад

      Andrea secondo me la cosa migliore è provare. Ci metti pochissimo a fare un test ;)

  • @blackrunner69
    @blackrunner69 2 месяца назад

    oggi mi iscrivo !

  • @valeriorisa
    @valeriorisa 2 месяца назад

    Ma il RAG è paragonabile a l'uso dei GPT di openAI quando si immettono all'interno dei documenti di knowledge?

    • @RaffaeleGaito
      @RaffaeleGaito  2 месяца назад

      chiesto (e risposto) già in altri commenti ;)

  • @noalemike63
    @noalemike63 2 месяца назад

    Quale sono le principali differenze tra un GPTs ad uso personale con project knowledge di dati professionali e il RAG?

    • @RaffaeleGaito
      @RaffaeleGaito  2 месяца назад

      "uso personale", direi che il punto della questione è lì
      Un'azienda quando mette in piedi un RAG lo fa per utilizzo professionale, duraturo nel tempo, con accesso (probabilmente) a varie persone del team, con una KB che cresce nel tempo, e così via...

  • @DeathVsLife1975
    @DeathVsLife1975 2 месяца назад

    Ciao, vorrei programmare in flutter. Secondo te qual”ê la migliore AI che mi può aiutare?

    • @andrearitondale
      @andrearitondale 2 месяца назад +1

      Claude, Phind, Codestral e Codellama, ma i modelli da 34B o 70B di parametri minimo, quelli inferiori non sono sufficientemente potenti

    • @DeathVsLife1975
      @DeathVsLife1975 2 месяца назад

      @@andrearitondale 🤩 grazie

  • @andreadeprisco2925
    @andreadeprisco2925 2 месяца назад +1

    ChatGPT, per dovere di cronaca, riesce a inventarsi le cose anche citando la fonte (che dice tutt'altro).
    "E ho detto tutto..." (cit.)

    • @RaffaeleGaito
      @RaffaeleGaito  2 месяца назад

      L'ho detto in milioni di video, tranquillo ;)

    • @andreadeprisco2925
      @andreadeprisco2925 2 месяца назад

      @@RaffaeleGaito La mia non era una critica al video né tantomeno all'autore (ci mancherebbe). Era una critica a ChatGPT che non finisce mai di stupirmi. Negativamente.

  • @EgregioRegolo37
    @EgregioRegolo37 2 месяца назад

    Raffaele buongiorno. Scusa l'osservazione da nerd ma aldilà della dimensione dell'archivio RAG e Notebooklm sono la stessa cosa?

    • @RaffaeleGaito
      @RaffaeleGaito  2 месяца назад +1

      Diciamo che semplificando tantissimo NotebookLM ti permette di costruirti un tuo piccolo RAG. Così come anche i GPTs e i Projects di Claude.
      (I puristi esperti mi odieranno 😂)

  • @riccardominunni4230
    @riccardominunni4230 2 месяца назад

    Confronto con rag fine certo!!

  • @mikymarchese6570
    @mikymarchese6570 2 месяца назад

    Claude Sonnet, in modo gratuito, probabilmente fa questa cosa, cioè noi possiamo creare un "progetto" personalizzato dove carichiamo le info, i pdf, la doumentazione, e in quel caso le domande fatte all'AI vanno a pescare in quel "database" e non in generico...... Claude Sonnet è creato da ex di Open AI.....

    • @RaffaeleGaito
      @RaffaeleGaito  2 месяца назад

      vale lo stesso ragionamento che ho fatto per i GPTs

  • @alessandrosalvaggio6772
    @alessandrosalvaggio6772 2 месяца назад

    il caso che hai citato del bot di risposta ai clienti l’ho proprio realizzato per alcuni moe clienti, hanno un ecommerce custom che ho realizzato anni fa e gli ho integrato un rag che ho fattp in python, misto tra locale e gpt, gli ho inserito anche data e ora, quindi ti avvisa pure se il negozio sia aperto o chiuso, mostra le foto dei prodotti, ecc…

    • @RaffaeleGaito
      @RaffaeleGaito  2 месяца назад +1

      bomba! ti va di dirci che stack tecnologico hai usato? magari può essere utile ad altri

    • @alessandrosalvaggio6772
      @alessandrosalvaggio6772 2 месяца назад

      @@RaffaeleGaito l’e-commerce nel caso specifico è un vecchio progetto in php/mysql/vanilla js
      è un sistema che ho realizzato diversi anni fa per clienti “piccoli”, tipo pasticcerie, rosticcerie ecc..
      ho creato poi diverse api custom come ad es. l’aggiornamento del catalogo prodotti (per prodotti “semplici”) tramite messaggio vocale su whatsapp e invio di una foto del prodotto (chiaramente poi da dentro la webapp, anche tramite smartphone si può modificare, aggiungere foto, opzioni del prodotto ecc), peró credimi, rendere “facile” l’aggiornamento da whatsapp è servito tantissimo per bypassare la “pigrizia mentale” nell’aggiornare i contenuti.
      riguardo al RAG ho creato un’api per estrarre i dati dal catalogo dell’ecommerce, la cui risposta è un json con tutti i campi ben in evidenza. poi ho creato in python un sistema che funge sia da api (ad es posso richiamarlo a whatsapp, sia da un plugin su wordpress, o direttamente come pagina web da embeddare in un sito) e che crea di fatto una chat. il bot per prima cosa quando viene avviato si crea in locale gli embeddings e quindi alimenta il db vettoriale dall’api di knowledgebase, quindi quando arriva una richiesta fa una ricerca tramite FAISS (quindi sempre in locale) sui documenti più rilevanti (in questo caso ho fatto una funzione che crea i chunk degli embeddings sulla base del singolo prodotto, non di “dimensioni” di testo e overlapping, quindi è molto preciso.
      per generare la risposta passo poi il tutto a gpt4o, a cui passo un prompt decisamente strutturato e anche data e ora attuale (nel fuso orario del cliente), in modo che possa rispondere anche a domande del tipo “posso ordinare per domani?” e se “doman” l’azienda è chiusa (i dati sugli orari arrivano sempre dal db dell’ecommerce, che contiene anche faq, ecc) il sistema correttamente risponde che il negozio è chiuso e propone alternative; questo funziona anche con gli orari, una cosa questa, che per esempio ho testato con chatbase ed altri sistemi simili e non funziona.
      poi tramite js ho creato qualche routine per mostrare le immagini dei prodotti (se presenti nel sistema e nella risposta) ma anche link (ad es. “come posso ordinare?” ti manda al form di contatto, piuttosto che ad altrre pagine specifiche.
      devo dire che il numero di “castronerie” (ad es. allucinazioni o risposte completamente inventate) è sceso moltissimo, anche se nelle risposte è sempre presente un disclaimer e il bot si presenta sempre come AI.

  • @lucaron9167
    @lucaron9167 2 месяца назад

    Come si crea un Rag? Inviando dei files a chatgpt?

    • @RaffaeleGaito
      @RaffaeleGaito  2 месяца назад

      uhm no 😅
      il video l'hai visto? hai visto lo schema super complesso che ho mostrato?

    • @lucaron9167
      @lucaron9167 2 месяца назад

      ​@@RaffaeleGaito eh si, speravo fosse più semplice 😅
      Nn é cosa che posso fare io in pratica, volevo avere la conferma 😢

  • @mikymarchese6570
    @mikymarchese6570 2 месяца назад

    grande Raf..... "io odio i capitan ovvio" 🤣🤣🤣 ... grazie come sempre per i tuoi contenuti..... e chi non mette un like è un "Capitan Ovvio" brutto e antipatico!! 😛😛

  • @LucianoZuncheddu
    @LucianoZuncheddu 2 месяца назад

    E io che penavo fosse un acronimo legato al tuo Nome e Cognome!

  • @pasqualebrescia
    @pasqualebrescia Месяц назад

    Anche NotebookLM di Google mi sembra una buona soluzione di RAG per principianti

  • @paolomerzek
    @paolomerzek 2 месяца назад

    Ma differenza RAG e GPTS mio?

    • @RaffaeleGaito
      @RaffaeleGaito  2 месяца назад

      risposto già in altri commenti ;)

  • @MassimilianoNicotra
    @MassimilianoNicotra 2 месяца назад

    la ricetta della carbonara è sacra! Claude non la sbaglierebbe!

  • @micolebellocchio8234
    @micolebellocchio8234 2 месяца назад

    RAG sta per Raffaele Gaito

  • @gianlucacamerini4770
    @gianlucacamerini4770 15 дней назад

    Bravo

  • @topastro
    @topastro 2 месяца назад +1

    Grazie.

    • @RaffaeleGaito
      @RaffaeleGaito  2 месяца назад

      grazie di cuore per la donazione