ChatGPT o1 preview: il test dell'IA che "pensa"

Поделиться
HTML-код
  • Опубликовано: 7 ноя 2024

Комментарии • 48

  • @alfadelta-d1d
    @alfadelta-d1d Месяц назад +5

    12:28 il fatto che abbia veramente capito il senso della barzelletta della mucca pazza mi ha veramente impressionato!

  • @α3026-μ1λ
    @α3026-μ1λ Месяц назад +14

    Non ti ha mostrato il CoT della frase palindroma perché “i topi non avevano nipoti” è una frase estremamente celebre tra quelle palindrome, molto probabilmente - più che troppo facile - era già presente nel dataset tale e quale.

    • @VincenzoCosenza
      @VincenzoCosenza  Месяц назад +1

      grazie, potrebbe essere come dici.

    • @DaveJ6515
      @DaveJ6515 Месяц назад +1

      @@VincenzoCosenza e tra l’altro è quello che succede anche con gli esseri umani: uno stesso problema può risultare difficilissimo per chi lo vede per la prima volta, mentre chi lo ha già incontrato, molto semplicemente si ricorda il percorso per rispondere. Ed è un grosso confounder quando devi valutare le doti di pensiero creativo.

    • @CRESCOCHANNEL
      @CRESCOCHANNEL Месяц назад +1

      Confermo. E’ veramente il palindromo più celebre in assoluto, credo.

    • @alfadelta-d1d
      @alfadelta-d1d Месяц назад +2

      @@CRESCOCHANNEL ...dopo "amori di roma" ovviamente! ; )

    • @CRESCOCHANNEL
      @CRESCOCHANNEL Месяц назад +1

      @@alfadelta-d1d E "Ai lati d'Italia" :)

  • @Romafood
    @Romafood Месяц назад +1

    Complimenti per i 10k iscritti 👏

  • @PerseRos285
    @PerseRos285 Месяц назад +3

    Ottimo video, tra i più approfonditi sul web! Grazie

  • @bat84car
    @bat84car Месяц назад +4

    Ho testato sonnet 3.5 e GPT4o con molti dei tuoi test, e sonnet 3.5 non ha sbagliato quasi nulla nei ragionameni, elencandomi anche i passaggi. Credo che Anthropics stia facendo un grande lavoro.

    • @VincenzoCosenza
      @VincenzoCosenza  Месяц назад

      nei miei testi invece li sbagliava i miei prompt. strano

    • @bat84car
      @bat84car Месяц назад

      @@VincenzoCosenza
      Un esempio sul test delle 12 sorelle con Sonnet 3.5, risposte strutturate in modo simile al nuovo modello di openai.
      Per rispondere correttamente a questa domanda, dobbiamo fare alcune considerazioni:
      1. Sappiamo che Carla ha 12 sorelle e 12 fratelli.
      2. Carla stessa è una delle sorelle nella famiglia.
      3. Andrea è uno dei fratelli di Carla.
      Quindi, per calcolare quante sorelle ha Andrea, dobbiamo:
      1. Contare tutte le sorelle di Carla (12)
      2. Aggiungere Carla stessa al conteggio, perché è anche lei una sorella di Andrea
      Quindi, il calcolo è:
      12 (sorelle di Carla) + 1 (Carla stessa) = 13
      Quindi, Andrea ha 13 sorelle.

  • @paolosorgente7097
    @paolosorgente7097 Месяц назад

    ciao Vincenzo ottimo video alla portata di tutti , mi permetto un osservazione volume microfono credo sia un po' basso , c'è chi come me nei ritagli di tempo , metro.. o traffico riesce a percepire a fatica

  • @Francesco_Ambrosino.
    @Francesco_Ambrosino. Месяц назад +4

    Porta dei video sul reddito di base universale

  • @FedericoGiampietro
    @FedericoGiampietro Месяц назад

    Finalmente qualcuno che cerca di capire quanto una intelligenza artificiale sia realmente intelligente e non quanto sia precisa.
    I miei complimenti, più unico che raro.

    • @VincenzoCosenza
      @VincenzoCosenza  Месяц назад

      Grazie Federico, molto gentile!

    • @FedericoGiampietro
      @FedericoGiampietro Месяц назад

      @@VincenzoCosenza
      Dovuto Vincenzo, da una intelligenza mi aspetto che sia... intelligente.
      Essere precisa è già una cosa differente e non necessariamente determinate, perché a differenza delle macchine le capacità cognitive sono basate su processi deduttivi e non numerici.
      Mi sono iscritto al tuo canale, nella notte dei tempi mi ritrovai con un master annuale in mkt, mai usato come tale, però mi ha insegnato come rendere adatto alle richieste del mercato il più importante dei prodotti: me stesso!
      Un ripasso non farà male 😉

  • @Francesco_Ambrosino.
    @Francesco_Ambrosino. Месяц назад +1

    quanto manca al 100% di guida autonoma di livello 5 sicura! e a che livello di guida autonoma siamo ora? Tesla ha raggiunto un livello 3 avanzato? o sono sfumature di un livello 4? (intendo l'inizio)

  • @LucaGiovanniGuelfo
    @LucaGiovanniGuelfo Месяц назад

    Ottimi test credo un ottimo passo avanti per attività specifiche di ricerca medica o scientifica non per giocare con le parole.

    • @VincenzoCosenza
      @VincenzoCosenza  Месяц назад

      assolutamente si. Forse tra 10 anni daremo un nobel ad un'AI :)

  • @alfadelta-d1d
    @alfadelta-d1d Месяц назад

    mi spingo a considerare che le risposte ai test da te fatti possono essere considerate con un indulgente "non male" da noi, cioe' una fascia del 20% di popolazione evoluta e acculturata che sta su internet. La verità e' che su fermassi la gente per strada, l' 80% della gente risponderebbe "in che senso?" alla domanda sulla "terza parola della tua risposta" e "...e che diavolo e'?" alla domanda sul palindromo. Se poi girassi nei paraggi della stazione, mi sa che una buona percentuale di individui non capirebbe nemmeno la lingua usata per fare la domanda... Tutto cio' per dire che l' AI magari non raggiunge ancora i livelli del ragionamento umano... ma comunque sembra che nel frattempo il livello medio stia scendendo un sacco per facilitargli il traguardo!

  • @francescolamazza5594
    @francescolamazza5594 Месяц назад

    Servono a risolvere quei problemi complessi... tipo contare le lettere di una parola

  • @stefaniaciaschi
    @stefaniaciaschi Месяц назад

    molto bravo

  • @dariomartino3747
    @dariomartino3747 Месяц назад +1

    nell'ultima richiesta 24:54 sta usando GPT 4o, non o1

    • @VincenzoCosenza
      @VincenzoCosenza  Месяц назад +1

      subito dopo la stessa richiesta la faccio fare a o1 per confrontarle

    • @dariomartino3747
      @dariomartino3747 Месяц назад

      @@VincenzoCosenza Ah è vero 😅

  • @lipranditoys
    @lipranditoys Месяц назад

    Ho testato ChatGPT in lungo e in largo, sono un informatico di mestiere: in realtà commette frequenti e grossolani errori. Quelli che esegue non sono veri ragionamenti.

  • @vincenzo42garcia75
    @vincenzo42garcia75 Месяц назад

    Ciao quando apro chatgpt non mi compaiono i modelli che compaiono a te nel video c'è tutt'altra schermata

  • @alfonsocataldi1282
    @alfonsocataldi1282 Месяц назад

    Pensa come un liceale al primo anno che non sa fare gli esercizi. Questo non lo ha risolto, nemmeno quando gli ho detto il risultato, ha saputo trovare l'età dei quattro Quattro fratelli hanno un età tale che il prodotto è 882. Ogni fratello ha meno di 18 anni e i quattro fratelli hanno età diverse. Quanto fa la somma delle quattro età?

  • @pyroflash64
    @pyroflash64 Месяц назад +2

    si chiama gpt o1 non gpt4 o1

    • @VincenzoCosenza
      @VincenzoCosenza  Месяц назад +2

      sorry la fretta. Comunque il nome corretto è solo o1

    • @pyroflash64
      @pyroflash64 Месяц назад +1

      @@VincenzoCosenza tranquillo sono io che sono pignolo. bè a dirla tutta è vero il nome è solamente o1

    • @VincenzoCosenza
      @VincenzoCosenza  Месяц назад +2

      @@pyroflash64 no hai fatto bene a precisarlo, fanno un casino con questi nomi. grazie

  • @PhotoSlash
    @PhotoSlash Месяц назад

    bah non mi pare cosi degno di un iscrizione mensile ancora, secondo me il livello di creatività è ancora acerbo

  • @giuseppestorelli8177
    @giuseppestorelli8177 Месяц назад

    Onestamente credo che i test che hai effettuato non siano esattamente centrati rispetto ai punti di forza di questo nuovo modello ovvero programmazione, calcolo e analisi dati. Chiaramente hai lavorato utilizzando i prompt della tua nicchia professionale e ci sta.

    • @VincenzoCosenza
      @VincenzoCosenza  Месяц назад +2

      Si certo, non è il mio campo. Ma ho detto per cosa è il modello. L'obiettivo era capire se può essere utile nella mia nicchia