Non ti ha mostrato il CoT della frase palindroma perché “i topi non avevano nipoti” è una frase estremamente celebre tra quelle palindrome, molto probabilmente - più che troppo facile - era già presente nel dataset tale e quale.
@@VincenzoCosenza e tra l’altro è quello che succede anche con gli esseri umani: uno stesso problema può risultare difficilissimo per chi lo vede per la prima volta, mentre chi lo ha già incontrato, molto semplicemente si ricorda il percorso per rispondere. Ed è un grosso confounder quando devi valutare le doti di pensiero creativo.
Ho testato sonnet 3.5 e GPT4o con molti dei tuoi test, e sonnet 3.5 non ha sbagliato quasi nulla nei ragionameni, elencandomi anche i passaggi. Credo che Anthropics stia facendo un grande lavoro.
@@VincenzoCosenza Un esempio sul test delle 12 sorelle con Sonnet 3.5, risposte strutturate in modo simile al nuovo modello di openai. Per rispondere correttamente a questa domanda, dobbiamo fare alcune considerazioni: 1. Sappiamo che Carla ha 12 sorelle e 12 fratelli. 2. Carla stessa è una delle sorelle nella famiglia. 3. Andrea è uno dei fratelli di Carla. Quindi, per calcolare quante sorelle ha Andrea, dobbiamo: 1. Contare tutte le sorelle di Carla (12) 2. Aggiungere Carla stessa al conteggio, perché è anche lei una sorella di Andrea Quindi, il calcolo è: 12 (sorelle di Carla) + 1 (Carla stessa) = 13 Quindi, Andrea ha 13 sorelle.
ciao Vincenzo ottimo video alla portata di tutti , mi permetto un osservazione volume microfono credo sia un po' basso , c'è chi come me nei ritagli di tempo , metro.. o traffico riesce a percepire a fatica
Finalmente qualcuno che cerca di capire quanto una intelligenza artificiale sia realmente intelligente e non quanto sia precisa. I miei complimenti, più unico che raro.
@@VincenzoCosenza Dovuto Vincenzo, da una intelligenza mi aspetto che sia... intelligente. Essere precisa è già una cosa differente e non necessariamente determinate, perché a differenza delle macchine le capacità cognitive sono basate su processi deduttivi e non numerici. Mi sono iscritto al tuo canale, nella notte dei tempi mi ritrovai con un master annuale in mkt, mai usato come tale, però mi ha insegnato come rendere adatto alle richieste del mercato il più importante dei prodotti: me stesso! Un ripasso non farà male 😉
quanto manca al 100% di guida autonoma di livello 5 sicura! e a che livello di guida autonoma siamo ora? Tesla ha raggiunto un livello 3 avanzato? o sono sfumature di un livello 4? (intendo l'inizio)
mi spingo a considerare che le risposte ai test da te fatti possono essere considerate con un indulgente "non male" da noi, cioe' una fascia del 20% di popolazione evoluta e acculturata che sta su internet. La verità e' che su fermassi la gente per strada, l' 80% della gente risponderebbe "in che senso?" alla domanda sulla "terza parola della tua risposta" e "...e che diavolo e'?" alla domanda sul palindromo. Se poi girassi nei paraggi della stazione, mi sa che una buona percentuale di individui non capirebbe nemmeno la lingua usata per fare la domanda... Tutto cio' per dire che l' AI magari non raggiunge ancora i livelli del ragionamento umano... ma comunque sembra che nel frattempo il livello medio stia scendendo un sacco per facilitargli il traguardo!
Ho testato ChatGPT in lungo e in largo, sono un informatico di mestiere: in realtà commette frequenti e grossolani errori. Quelli che esegue non sono veri ragionamenti.
Pensa come un liceale al primo anno che non sa fare gli esercizi. Questo non lo ha risolto, nemmeno quando gli ho detto il risultato, ha saputo trovare l'età dei quattro Quattro fratelli hanno un età tale che il prodotto è 882. Ogni fratello ha meno di 18 anni e i quattro fratelli hanno età diverse. Quanto fa la somma delle quattro età?
Onestamente credo che i test che hai effettuato non siano esattamente centrati rispetto ai punti di forza di questo nuovo modello ovvero programmazione, calcolo e analisi dati. Chiaramente hai lavorato utilizzando i prompt della tua nicchia professionale e ci sta.
12:28 il fatto che abbia veramente capito il senso della barzelletta della mucca pazza mi ha veramente impressionato!
Non ti ha mostrato il CoT della frase palindroma perché “i topi non avevano nipoti” è una frase estremamente celebre tra quelle palindrome, molto probabilmente - più che troppo facile - era già presente nel dataset tale e quale.
grazie, potrebbe essere come dici.
@@VincenzoCosenza e tra l’altro è quello che succede anche con gli esseri umani: uno stesso problema può risultare difficilissimo per chi lo vede per la prima volta, mentre chi lo ha già incontrato, molto semplicemente si ricorda il percorso per rispondere. Ed è un grosso confounder quando devi valutare le doti di pensiero creativo.
Confermo. E’ veramente il palindromo più celebre in assoluto, credo.
@@CRESCOCHANNEL ...dopo "amori di roma" ovviamente! ; )
@@alfadelta-d1d E "Ai lati d'Italia" :)
Complimenti per i 10k iscritti 👏
grazie!
Ottimo video, tra i più approfonditi sul web! Grazie
Mi fa piacere Grazie!
Ho testato sonnet 3.5 e GPT4o con molti dei tuoi test, e sonnet 3.5 non ha sbagliato quasi nulla nei ragionameni, elencandomi anche i passaggi. Credo che Anthropics stia facendo un grande lavoro.
nei miei testi invece li sbagliava i miei prompt. strano
@@VincenzoCosenza
Un esempio sul test delle 12 sorelle con Sonnet 3.5, risposte strutturate in modo simile al nuovo modello di openai.
Per rispondere correttamente a questa domanda, dobbiamo fare alcune considerazioni:
1. Sappiamo che Carla ha 12 sorelle e 12 fratelli.
2. Carla stessa è una delle sorelle nella famiglia.
3. Andrea è uno dei fratelli di Carla.
Quindi, per calcolare quante sorelle ha Andrea, dobbiamo:
1. Contare tutte le sorelle di Carla (12)
2. Aggiungere Carla stessa al conteggio, perché è anche lei una sorella di Andrea
Quindi, il calcolo è:
12 (sorelle di Carla) + 1 (Carla stessa) = 13
Quindi, Andrea ha 13 sorelle.
ciao Vincenzo ottimo video alla portata di tutti , mi permetto un osservazione volume microfono credo sia un po' basso , c'è chi come me nei ritagli di tempo , metro.. o traffico riesce a percepire a fatica
grazie Paolo! Ci farò attenzione
Porta dei video sul reddito di base universale
Finalmente qualcuno che cerca di capire quanto una intelligenza artificiale sia realmente intelligente e non quanto sia precisa.
I miei complimenti, più unico che raro.
Grazie Federico, molto gentile!
@@VincenzoCosenza
Dovuto Vincenzo, da una intelligenza mi aspetto che sia... intelligente.
Essere precisa è già una cosa differente e non necessariamente determinate, perché a differenza delle macchine le capacità cognitive sono basate su processi deduttivi e non numerici.
Mi sono iscritto al tuo canale, nella notte dei tempi mi ritrovai con un master annuale in mkt, mai usato come tale, però mi ha insegnato come rendere adatto alle richieste del mercato il più importante dei prodotti: me stesso!
Un ripasso non farà male 😉
quanto manca al 100% di guida autonoma di livello 5 sicura! e a che livello di guida autonoma siamo ora? Tesla ha raggiunto un livello 3 avanzato? o sono sfumature di un livello 4? (intendo l'inizio)
Ottimi test credo un ottimo passo avanti per attività specifiche di ricerca medica o scientifica non per giocare con le parole.
assolutamente si. Forse tra 10 anni daremo un nobel ad un'AI :)
mi spingo a considerare che le risposte ai test da te fatti possono essere considerate con un indulgente "non male" da noi, cioe' una fascia del 20% di popolazione evoluta e acculturata che sta su internet. La verità e' che su fermassi la gente per strada, l' 80% della gente risponderebbe "in che senso?" alla domanda sulla "terza parola della tua risposta" e "...e che diavolo e'?" alla domanda sul palindromo. Se poi girassi nei paraggi della stazione, mi sa che una buona percentuale di individui non capirebbe nemmeno la lingua usata per fare la domanda... Tutto cio' per dire che l' AI magari non raggiunge ancora i livelli del ragionamento umano... ma comunque sembra che nel frattempo il livello medio stia scendendo un sacco per facilitargli il traguardo!
Servono a risolvere quei problemi complessi... tipo contare le lettere di una parola
molto bravo
Grazie Stefania
nell'ultima richiesta 24:54 sta usando GPT 4o, non o1
subito dopo la stessa richiesta la faccio fare a o1 per confrontarle
@@VincenzoCosenza Ah è vero 😅
Ho testato ChatGPT in lungo e in largo, sono un informatico di mestiere: in realtà commette frequenti e grossolani errori. Quelli che esegue non sono veri ragionamenti.
tipo?
Ciao quando apro chatgpt non mi compaiono i modelli che compaiono a te nel video c'è tutt'altra schermata
@@vincenzo42garcia75 hai la versione a pagamento?
hai la versione a pagamento?
Pensa come un liceale al primo anno che non sa fare gli esercizi. Questo non lo ha risolto, nemmeno quando gli ho detto il risultato, ha saputo trovare l'età dei quattro Quattro fratelli hanno un età tale che il prodotto è 882. Ogni fratello ha meno di 18 anni e i quattro fratelli hanno età diverse. Quanto fa la somma delle quattro età?
si chiama gpt o1 non gpt4 o1
sorry la fretta. Comunque il nome corretto è solo o1
@@VincenzoCosenza tranquillo sono io che sono pignolo. bè a dirla tutta è vero il nome è solamente o1
@@pyroflash64 no hai fatto bene a precisarlo, fanno un casino con questi nomi. grazie
bah non mi pare cosi degno di un iscrizione mensile ancora, secondo me il livello di creatività è ancora acerbo
Onestamente credo che i test che hai effettuato non siano esattamente centrati rispetto ai punti di forza di questo nuovo modello ovvero programmazione, calcolo e analisi dati. Chiaramente hai lavorato utilizzando i prompt della tua nicchia professionale e ci sta.
Si certo, non è il mio campo. Ma ho detto per cosa è il modello. L'obiettivo era capire se può essere utile nella mia nicchia