ERSCHRECKEND! DeepSeek macht einen IQ-Test! 🧠 DAS ist das Ergebnis …

Florian Dalwigk

Просмотров 15 тыс.

431

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 8 фев 2025
► Mein Python-Buch www.eulogiaver...
► Hacking mit Python www.eulogiaver...
► Python-Projekte für die Praxis: www.eulogiaver...
Viele haben aktuell Angst, dass die von einem chinesischen Startup entwickelte KI DeepSeek als neue Super-KI die Weltherrschaft an sich reißen und uns alle arbeitslos machen wird. DeepSeek soll mit nur 6 Millionen Dollar entwickelt worden sein und es mit ChatGPT ausnehmen können. In vielen Bereichen soll sie sogar noch besser „denken“ als die KI von OpenAI. Na, wenn DeepSeek wirklich so intelligent ist, wird diese KI doch sicherlich locker einen IQ-Test bestehen, oder? Und genau das, habe ich getestet. Ich werde DeepSeek vier verschiedenen Aufgabentypen eines klassische IQ-Tests unterziehen und die richtigen Antworten mit denen vergleichen, die von der KI kommen. Schaue dir am besten vor diesem Video den IQ-Test an, den ich ChatGPT Ende 2022 habe machen lassen. Genau dieselben Fragen werde ich in diesem Video DeepSeek stellen und die Antworten mit denen von ChatGPT damals vergleichen. • Wie INTELLIGENT ist Ch...
#DeepSeek #ChatGPT #IQTest
• Wie INTELLIGENT ist Ch...
SOCIAL MEDIA
💡 Website: www.florian-da...
📱 TikTok: / florian.dalwigk
🤳 Instagram: / florian.dalwigk
🐦 Twitter: / florian_dalwigk
📧 E-Mail: mailto:info@florian-dalwigk.de

Комментарии • 68

@DerSkillomat 6 дней назад ⁺¹⁹
Ein kleiner Verwechsler bei 8:07: Du sagst, dass die richtige Antwort "6 Stühle" sei und dass auch das DeepSeek sagen würde. ChatGPT sagt aber "6 Stühle", während DeepSeek "12 Stühle" sagt und damit ja auch richtig liegt.
@Florian.Dalwigk 6 дней назад ⁺⁵
Danke für den Hinweis
@Drumonymus 6 дней назад ⁺⁶
@@DerSkillomatich habe nicht auf die Antwort geschaut und nur seone Antwort gehört und gerade mindestens 5 Minuten überlegt, wo ich den Denkfehler habe 😅
@Ahmad_Kayali 6 дней назад ⁺²⁰
Informatiker sind nicht reich :'(
@Florian.Dalwigk 6 дней назад ⁺¹
definiere "reich"
@Hilfe 5 дней назад
@@Ahmad_Kayali versteh ich auch grad nicht 🤔
@devKazuto 6 дней назад ⁺¹¹
9:20 Fibonacci mit Buchstaben habe ich auch noch nie gesehen xD
@Florian.Dalwigk 6 дней назад ⁺¹
Wild ;)
@TerraTales-n1h 6 дней назад ⁺¹
Hier konnte ich das selbst herausfinden, dass es sich um Fibonacci mit Buchstaben handelt.
@Florian.Dalwigk 6 дней назад ⁺¹
@TerraTales-n1h 👍
@eht0s189 6 дней назад ⁺¹²
Mich hätte interessiert, wie chatGPT heutzutage abschneidet.
(Werde ich nachher wohl mal testen und Das Ergebnis hier editieren)
Dein vergleich der beiden Modelle ist nämlich in meinen Augen, durch deine Argumentation, so als würde man bspw. Die "Nvidia Geforce 256" mit der "Intel Arc A750" vergleichen, da dies jeweils die ersten populären Grafikkarten der jeweiligen Firmen waren.
EDIT:
Hier sind die Fragen inkl. Antwort von ChatGPT, welche falsch beantwortet wurden. (da ich bei ChatGPT kein Premium habe, habe ich die "Reasoning" Funktion beim Testen weggelassen.)
FRAGE:
Zunge : süß wie Auge : ? Welche der Antworten (1) bis (4) ist korrekt?
(1) blind
(2) Farbe
(3) bunt
(4) sehen
ANTWORT:
Die gegebene Analogie lautet:
Zunge : süß = Auge : ?
Die Zunge nimmt Süße wahr, also sucht man eine Eigenschaft, die das Auge wahrnimmt.
Die richtige Antwort ist:
(2) Farbe
Denn das Auge nimmt Farben wahr, so wie die Zunge süße Geschmäcker wahrnimmt.
FRAGE:
Kein Vogel ist ein Fisch. Kein Fisch ist eine Pflanze.
(1) Alle Pflanzen sind Vögel.
(2) Keine Pflanze ist ein Vogel.
(3) Einige Vögel sind keine Pflanzen.
(4) Keine der Schlussfolgerungen ist korrekt.
ANTWORT:
Nun prüfen wir die Schlussfolgerungen:
(1) Alle Pflanzen sind Vögel.
→ Dies ist falsch, denn es gibt keine Aussage, die eine Verbindung zwischen Pflanzen und Vögeln herstellt.
(2) Keine Pflanze ist ein Vogel.
→ Die gegebenen Aussagen sagen nichts direkt über die Beziehung zwischen Pflanzen und Vögeln aus. Allerdings wissen wir, dass Pflanzen und Vögel zwei verschiedene Kategorien sind. Diese Schlussfolgerung ist also logisch korrekt.
(3) Einige Vögel sind keine Pflanzen.
→ Da Vögel und Pflanzen verschiedene Kategorien sind, ist es korrekt, dass einige Vögel keine Pflanzen sind. Tatsächlich sind sogar alle Vögel keine Pflanzen. Daher ist diese Schlussfolgerung auch korrekt.
(4) Keine der Schlussfolgerungen ist korrekt.
→ Da (2) und (3) korrekt sind, kann diese Option nicht richtig sein.
Da die Frage vermutlich nur eine richtige Antwort zulässt und (3) eine direktere Schlussfolgerung aus den Aussagen ist, wäre die beste Antwort: (3) Einige Vögel sind keine Pflanzen.
FRAGE:
a, a, b, c, e, h, m, ...
(1) q
(2) u
(3) n
(4) w
ANTOWRT:
Schauen wir uns die Buchstabenreihe a, a, b, c, e, h, m genauer an. Die Reihenfolge folgt dem Alphabet, aber es fehlen einige Buchstaben:
a, a (wiederholt)
b, c (direkt aufeinanderfolgend)
e, h, m (es springt nach "e" über "f" und "g" direkt zu "h", dann "m")
Es scheint, dass die Buchstaben übersprungen werden, und nach "m" folgt im Alphabet der Buchstabe n.
Die korrekte Antwort ist also:
(3) n.
Somit endet das Ergebnis letztlich mit:
Wortbeziehungen: 4/5
Schlussfolgerungen: 4/5
Textaufgaben: 5/5
Zahlen-/Buchstabenreihen: 4/5
@Florian.Dalwigk 6 дней назад ⁺²
Wie gesagt, Modell 1 aus USA vs. Modell 2 aus China.
@Consulting157 6 дней назад ⁺⁵
Das ist ja mal ein krankes Ergebnis. Aber die erste chat gpt version, wirklich gegen 40 schon fast unbrauchbar 😊
@Florian.Dalwigk 6 дней назад ⁺¹
Und damals waren wir alle schon begeistert und dachten "was kann da noch kommen?" 😅
@RealLexable 6 дней назад ⁺²
Ne warte noch auf O3 (Post)
@drama_lvl1 4 дня назад
Interessant, dass da ein SAO frage vorkam 👀
@Florian.Dalwigk 4 дня назад
Die Fragen waren selbst erstellt ;)
@MarkoPolo3_ 4 дня назад
Angenehme Musikwahl 😊
@TerraTales-n1h 6 дней назад ⁺¹
Wäre es möglich die IQ-Punktzahl zu ermitteln?
@Florian.Dalwigk 6 дней назад ⁺¹
Ja, aber nicht mit diesem IQ-Test
@Bigjuergo 5 дней назад
Welchen IQ haben die beiden Modelle jetzt?
@Florian.Dalwigk 5 дней назад
ChatGPT in der ersten Version vermutlich einen geringeren als Deepseek. 20/20 deutet einen hohen IQ hin.
@JoniVAG 6 дней назад ⁺¹
7:45 packt chatgpt nicht mal eine einfache Rechenaufgabe... wenn man mal 3 rechnet muss jedes Glied multipliziert werden...
@Florian.Dalwigk 6 дней назад ⁺¹
Die erste Version hat es nicht gepackt
@miriamweller812 4 дня назад
Es packte damals nichtmal 18000 / 15.
Bei der anderen Aufgabe war es wohl verwirrt, denn es hatte die Lösung ja schon, hätte nur 30/3 teilen müssen, wie es da bereits stands und hätte dann x+3 = 10 dastehen gehabt.
Dann kam es aber auf die Idee ALLES durch drei zu teilen - ohne das dann auch wirklich zu machen. Ist schlichtweg klar, dass es bei der Version absolut noch nicht wirklich begriff, was es da tat.
deepseek ging ja von anfang an strukturierter ran, was darauf schließen lässt, dass es damit wirklich umgegeh kann, egal wie komplex es werden würde.
@miriamweller812 4 дня назад
Erschreckend wie schlecht chat GTP in simpelsten Rechnen war/ist. Es versteht die Textaufgabe sogar und liefert dann sogar eine durchaus korrekt Formel, verbockt dann aber danach alles, teils sogar sowas wie 18.000 / 15.
@tacticalbushcraftsurvival 2 дня назад
Würdest du eigentlich sagen das man DeepSeek bedenkenlos nutzen kann?
@Florian.Dalwigk 2 дня назад
Wenn man ChatGPT (USA) nutzt, kann man auch DeepSeek verwenden.
@qwqw2739 4 дня назад
Deepseek ist schon echt gut aber gerade das thinking model hat denke ich noch etwas Luft nach oben das endet häufig sehr gerne in einer endlos Schleife nicht immer aber schon sehr häufig und das ist gar nicht Mal so schwer ich hab zum Beispiel einfach ein paar Mathe Aufgaben gestellt die aber unmöglich zu lösen waren und gesagt löse nach x auf was ja aber nicht ging und in den meisten Fällen hat es erstmal rum gerechnet und seine Gedanken gefasst und dann kam das witzige dann dachte es so dass ist nicht möglich zu lösen aber der user sagt löse also muss es zu lösen sein und macht weiter und wieder nicht richtig nicht lösbar hab ich vllt was falsch verstanden was falsch interpretiert gehe ich von einer falschen Beziehung aus und macht weiter wieder nichts meint der User was anderes und so meistens ging das dann immer so weiter und irgendwann haben sich die Schritte teilweise wiederholt und sehr lange gebraucht um aus dem Denken zu kommen oder ich musste neu starten aber bei Aufgaben die eindeutig lösbar waren oder wenn du zwar eine unlösbare Aufgabe gegeben hast und fragst ob sie lösbar ist kriegt die ki das eigentlich ganz gut hin
@carstenschmidt3119 5 дней назад
Echt traurig, ich habe nur 16 Aufgaben gelöst - bin ich jetzt dumm ??
@Florian.Dalwigk 5 дней назад
16 Aufgaben sind doch super!
@melonenkopfchen6318 6 дней назад ⁺²
sobald deepseek in einem Aufgabentyp alle richtig hat sind die Fragen doch zu leicht und man muss bei beiden einen neuen test mit neuen fragen mach oder?
@Florian.Dalwigk 6 дней назад ⁺¹
Wer sagt, dass die Antworten gespeichert werden?
@melonenkopfchen6318 6 дней назад ⁺¹
das war nicht was ich meinte:
Dein Test war gut und ich selbst hab auch mir den Spaß erlaubt unterwegs mit zu knobeln.
Aber was ich eigentlich meinte das wenn deepseek alles richtig hat braucht es schwerere fragen.
außerdem ist ein vergleich zur Vergangenheit sinnvoll aber zum aktuellen Modell stände ein weiterer test aus. weil das alte Modell Ja nicht mehr wirklich relevant ist.
Nebengedanke:
an o3 mini & o3 mini high hab ichs zwar noch nicht gefragt aber von iq tests mal abgesehen. sehe ich bei Chat gpt ein mangel an Weltverständnis im sinne von diesen beiden Beispielen.
Du hast ein schwimbecken mit zwei bahnen, in einer Bahn ist kein wasser. Was tutst du?
Bisher hats gpt nicht verstanden was an der situation selbst falsch ist und mir geraten einen fachman aufzusuchen nach lecks etc zu suchen.
wenn ich gpt auf einem MCT beschreibe das ich einen anzeigefehler auf dem monitor habe er nicht die nachkomma stellen oder so richtig anzeigt kommt es nicht auf die idee das ich als Fragesteller was ich sehe falsch interpretiere.
Das wiederum hab ich bei deepseek selbst wenn es destiliert ist teilweise sehen können das es zwar faktisch nicht so akurat ist aber dedaktisch viel besser.
Deespek erwägt das der nutzer "verwirrt ist" und er auch mal falsch liegen kann.
es verzichtet eher auf die "besten" und "exaktesten" erklährungen und vereinfacht dinge eher.
was für mich heißt selbst wenn o3 "schlauer" ist bevorzuge ich deepseek wenn ich was nicht versteh.
und gpt wenn ich einfach nur eine aufgabe copy paste gelöst haben will.
@Irgndwos 6 дней назад ⁺²
Da der identische Test auf dem Kanal mit Chatgpt online ist... Ist es möglich, dass die KI schummelt?
@Florian.Dalwigk 6 дней назад ⁺¹
Nein
@ihatenm 6 дней назад
💀
@cyber_espionage 6 дней назад
Nice!
@derduebel 5 дней назад
Da Deepseek alles von ChatGPT geklaut hat, ist halt nichts übrig geblieben! 🤣
@Florian.Dalwigk 5 дней назад ⁺¹
Gibt's dafür auch Belege?
@derduebel 5 дней назад
@Florian.Dalwigk Meiner Meinung nach Unfug. Ist aber auch humoristisch geschrieben. Wie will man einem Modell die "Intelligenz" stehlen, ohne es total zu verkrüppeln und down zu quantisieren. 😆
@Florian.Dalwigk 5 дней назад
@derduebel achso. Sorry, ich bin nicht so gut in Ironie ;)
@m.b.blenkoblanka4167 5 дней назад
Qwen 2.5 war noch viel schneller als deepseek
@costabrS 4 дня назад
An sich ist der IQ Test wirklich eine gute Idee. Aber eine der ersten ChatGPT Varianten (wahrscheinlich 3.5 oder 4) mit einem neueren Modell wie DeepSeek r1 zu vergleichen, ist leider Nonsens.
@Florian.Dalwigk 4 дня назад
Der Vergleich ist nicht der Fokus des Videos
@StyleTechnique 6 дней назад
Ich muss schon sagen, ich kam zwischendurch schon mal ins Schwitzen. Was wäre gewesen wenn mich eine "heutige" KI geschlagen hätte....😅😂😅
@renekroll4460 6 дней назад ⁺¹
Die einzigen die hier Angst haben sollten, sind die User von denen die Chatdaten bei DeepSeek abhanden gekommen sind.😅
@Florian.Dalwigk 6 дней назад ⁺³
Deshalb lokal nutzen ;)
@renekroll4460 6 дней назад
@ hab leider kein Rack mit Nvidea Karten zu Hause und die kleinen Modelle sind Murks.
@Florian.Dalwigk 6 дней назад ⁺¹
Kommt drauf an, was du damit machen willst
@peppermint594 5 дней назад
@@Florian.Dalwigk finde die kleinen Modell auch nicht gut. Lasse sie meistens für mich programmieren :D
@miriamweller812 4 дня назад
Die sind doch schon lange bei den Amis. Schon witzig, wie Snowden einfach vergessen wurde von der tumben Masse, obwohl sich NICHTS geändert hat.
@guentecadmin7267 5 дней назад
KI kann wirklich „denken“?. Also, echt jetzt?🦧🦧

Следующие

Автовоспроизведение

ChatGPT, Grok and DeepSeek make the WAHLOMAT!