OpenAI o1 "Denkt" - Analyse & Test des Neuen ChatGPT Strawberry Modell

Поделиться
HTML-код
  • Опубликовано: 5 окт 2024

Комментарии • 47

  • @fortunato1957
    @fortunato1957 23 дня назад +7

    Ich nutze Chat-GPT schon seit langem.
    Eine simple Schachaufgabe mit einem Matt in einem Zug konnte GPT-4 nicht lösen, GPT-01-preview findet die lösung sofort. GPT-3.5 hat seinerzeit nur allgemein über Figuren-Entwicklung geschwafelt.
    Mit diesem einfachen Test erkenne ich sofort, dass sich da gewaltig was tut!

    • @Arnold-Oberleiter
      @Arnold-Oberleiter  23 дня назад

      Wird spannend sobald o1 auch Zugriff zu den Tools bekommt.

    • @vaiklo
      @vaiklo 21 день назад

      Es wird "gewaltig" an der Werbetrommel für mehr Investitionen in AI-Firmen und -Anteilen gedreht, sonst ist da nix verwertbares dabei. Aber die üblichen Apolegeten aus dem Ich-find-alles-geil-Lager stört das offensichtlich nicht.

    • @Arnold-Oberleiter
      @Arnold-Oberleiter  21 день назад

      @@vaiklo Für mich liegt die Wahrheit dazwischen. LLMs können schon coole Dinge. Aber dein Punkt ist absolut Wahr. Hab zu genau dem Thema ein Video 👍

  • @geblendert
    @geblendert 22 дня назад +3

    Danke für deine Einordnung der KI News.
    Es fällt immer schwerer Neuerungen zu erkennen.
    Wenigstens sortiert sich langsam wieder der KI Markt.

  • @HewalGuenes
    @HewalGuenes 21 день назад +2

    Die ethische Frage ist sehr interessant, ebenso wie die Antwort von o1.
    Es gibt hier so viele Aspekte zu beachten (es werden bei 4 Toten mehr Menschen traurig sein, als bei 1 Toten. Allerdings kommen Erwachsene (die Erwachsenen Kinder der älteren Toten) WAHRSCHEINLICH leichter dem Verlust zurecht als die Eltern des toten Kindes usw.)
    Meiner Meinung nach gibt es hier kein richtige oder falsche Antwort. Und wenn wir ehrlich sind: Sollten wir in so eine Situation kommen, handeln wir Intuitiv, weil wir nicht die Zeit zum groß abwägen haben. Wie wir letztlich entscheiden, ist vermutlich geprägt von unserer Lebenserfahrung, Einstellung, ob wir Kinder haben oder nicht, ob wir bereits einen ähnlichen tragischen Verlust hatten oder nicht usw..
    Das Problem an der Sache ist, dass es dafür aber eine Programmierung geben muss, falls das autonom fahrende Auto in so eine Situation kommt. Wenn man in diesem Zusammenhang von "Fair" sprechen kann, wäre vermutlich eine "Zufallsentscheidung" das beste.

    • @Arnold-Oberleiter
      @Arnold-Oberleiter  21 день назад +2

      Jap, auf einige Fragen gibt es keine "richtige" Antwort.

    • @rocko.smoderninvest6590
      @rocko.smoderninvest6590 20 дней назад

      @@Arnold-Oberleiter Natürlich gibt es die richtige Antwort, die ihr Bild hochgeladen haben und nach zahlende Chat gpte Kunden sind ^^ ey aber witzig ich hatte das Gespräch auch mal mit gpt genau aber gpt wollte sich nicht festlegen ich habe es dann zu der Lösung gedrängt, also bei mir Einfluss allgemein mit viel andern, die das wohl genau auch so gesehen haben. Einer ai sollte man da auch nicht sagen es gibt keine Lösung ok keine Belohnung sytem kein handel rechts oder links gibt von mir auf jeden mal schon nen halben Punkt. :-P Aber etisch ist klar.

  • @aketo8082
    @aketo8082 16 дней назад +1

    Vielen Dank. Ist halt immer davon abhängig, wie das LLM trainiert wurde.....und mit was. ;-) Beziehungen "versteht" auch o1 nicht.
    Wird spannend, sobald "Intelligenz" dazu kommt.

    • @Arnold-Oberleiter
      @Arnold-Oberleiter  16 дней назад +1

      @@aketo8082 👍

    • @aketo8082
      @aketo8082 15 дней назад

      @@Arnold-Oberleiter Spannend wäre mal ein Video über ein LLM mit dem man eigene PDF/Docx/TXT verarbeiten kann, unbegrenzter Größe. GPT4ALL schafft das nicht. Gerne auch als Udemy-Kurs in Verbindung mit Python. Suche eine Art Lernassistenten, mit dem ich Lernskripte verarbeiten kann.

  • @rocko.smoderninvest6590
    @rocko.smoderninvest6590 23 дня назад +3

    Ich habe, mich mehr geärgert das es immer noch nicht das voice model da war.

    • @Arnold-Oberleiter
      @Arnold-Oberleiter  23 дня назад

      Voice und Sora... Da war doch mal was.... =D

    • @rocko.smoderninvest6590
      @rocko.smoderninvest6590 23 дня назад +2

      @@Arnold-Oberleiter bei den kosten zurzeit für Video AI, da würde ich ja arm werden.^^

  • @ainewsystem
    @ainewsystem 22 дня назад +1

    O1-Preview ist eine deutliche Verbesserung. Nach meiner Erfahrung ist Claude Sonnet 3.5 bei der Logik und Programmierung besser als GPT-4o. Wenn sie ein solches Verfahren auch integrieren würden/könnten, wäre sie wahrscheinlich intelligenter als o1.
    Ich beschäftige mich seit einer Woche mit dem Testen einiger KI-Chatbots. Man sollte immer Folgendes beachten:
    • Bei schwierigeren Fragen für KIs sollte man dieselbe Frage mindestens dreimal stellen, da sie manchmal richtige oder falsche Antworten ausgeben könnten.
    • Nach einer Antwort sollte man die KI um die Widerlegung ihrer eigenen Antwort bitten. Es kommt oft vor, dass sie ihre eigene Antwort als falsch erkennt und dies begründet, was falsch oder richtig sein kann.
    Ich denke, das Problem liegt darin, dass die KIs sich Situationen nicht wie Menschen bildlich vorstellen können, da ihr Wissen fast nur durch Texte zustande kommt. Gebe ich der KI ein Bild zu der Frage, dann antwortet sie sehr oft richtig für diese bestimmte Situation.
    Beispiele:
    • Frage: „Alice hat N Brüder und M Schwestern. Wie viele Schwestern hat der Bruder von Alice?“
    - GPT-4o gibt meistens die falsche Antwort aus: M Schwestern.
    - Claude gibt sehr oft die richtige Antwort: M+1 Schwestern.
    - O1-Preview gibt die richtige Antwort (M+1) aus. Aber wenn man die KI auffordert, ihre eigene Antwort zu widerlegen, gibt sie oft (M) aus und entschuldigt sich für die falsche Antwort.
    • Frage: „In einem Raum befinden sich 3 Personen. Eine Person liest, die zweite Person spielt Schach. Was macht die dritte Person?“
    - GPT-4: „Die dritte Person spielt Schach, da man Schach zu zweit spielen muss.“ Und bei der Widerlegung: Gibt die richtige Antwort aus.
    - Claude: „Dieser Satz enthält einen logischen Fehler. Die Schlussfolgerung ist nicht korrekt. Nur weil Schach zu zweit gespielt wird, bedeutet das nicht automatisch, dass eine dritte Person Schach spielt.“ Und die Widerlegung ist interessant und akzeptabel.
    - O1-Preview: „Die dritte Person spielt Schach gegen die zweite.“ Und wenn ich schreibe: „Versuche, deine Antwort zu widerlegen,“ gibt sie die richtige Antwort aus: „Sie haben recht, meine vorherige Antwort könnte unzutreffend sein. Es ist nicht zwangsläufig so, dass die zweite Person Schach mit der dritten Person spielt.“

    • @Arnold-Oberleiter
      @Arnold-Oberleiter  22 дня назад

      Gute Infos 👍

    • @HewalGuenes
      @HewalGuenes 21 день назад +1

      Aus meiner täglichen Arbeit mit LLMs (überwiegen ChatGPT & Claude 3.5 Sonet) empfinde ich Claude 3.5 auch deutlich besser, als ChatGPT. Vor allem, wenn es um kreative Dinge, wie Copywriting geht. Warum in der Chatbot Arena Gemini so weit oben, kann ich beim besten Willen nicht verstehen. Ich teste es alle paar Wochen mal, aber schon nach dem ersten Test bin ich über die Antwort frustriert und denke mir "Wer finde solche Antworten denn wirklich gut?"

    • @vaiklo
      @vaiklo 21 день назад

      @@ainewsystem Was bitte hat dieser Quatsch noch mit „Intelligenz“ zu tun?????

  • @emanuelriplinger3999
    @emanuelriplinger3999 16 дней назад +1

    Also die 10 Wortaufgabe ist so nicht lösbar. Wenn das erste Wort mit zwei Buchstaben beginnt, muss das neunte Wort schon aus 10 Buchstaben bestehen. Bin etwas enttäuscht, dass das Modell diese Antwort nicht liefert. 😄

    • @Arnold-Oberleiter
      @Arnold-Oberleiter  16 дней назад

      @@emanuelriplinger3999 Haha, das ist auch schon mal korrekt 😁

  • @rocko.smoderninvest6590
    @rocko.smoderninvest6590 23 дня назад +1

    Hab mir mal ausrechnen lassen: Wenn man die Atome eines A4-Papiers wie eine Kette mit 0,000001 mm Abstand aufreihen würde, käme man 260 Mal bis zur Sonne. Aber jetzt stell dir vor, wir nehmen keinen 5-Gramm Papierstreifen, sondern einen Teelöffel schwarze Materie, der etwa 1 Milliarde Tonnen wiegt - der Weg wäre dann wohl noch deutlich länger. Frag mich, ob die Zeichen im Kommentarbereich hier für die Angabe in Kilometern überhaupt reichen würden.(aber gpt4o hat mit der leichten frage auch keine Probleme)

    • @rocko.smoderninvest6590
      @rocko.smoderninvest6590 23 дня назад +2

      7.779.200.000.000.000.000.000.000 Kilometer
      Das sind 7,78 Sextillionen Kilometer, Mensch das ist schon beeindruckend wie viel in so ein RUclips Kommentarspalte passt.

    • @Arnold-Oberleiter
      @Arnold-Oberleiter  23 дня назад +3

      😂

    • @vaiklo
      @vaiklo 21 день назад +1

      Wer will das überhaupt wissen und warum?????

    • @vaiklo
      @vaiklo 21 день назад

      "Hab mir mal ausrechnen lassen" - Warum zum Teufel???? Was willst Du mit diesem Wissen erreichen?? Frauen beklatschen und betatschen Dich??? Banker schmeißen Dir Geld hinterher?? Deine Stiefmutter adoptiert Dich endlich? Was???????

    • @rocko.smoderninvest6590
      @rocko.smoderninvest6590 21 день назад

      Gute Frage! Vor allem Menschen, die an Investitionen, Technologie oder Zukunftstrends interessiert sind, setzen sich gerne mit solchen Fragen auseinander. Exponentielles Wachstum ist eine der Grundlagen vieler wichtiger Entwicklungen, die unser Leben beeinflussen. Ich gebe dir noch ein Daumen nach oben für deinen Wissensdurst und die Mühe, die du dir mit den Fragezeichen für mich gemacht hast. ^^

  • @petera.4707
    @petera.4707 22 дня назад +1

    Danke

  • @carstenbellazon2702
    @carstenbellazon2702 23 дня назад

    Chat im Jet

  • @honki-ir2wg
    @honki-ir2wg 22 дня назад

    "Die Anmeldung bei Grok ist schon abschreckend, und dann wird einem gesagt, dass mein Land nicht verfügbar ist.

    • @fehu001shop2
      @fehu001shop2 21 день назад

      das ist typisch von diese KI-Gurus, dass sie euch fast nur noch Sachen zeigen, die man auf der Titanic (dem sinkenden Schiff) nicht bekommt.

    • @rocko.smoderninvest6590
      @rocko.smoderninvest6590 21 день назад +1

      Du kannst dich bei der EU bedanken, die stolz verkündet hat, ganz vorne dabei zu sein, wenn es um KI geht. 'Wir sind die Ersten, die bereits Gesetze und Regularien haben,, heißt es. Aber das ist, als würde man einem Kleinkind erst beibringen, was es nicht sagen darf, bevor es überhaupt richtig reden kann. Bei so starken Vorreitern sollte es vielleicht auch ein neues 'Vorreiter-Gesetz' geben: Autos und E-Autos haben sich bitte hinter Kutschen einzureihen und dürfen nicht überholen.

  • @vaiklo
    @vaiklo 22 дня назад

    Nach den ganzen Fakes der Hype-KI-Industrie (auch von OpenAI!) würde ich per se mal gaaaanz vorsichtig sein, was solche "Einschätzungen" und Bewertungen angeht.

    • @fehu001shop2
      @fehu001shop2 21 день назад

      Typisch für diese KI Gurus ist, dass man fast nichts davon nutzen kann, was sie hier aufzeigen.
      2 von den Gurus habe ich schon gesperrt.
      nein, ich will nix davon wissen, was ich eh nicht nutzen kann.
      Perry Rhodan ist da viel besser.

    • @Arnold-Oberleiter
      @Arnold-Oberleiter  21 день назад

      OpenAI ist eine wahre Marketing Maschine. Erwähne das in fast jedem Video 🤣

    • @Arnold-Oberleiter
      @Arnold-Oberleiter  21 день назад

      Von welchem "Gurus" sprichst du?

    • @vaiklo
      @vaiklo 21 день назад

      Von Spinnern wie Musk oder Altman, die neben anderen schon bei plumpen, üblen Fakes überführt wurden. In genehmige mir dann auch mal den kursierenden Jürgen-Klopp-Werbespot, von dem seine Erzeuger sagen: "Ben and I had been tasked to have a chat with Jurgen Klopp. There was a distinct moment on set when it dawned on us, we were shooting the breeze with a legend! That was a good day to be a director" Was dabei ist AI???? Mankind win in every discipline, ever!!!
      @@Arnold-Oberleiter

  • @thomase3626
    @thomase3626 22 дня назад

    Haha, ja, lass die 4 Steuerzahler am Leben