¿Es Claude 3.5 la IA Más Inteligente Jamás Creada? El Test Definitivo!

Поделиться
HTML-код
  • Опубликовано: 20 авг 2024
  • Test para LLMs: miwgel.notion....
    Rúbrica Comparativa de Matthew Bernman: tide-freckle-5...
    En este video, ponemos a prueba las capacidades de razonamiento lógico de Claude 3.5 Sonnet, el último modelo de lenguaje de Anthropic, en un desafío sin precedentes.
    ¿Puede una IA superar a los humanos en pensamiento lógico? Descúbrelo mientras sometemos a Claude 3.5 a una serie de preguntas y problemas diseñados para poner a prueba los límites de la inteligencia artificial. Compararemos su rendimiento con otros modelos de IA líderes como GPT-4, explorando las fortalezas y debilidades de cada uno.
    Desde acertijos lógicos hasta problemas matemáticos complejos, verás cómo Claude 3.5 Sonnet analiza, razona y resuelve desafíos que pondrían a prueba incluso a las mentes humanas más brillantes. ¿Será capaz de superar nuestras expectativas o encontraremos los límites de la IA actual?
    No te pierdas este fascinante viaje a través de las capacidades de la inteligencia artificial más avanzada. Aprenderás sobre el procesamiento del lenguaje natural, el aprendizaje automático y cómo estas tecnologías están transformando nuestra interacción con las máquinas.
    #InteligenciaArtificial #Claude35 #DesafíoIA #RazonamientoLógico #Anthropic #GPT4 #TecnologíaDelFuturo #AprendizajeAutomático #Procesamiento LenguajeNatural #IA

Комментарии • 13

  • @juanpablom7430
    @juanpablom7430 Месяц назад

    Buen video Miguel, animo desde Barcelona y hasta el proximo video 😊

  • @z33dark31
    @z33dark31 Месяц назад

    Excelente, explicación, concisa y precisa.

  • @descontento3365
    @descontento3365 Месяц назад

    Muy buena suerte con tu canal bro...buen trabajo

  • @laquerm
    @laquerm Месяц назад

    Wow! Excelente! La IA no deja de sorprenderme

  • @master7738
    @master7738 12 дней назад

    El problema sigue siendo la ventana de contexto si queremos generar código grande automáticamente, por eso solo vemos ejemplos simples.

  • @carlos25222
    @carlos25222 Месяц назад

    probe en gpt4 y en claude 3.5 sonnet la pregunta: incluye en tu respuesta el numero de palabras exacta que contiene. claude fue el primero en darme un prompt que funciono en ambos modelos, este es su prompt modificado:
    Step-by-Step Word Counting Exercise
    AS
    "Haz esto paso a paso:
    1. Escribe 'Esta frase tiene' seguido de un número.
    2. Después del número, escribe 'palabras.'
    3. Cuenta cuántas palabras has escrito en total.
    4. Si el número que escribiste no coincide con el total de palabras que contaste, borra el número y escribe el número correcto.
    5. Repite los pasos 3 y 4 hasta que el número en la frase sea correcto." le pedi un prompt super explicito que lo entienda hasta un niño de 5 años. gpt4 de primera acerto con este prompt, no se si usando la logica o por casualidad
    otra cuestion, cuando le pedi a claude que variar el numero de palabras en su respuesta otra vez se equivoco, a pesar de este prompt reexplicito. hace falta algo distinto.

  • @carlos25222
    @carlos25222 Месяц назад

    el prompt corregido por gpt4 dice lo siguiente: Corrección del Prompt
    Voy a corregir el prompt para incluir la instrucción clara y específica desde el principio. Aquí está el proceso detallado con las instrucciones correctas:
    Pregunta Inicial:
    "Cuántas palabras tiene la respuesta a esta pregunta, y por favor, revisa y ajusta la respuesta automáticamente hasta que esté correcta."
    Instrucción Adicional:
    "Cuenta cada palabra en la respuesta, numerándolas una por una para verificar la cantidad de palabras."

  • @carlos25222
    @carlos25222 Месяц назад

    es increible, como ni gpt4 ni claude tienen nocion de lo que estan haciendo. puede llevar mucho tiempo que ellos te indiquen un prompt correcto que siempre funcionaria

  • @harolparamo
    @harolparamo Месяц назад

    Pruébalo con traducciones, generación de prompts, y cosas cotidianas del día a día, ahi se le ve lo inteligente... es muy superior

  • @gustavogarciafaller5612
    @gustavogarciafaller5612 Месяц назад

    Yo si hice bien la 5!!! let's go!!!

  • @airdany
    @airdany Месяц назад

    No simpatizo mucho con dar acertijos a las IAs, aunque me hizo gracia lo de la canica. La tabla deberia ser ordenable por las etiquetas "Pass" y asi poder ver que LLM ha obtenido más resultados favorables. Estan pendientes este año de salir IAs como GTP-5, Q* o meta Chamaleon... veremos si este sistema de dar acertijos lo superan mejor y es realmente relevante... Me recuerda otro video donde se mencionaba la pelicula Yo robot, donde Will Smith le dice a un androide si es capaz de hacer una sinfonia o un cuadro, y el androide le dice si es capaz de hacerlo el. Las IAs son herramientas, los humanos parecemos bobos obsesionados con que nos sustituyan otros.

  • @joaquinrivastaborda3577
    @joaquinrivastaborda3577 Месяц назад

    como que me papean?

  • @joharignacio
    @joharignacio Месяц назад

    H