Обзор Claude 3,5 - КРУЧЕ и ДЕШЕВЛЕ чем GPT4-o

Поделиться
HTML-код
  • Опубликовано: 27 дек 2024

Комментарии • 124

  • @igormel5137
    @igormel5137 6 месяцев назад +14

    Попробовал модельку. Конечно сильно впечатлился. GPT-4o очень неплох. Но блин многие из моих задач он не мог решить даже через 10 запросов, Клауд многие из них сделал с 1-го раза как надо.

    • @Webdesus
      @Webdesus 6 месяцев назад +1

      А не пробовал потом перегенерировать ответ с GPT 4 . Потому что мне этот 4о совсем не нравится. Сначала было подозрение что кажется. но потом нашел кнопку перегенерировать ответ в другой модели и прям офигел. GPT 4 отвечает как надо, 4o постоянно одну пластинку крутит, толком не отвечая на вопрос. Такое ощущение что это 3.5 с новым шильзиком🙃

    • @AndreyrifRu
      @AndreyrifRu 6 месяцев назад

      А какие задачи например?

    • @igormel5137
      @igormel5137 6 месяцев назад

      @@AndreyrifRu К примеру ханойские башни смоделировать что бы 5 дисков перетасовало с анимацией

    • @igormel5137
      @igormel5137 6 месяцев назад

      @@Webdesus Тоже слышал что gpt 4 получше чем омни. Но не пробовал. Надо бы попробовать.

    • @Webdesus
      @Webdesus 6 месяцев назад

      @@AndreyrifRu из последнего думал как перевести подводные камни на сербский. Мой запрос "А подводные камни в плане выражения что не все так просто, появятся какие-то проблемные вещи по ходу дела"
      Вот 4о перевел дословно фразу подводные камни. И потом отдельно другим текстом перевел разъяснения, которые я планировал он возьмёт как референс. Просто нажал кнопку перегенерировать и выбрал 4ку и она сразу же коротко привела близкую фразу из сербского языка с похожим смыслом.
      Но это я уже знал что нужно 4 ку использовать. До этого часто было пишешь запрос, ответ не проходит, указываешь на проблемы 4о такая "извините пожалуйста, действительно вот ответ" но возвращает ровно то же самое что было. Опять говоришь что ну не так, описываешь что не так и все равно ответ такой же. 4ка сразу отвечает правильно. И другие запросы я в основном сразу на английском пишу, так что не в языке дело. 4о на всех плохо справляется, но ее ответа достаточно в 80% случаях моего использования

  • @RaioAIO
    @RaioAIO 6 месяцев назад +8

    Привет Даниэль 👋
    Активно и давно пользуюсь Claude и вот что я заметил: Модель Claude «учится» в динамике, для тех кто давно с Клодом, часто могли замечать что он становился умнее, при этом формально версия оставалась 3.0. Я думаю что все эти названия версий, скорее для того чтобы «продать пользователям», подытожили, назвали 3.5, но по факту это просто способности Клода на сегодняшний день, условно завтра он вероятно будет еще умнее чем сегодня, при этом модель будет называться так же 3.5… Сомнительно, но окэй.. Честнее было бы заявить «мы создали Claude и постоянно его совершенствуем, и вот нате, сегодня обходит GPT-4o по ряду параметров», но видимо людям проще продать идею «следующей цифры» и второе: Клод прекрасно общается на русском языке, это не ChatGPT, он на русском общается не хуже чем на английском, в порой даже лучше, т.к. он учитывает специфику языка, а не «переводит с английского на русский» как это было в ChatGPT (но вроде они тоже исправились), однако очевидно что Claude обучен на большем массиве русскоязычных данных, хоть Anthropic этого и не заявляет официально, сам Claude готов рассказывать о (например) научных работах, которые в большей степени стали комментируемы (популярны) на русском языке и кстати, появились уже позже 23-го года. Думаю что его ответы что он обучен на данных до 23-го года, это так скажем механизм защиты, помогающий защищаться от юридических претензий и ограничивающих законов об использовании ИИ, которые начали появляться позже 23-го года. По факту Claude знает больше, чем об этом официально заявляют, что легко можно проверить пообщавшись с ним 🙌

  • @alex_illusion
    @alex_illusion 6 месяцев назад +2

    Очень интересно. Только не понял, вроде было сказано что она сейчас бесплатная, а в конце цена на api... Или в бесплатном варианте ограничения сильные как и с chatgpt без plus подпис ки?

    • @corpsebreath1029
      @corpsebreath1029 6 месяцев назад +1

      5-6 запросов и несколько часов бана вот и вся бесплатность))

    • @ProdAdvice
      @ProdAdvice  6 месяцев назад +1

      апи не бесплатно. А в интерфейсе бесплатно. Но лимиты драконовские

  • @igorv2322
    @igorv2322 6 месяцев назад +5

    Автор, ты бы хоть посмотрел вопросы из MMLU. Непосвящённый в предметную область человек не наберёт и 35%. 89.8% - это уровень эксперта (и лишь в одной из 57 категорий). Потому и было много шума, когда самая толстая Gemini Ultra 1.0 набрала 90.0. 5-shot - это 5 раз по 100 вопросов из произвольного набора категорий. Всего вопросов там 15908. Там даже из школьной математики есть вопросы, на которые большинство людей вообще не ответит.

  • @yuriyprituzhalov5877
    @yuriyprituzhalov5877 6 месяцев назад +1

    отдельный лайк за Арк браузер) Тоже сегодня тестанул новый Claude на написание кода - 4 промпта и ни одной ошибки) вот это уже показатель) На те же запросы GPT че то наворотил невоспроизводимое, даже не стал разбираться)

    • @daye_private
      @daye_private 2 месяца назад +1

      Прошу прощения за путаницу, давайте разберёмся 😂 и опять ошибки 😅😅😅

  • @Neovolter
    @Neovolter 6 месяцев назад

    Возмоожно ли как-то им пользоваться если у есть только SIM РФ? Или только виртуальный номер покупать для регистрации?

    • @ProdAdvice
      @ProdAdvice  6 месяцев назад

      виртуальный номер

  • @ix.tam.net.
    @ix.tam.net. 6 месяцев назад

    Подскажите пожалуйста новичку, какие gpt лучше работают с Экселем ?

  • @PassionBrains
    @PassionBrains 6 месяцев назад +1

    Хороший контент. Приятно что не шатается микрофон в кадре

  • @aistretegy
    @aistretegy 6 месяцев назад +3

    Пока там не сделают удобное создание ассистентов, даже прикасаться не буду)

  • @Comfmore
    @Comfmore 6 месяцев назад +3

    Ждём теперь ответку от OpenAI

    • @sk8based
      @sk8based 6 месяцев назад

      Не жди особо, оттуда мозги утекли

    • @arc-deity
      @arc-deity 6 месяцев назад

      Чем отвечать? Claude как бы зацензуренной помойкой так ею и остался, никто в серьёз Claude рассматривать не будет

    • @monte-cristo9710
      @monte-cristo9710 6 месяцев назад +2

      Пока что ждём хотя бы голосовую модель новую, которая до сих пор еще не развернута, а прошло уже больше месяца

    • @MudroZvon
      @MudroZvon 6 месяцев назад +4

      Что за мода пошла: презентовать то, чего ещё нет? Вот Anthropic молодцы, никаких "анонсов"

    • @ИгорьГончаров-э6ь
      @ИгорьГончаров-э6ь 6 месяцев назад

      они походу работают в основном на правительство. Видимо создают модель которая сможет взламывать системы рф и китая

  • @JoraMacKornev
    @JoraMacKornev 6 месяцев назад

    дядя Д, и тебе привет от роботов
    нам говорят, что эти модели сдают какие-то экзамены, а тут оказывается это школьный уровень обычного образованного человека =)
    это реально гонка, сейчас каждая обновленная модель чем-то выделяется и уделывает остальных

  • @СетевойПромышленныйИнтеллектСП

    В этот Клод сонет бесплатный, ссылку можно получить?

    • @monte-cristo9710
      @monte-cristo9710 6 месяцев назад

      Бесплатный с лимитами как gpt4o поэтому 20 баксов на базу)

    • @МаксМакс.М
      @МаксМакс.М Месяц назад

      ​@@monte-cristo9710у Клода подписка тоже 20 $ стоит?

  • @vsego-horoshego
    @vsego-horoshego 6 месяцев назад

    Из всех LLM что я тестировал своим списком тестов, Claude 3.5 Sonnet превзошел всех. Был очень удивлен. Особенно удивили более правильные ответы чем у GPT-4o. Считаю, что это пока самая сильная LLM.

    • @MegaDolmatov
      @MegaDolmatov 4 месяца назад

      Какие тесты тестил? можешь пример.

  • @AndreyrifRu
    @AndreyrifRu 6 месяцев назад

    Было бы классно больше реальных примеров из жизни и для реальной жизни и реальных задач ❤

    • @ProdAdvice
      @ProdAdvice  6 месяцев назад

      хиппо ин тукседо вполне реальный пример, ведь)

  • @СергейФалалеев-й7у
    @СергейФалалеев-й7у 6 месяцев назад

    Ну довольно сомнительно все эти таблицы, учитывая, что тесты их собственные, а разница в десятых долях процента и то не везде. А кодирование - тут часто как повезёт: иногда с первого раза в нужное русло, а иногда и с 10го не напишет все правильно. И это про все нейронки. Лучше максимально точно запрос формулировать. Там какой-то рэндом с расстановкой весов и вариантов на каждом первом запросе влияет сильно на весь диалог. А в целом спасибо за выпуск, интересная тема, будем тестить)

  • @edranovdenis
    @edranovdenis 6 месяцев назад

    Клауд 3 хайку доступен бесплатно и без ограничений. Ллама3 и чатгпт 3.5 тоже. На сторонних сайтах

  • @dmytrykovalsky9429
    @dmytrykovalsky9429 6 месяцев назад

    Я создал такой же запрос в glaude 3.5 sonet и у меня никакого окошка с превью не вылезло.
    Просто дали два варианта кода и привет.

    • @ferouu
      @ferouu 6 месяцев назад

      Я не до конца досмотрел, однако что бы было превью надо в настройках где то включить artifacts, у меня Клода нет поэтому говорить не могу

  • @MyOneAndOnlyYouTubeChanel
    @MyOneAndOnlyYouTubeChanel 6 месяцев назад

    заше, сайт не работает, написано испытывают временные трудновсти

  • @МаксимПетровский-н2г
    @МаксимПетровский-н2г 6 месяцев назад +1

    Ссылку добавить руки отсохли?

  • @Tumbler_v01
    @Tumbler_v01 6 месяцев назад +2

    А что, несколько процентов это уже достижение? Даж прирост производительности железа на 10-15% за поколение - не такая уж мотивация для обновления.

    • @HlebniyBu
      @HlebniyBu 6 месяцев назад

      Давай на примере фпс в играх.
      Разница между 45 и 60?
      Между 60 и 75?
      Огромная )

    • @MudroZvon
      @MudroZvon 6 месяцев назад

      В этот раз наоборот: цифры не до конца передают, насколько качественный прирост

    • @destroy1440
      @destroy1440 6 месяцев назад +3

      ​@@HlebniyBuРазница не в 45-60, а в 54-60 при 10% разницы и 51-60 при 15%

    • @HlebniyBu
      @HlebniyBu 6 месяцев назад

      @@destroy1440 я вообще тебя не понял.
      Откуда ты взял эти проценты ?
      В моей голове 100 fps это 100%
      Тебя не учили искать Х в школе ?
      Чел дал процент, я дал фпс из 15%
      Как узнать что разница между 45-60 фпс это 15% ?
      Узнать сколько 100%.
      Не поверишь, 100 fps это 100%, то что ты выcpaл я вообще не понял.

    • @destroy1440
      @destroy1440 6 месяцев назад

      @@HlebniyBu Что за чушь ты несёшь? Как 100 фпс может быть 100%? 110 значит - 110%? У тебя проблемы с логикой, какой ещё Х искать? Причём тут вообще уравнение? Тебя учили проценты считать или нет? На калькуляторе посчитай, умник. Ну ты обосрался по полной

  • @havemoney
    @havemoney 6 месяцев назад +1

    10к хорошо )

  • @АлександрР-щ4ь
    @АлександрР-щ4ь 6 месяцев назад

    спасибо

  • @offigget4206
    @offigget4206 6 месяцев назад

    Клод 3.5 Сонет стал слагать более глубокие и рифмованные стихи на русском языке, что автоматически сделало его моим фаворитом! А ранее моим фаворитом был Опус. Теперь уже он слагает стихи хуже модели Sonnet.

  • @korban_dallas_multipassport
    @korban_dallas_multipassport 6 месяцев назад

    Реклама?

  • @FlowerPower3000
    @FlowerPower3000 4 месяца назад

    не нужно путать глупость GPT# с его хитростью))

  • @Back2Nix
    @Back2Nix 6 месяцев назад

    С кайфом❤

  • @zigf
    @zigf 6 месяцев назад +1

    Скоро начнётся такая же гонка чисел, как у браузеров. Firefox раньше неохотно менял версию, потом плюнул и погнался за Хромом. Само "3,5" уже звучит как отстойное и устарелое (по ассоциации с ЖоПаТы 3,5), которое будет кидать тень на Claude. Даёшь Клоид 5,4!

    • @MudroZvon
      @MudroZvon 6 месяцев назад

      Grok сразу в пятой версии выйдет?

    • @destroy1440
      @destroy1440 6 месяцев назад

      Ложь, клод не имеет ничего общего с ChatGPT, поэтому и числа в версиях моделей даже на ум не приходит сравнивать. Кто вообще будет сравнивать айфон 15 и пс5 например? Айфон в 10 раз круче? Логика. Для меня "глупой" звучит слово Haiku, это субъективность и глупость, которой подчиняются только незнающие люди

  • @CultureofSpeech
    @CultureofSpeech 6 месяцев назад

    I just wonder why 🤔 should we believe your opinion 🤨

  • @YbivanKenoby
    @YbivanKenoby 6 месяцев назад +1

    Без VPN туда не зайти

    • @date2077
      @date2077 6 месяцев назад

      500р мес свой личный сервер в США

  • @iuseronline
    @iuseronline 6 месяцев назад

    Скидки это зло)

    • @ProdAdvice
      @ProdAdvice  6 месяцев назад

      зато это не зло

  • @stoma.marketing
    @stoma.marketing 6 месяцев назад +1

    А как можно оплатить подписку на Клоде? Есть ли доступные платежки, а то он очень вредничает и мало какие карты/банки принимает(

    • @ProdAdvice
      @ProdAdvice  6 месяцев назад

      www.chekpayment.com/

  • @jeremytuk8262
    @jeremytuk8262 6 месяцев назад +2

    После нескольких лет предвкушений супер технологии взаимопонимания человека и компьютера, начинает намечаться нехорошая тенденция. Зацикленность ии на своих же продуктах приводит к вырождению адекватной инфы с просторов интернета. Соответственно, гонка технологий превращается в мыльную гонку маркетинг-отделов. Широким массам становиться скучно. 3.5 или 4.3, а может 4.3pro на 20 баксов дороже?😂 Хз, в чем там разница. Такое произошло со смартфонами и многим другим. Скорее всего, такая же участь ждет все эти ии.

    • @nikkimikki5274
      @nikkimikki5274 6 месяцев назад

      если бы ещё отключили соевые фильтры, было бы намного лучше. Но в целом все эти модели бы интегрировать в игры с нпс, но почему-то студии не хотят этим заниматься, а продолжают клепать сжв фигню. По настоящему никто не хочет создать agi

    • @jeremytuk8262
      @jeremytuk8262 6 месяцев назад

      @@nikkimikki5274 игры немного по другому устроены, интеграция в нпс, скорее всего, только усложнит процесс расчета и оптимизации, а также поведение т.н. накопительного псевдоинтеллекта непредсказуемо. А так пока игроки платят, менять то, что работает, не особо то и нужно.

    • @destroy1440
      @destroy1440 6 месяцев назад

      ​@@nikkimikki5274Все стремятся к AGI, думаешь, это так просто? Будто взял и создал. Никто даже не понимает, как именно устроен мозг человека. Все эти языковые модели лишь "умная" игрушка

    • @APride83
      @APride83 6 месяцев назад

      @@nikkimikki5274 Так они нам и скажут, что они хотят. AGI опасен, очень опасен, поэтому никто его не выложит и не покажет.

  • @iqubik
    @iqubik 6 месяцев назад +2

    инфа полный калл. доступ из россии запрещён, попытка из под впн требует зарубежный номер и об этом ни слова за всё видео. и это уже не первый раз, чую отпишусь

    • @ProdAdvice
      @ProdAdvice  6 месяцев назад

      аривидерчи. Ну по-моему, уже всем должно быть понятно, что из рф запрещено все или почти все и надо искать алтернативные способы. Коих уйма

    • @HlebniyBu
      @HlebniyBu 6 месяцев назад

      @@ProdAdvice с gpt проблем с доступом через впн нет, зачем агитировать русскую аудиторию сидеть на сомнительном сервисе?
      "Раз всем понятно" то кому?
      Я в целом согласен с автором комментария, послушал вас и наступил в говно.
      Только зря время потратил на через жопу сделанную на сайте регистрацию, двойную...

    • @Oleksiy777
      @Oleksiy777 6 месяцев назад +2

      Отпишись лучше от своего вождя престарелого. Может тогда в РФ доступ к ИИ появится. Как у всех нормальных стран.

    • @HlebniyBu
      @HlebniyBu 6 месяцев назад

      @@Oleksiy777 почему не на родном говоришь?
      А ещё лучше, на английском.
      Он как никак международный.
      Неужели наш вождь тебя в заложниках держит и вынуждает говорить на враждебном?

    • @Oleksiy777
      @Oleksiy777 6 месяцев назад +3

      @@HlebniyBu Да запросто. Но я в отличии от вас цивилизованный человек. И говорю на языке топикстартера, как минимум из уважения к нему. Но могу и на украинском, могу и на английском языке, нет проблем. А во вторых, ты и такие как ты другие языки не поймете, так как невежды. Смысл тогда? Мне надо было мысль довести до вас о вашем престарелом кровавом диктаторе, на которого вы променяли все остальное, - я это сделал. Все.

  • @iteleportation
    @iteleportation 6 месяцев назад

    Дядя Д, ой какой же ты смешной...

  • @ВладАга-л8м
    @ВладАга-л8м 6 месяцев назад +1

    Дядя д пиздец кринж

  • @MarvelBad
    @MarvelBad 6 месяцев назад

    плохо что antropic забанила дохрена аккаунтов. Зачем это делать спрашивается. Политика у них просто говно

    • @Oleksiy777
      @Oleksiy777 6 месяцев назад

      Зато у вас Кремль ТВ с говорящим вождем есть. Наслаждайтесь.

    • @MarvelBad
      @MarvelBad 6 месяцев назад

      @@Oleksiy777 я не смотрю тв а тем более на этого старого маразматика

    • @lowwwrider
      @lowwwrider Месяц назад

      Наслаждайся зелей, до последнего украинца, тогда победите))​@@Oleksiy777