Попробовал модельку. Конечно сильно впечатлился. GPT-4o очень неплох. Но блин многие из моих задач он не мог решить даже через 10 запросов, Клауд многие из них сделал с 1-го раза как надо.
А не пробовал потом перегенерировать ответ с GPT 4 . Потому что мне этот 4о совсем не нравится. Сначала было подозрение что кажется. но потом нашел кнопку перегенерировать ответ в другой модели и прям офигел. GPT 4 отвечает как надо, 4o постоянно одну пластинку крутит, толком не отвечая на вопрос. Такое ощущение что это 3.5 с новым шильзиком🙃
@@AndreyrifRu из последнего думал как перевести подводные камни на сербский. Мой запрос "А подводные камни в плане выражения что не все так просто, появятся какие-то проблемные вещи по ходу дела" Вот 4о перевел дословно фразу подводные камни. И потом отдельно другим текстом перевел разъяснения, которые я планировал он возьмёт как референс. Просто нажал кнопку перегенерировать и выбрал 4ку и она сразу же коротко привела близкую фразу из сербского языка с похожим смыслом. Но это я уже знал что нужно 4 ку использовать. До этого часто было пишешь запрос, ответ не проходит, указываешь на проблемы 4о такая "извините пожалуйста, действительно вот ответ" но возвращает ровно то же самое что было. Опять говоришь что ну не так, описываешь что не так и все равно ответ такой же. 4ка сразу отвечает правильно. И другие запросы я в основном сразу на английском пишу, так что не в языке дело. 4о на всех плохо справляется, но ее ответа достаточно в 80% случаях моего использования
Привет Даниэль 👋 Активно и давно пользуюсь Claude и вот что я заметил: Модель Claude «учится» в динамике, для тех кто давно с Клодом, часто могли замечать что он становился умнее, при этом формально версия оставалась 3.0. Я думаю что все эти названия версий, скорее для того чтобы «продать пользователям», подытожили, назвали 3.5, но по факту это просто способности Клода на сегодняшний день, условно завтра он вероятно будет еще умнее чем сегодня, при этом модель будет называться так же 3.5… Сомнительно, но окэй.. Честнее было бы заявить «мы создали Claude и постоянно его совершенствуем, и вот нате, сегодня обходит GPT-4o по ряду параметров», но видимо людям проще продать идею «следующей цифры» и второе: Клод прекрасно общается на русском языке, это не ChatGPT, он на русском общается не хуже чем на английском, в порой даже лучше, т.к. он учитывает специфику языка, а не «переводит с английского на русский» как это было в ChatGPT (но вроде они тоже исправились), однако очевидно что Claude обучен на большем массиве русскоязычных данных, хоть Anthropic этого и не заявляет официально, сам Claude готов рассказывать о (например) научных работах, которые в большей степени стали комментируемы (популярны) на русском языке и кстати, появились уже позже 23-го года. Думаю что его ответы что он обучен на данных до 23-го года, это так скажем механизм защиты, помогающий защищаться от юридических претензий и ограничивающих законов об использовании ИИ, которые начали появляться позже 23-го года. По факту Claude знает больше, чем об этом официально заявляют, что легко можно проверить пообщавшись с ним 🙌
Очень интересно. Только не понял, вроде было сказано что она сейчас бесплатная, а в конце цена на api... Или в бесплатном варианте ограничения сильные как и с chatgpt без plus подпис ки?
Автор, ты бы хоть посмотрел вопросы из MMLU. Непосвящённый в предметную область человек не наберёт и 35%. 89.8% - это уровень эксперта (и лишь в одной из 57 категорий). Потому и было много шума, когда самая толстая Gemini Ultra 1.0 набрала 90.0. 5-shot - это 5 раз по 100 вопросов из произвольного набора категорий. Всего вопросов там 15908. Там даже из школьной математики есть вопросы, на которые большинство людей вообще не ответит.
отдельный лайк за Арк браузер) Тоже сегодня тестанул новый Claude на написание кода - 4 промпта и ни одной ошибки) вот это уже показатель) На те же запросы GPT че то наворотил невоспроизводимое, даже не стал разбираться)
дядя Д, и тебе привет от роботов нам говорят, что эти модели сдают какие-то экзамены, а тут оказывается это школьный уровень обычного образованного человека =) это реально гонка, сейчас каждая обновленная модель чем-то выделяется и уделывает остальных
Из всех LLM что я тестировал своим списком тестов, Claude 3.5 Sonnet превзошел всех. Был очень удивлен. Особенно удивили более правильные ответы чем у GPT-4o. Считаю, что это пока самая сильная LLM.
Ну довольно сомнительно все эти таблицы, учитывая, что тесты их собственные, а разница в десятых долях процента и то не везде. А кодирование - тут часто как повезёт: иногда с первого раза в нужное русло, а иногда и с 10го не напишет все правильно. И это про все нейронки. Лучше максимально точно запрос формулировать. Там какой-то рэндом с расстановкой весов и вариантов на каждом первом запросе влияет сильно на весь диалог. А в целом спасибо за выпуск, интересная тема, будем тестить)
@@destroy1440 я вообще тебя не понял. Откуда ты взял эти проценты ? В моей голове 100 fps это 100% Тебя не учили искать Х в школе ? Чел дал процент, я дал фпс из 15% Как узнать что разница между 45-60 фпс это 15% ? Узнать сколько 100%. Не поверишь, 100 fps это 100%, то что ты выcpaл я вообще не понял.
@@HlebniyBu Что за чушь ты несёшь? Как 100 фпс может быть 100%? 110 значит - 110%? У тебя проблемы с логикой, какой ещё Х искать? Причём тут вообще уравнение? Тебя учили проценты считать или нет? На калькуляторе посчитай, умник. Ну ты обосрался по полной
Клод 3.5 Сонет стал слагать более глубокие и рифмованные стихи на русском языке, что автоматически сделало его моим фаворитом! А ранее моим фаворитом был Опус. Теперь уже он слагает стихи хуже модели Sonnet.
Скоро начнётся такая же гонка чисел, как у браузеров. Firefox раньше неохотно менял версию, потом плюнул и погнался за Хромом. Само "3,5" уже звучит как отстойное и устарелое (по ассоциации с ЖоПаТы 3,5), которое будет кидать тень на Claude. Даёшь Клоид 5,4!
Ложь, клод не имеет ничего общего с ChatGPT, поэтому и числа в версиях моделей даже на ум не приходит сравнивать. Кто вообще будет сравнивать айфон 15 и пс5 например? Айфон в 10 раз круче? Логика. Для меня "глупой" звучит слово Haiku, это субъективность и глупость, которой подчиняются только незнающие люди
После нескольких лет предвкушений супер технологии взаимопонимания человека и компьютера, начинает намечаться нехорошая тенденция. Зацикленность ии на своих же продуктах приводит к вырождению адекватной инфы с просторов интернета. Соответственно, гонка технологий превращается в мыльную гонку маркетинг-отделов. Широким массам становиться скучно. 3.5 или 4.3, а может 4.3pro на 20 баксов дороже?😂 Хз, в чем там разница. Такое произошло со смартфонами и многим другим. Скорее всего, такая же участь ждет все эти ии.
если бы ещё отключили соевые фильтры, было бы намного лучше. Но в целом все эти модели бы интегрировать в игры с нпс, но почему-то студии не хотят этим заниматься, а продолжают клепать сжв фигню. По настоящему никто не хочет создать agi
@@nikkimikki5274 игры немного по другому устроены, интеграция в нпс, скорее всего, только усложнит процесс расчета и оптимизации, а также поведение т.н. накопительного псевдоинтеллекта непредсказуемо. А так пока игроки платят, менять то, что работает, не особо то и нужно.
@@nikkimikki5274Все стремятся к AGI, думаешь, это так просто? Будто взял и создал. Никто даже не понимает, как именно устроен мозг человека. Все эти языковые модели лишь "умная" игрушка
инфа полный калл. доступ из россии запрещён, попытка из под впн требует зарубежный номер и об этом ни слова за всё видео. и это уже не первый раз, чую отпишусь
@@ProdAdvice с gpt проблем с доступом через впн нет, зачем агитировать русскую аудиторию сидеть на сомнительном сервисе? "Раз всем понятно" то кому? Я в целом согласен с автором комментария, послушал вас и наступил в говно. Только зря время потратил на через жопу сделанную на сайте регистрацию, двойную...
@@Oleksiy777 почему не на родном говоришь? А ещё лучше, на английском. Он как никак международный. Неужели наш вождь тебя в заложниках держит и вынуждает говорить на враждебном?
@@HlebniyBu Да запросто. Но я в отличии от вас цивилизованный человек. И говорю на языке топикстартера, как минимум из уважения к нему. Но могу и на украинском, могу и на английском языке, нет проблем. А во вторых, ты и такие как ты другие языки не поймете, так как невежды. Смысл тогда? Мне надо было мысль довести до вас о вашем престарелом кровавом диктаторе, на которого вы променяли все остальное, - я это сделал. Все.
Попробовал модельку. Конечно сильно впечатлился. GPT-4o очень неплох. Но блин многие из моих задач он не мог решить даже через 10 запросов, Клауд многие из них сделал с 1-го раза как надо.
А не пробовал потом перегенерировать ответ с GPT 4 . Потому что мне этот 4о совсем не нравится. Сначала было подозрение что кажется. но потом нашел кнопку перегенерировать ответ в другой модели и прям офигел. GPT 4 отвечает как надо, 4o постоянно одну пластинку крутит, толком не отвечая на вопрос. Такое ощущение что это 3.5 с новым шильзиком🙃
А какие задачи например?
@@AndreyrifRu К примеру ханойские башни смоделировать что бы 5 дисков перетасовало с анимацией
@@Webdesus Тоже слышал что gpt 4 получше чем омни. Но не пробовал. Надо бы попробовать.
@@AndreyrifRu из последнего думал как перевести подводные камни на сербский. Мой запрос "А подводные камни в плане выражения что не все так просто, появятся какие-то проблемные вещи по ходу дела"
Вот 4о перевел дословно фразу подводные камни. И потом отдельно другим текстом перевел разъяснения, которые я планировал он возьмёт как референс. Просто нажал кнопку перегенерировать и выбрал 4ку и она сразу же коротко привела близкую фразу из сербского языка с похожим смыслом.
Но это я уже знал что нужно 4 ку использовать. До этого часто было пишешь запрос, ответ не проходит, указываешь на проблемы 4о такая "извините пожалуйста, действительно вот ответ" но возвращает ровно то же самое что было. Опять говоришь что ну не так, описываешь что не так и все равно ответ такой же. 4ка сразу отвечает правильно. И другие запросы я в основном сразу на английском пишу, так что не в языке дело. 4о на всех плохо справляется, но ее ответа достаточно в 80% случаях моего использования
Привет Даниэль 👋
Активно и давно пользуюсь Claude и вот что я заметил: Модель Claude «учится» в динамике, для тех кто давно с Клодом, часто могли замечать что он становился умнее, при этом формально версия оставалась 3.0. Я думаю что все эти названия версий, скорее для того чтобы «продать пользователям», подытожили, назвали 3.5, но по факту это просто способности Клода на сегодняшний день, условно завтра он вероятно будет еще умнее чем сегодня, при этом модель будет называться так же 3.5… Сомнительно, но окэй.. Честнее было бы заявить «мы создали Claude и постоянно его совершенствуем, и вот нате, сегодня обходит GPT-4o по ряду параметров», но видимо людям проще продать идею «следующей цифры» и второе: Клод прекрасно общается на русском языке, это не ChatGPT, он на русском общается не хуже чем на английском, в порой даже лучше, т.к. он учитывает специфику языка, а не «переводит с английского на русский» как это было в ChatGPT (но вроде они тоже исправились), однако очевидно что Claude обучен на большем массиве русскоязычных данных, хоть Anthropic этого и не заявляет официально, сам Claude готов рассказывать о (например) научных работах, которые в большей степени стали комментируемы (популярны) на русском языке и кстати, появились уже позже 23-го года. Думаю что его ответы что он обучен на данных до 23-го года, это так скажем механизм защиты, помогающий защищаться от юридических претензий и ограничивающих законов об использовании ИИ, которые начали появляться позже 23-го года. По факту Claude знает больше, чем об этом официально заявляют, что легко можно проверить пообщавшись с ним 🙌
Очень интересно. Только не понял, вроде было сказано что она сейчас бесплатная, а в конце цена на api... Или в бесплатном варианте ограничения сильные как и с chatgpt без plus подпис ки?
5-6 запросов и несколько часов бана вот и вся бесплатность))
апи не бесплатно. А в интерфейсе бесплатно. Но лимиты драконовские
Автор, ты бы хоть посмотрел вопросы из MMLU. Непосвящённый в предметную область человек не наберёт и 35%. 89.8% - это уровень эксперта (и лишь в одной из 57 категорий). Потому и было много шума, когда самая толстая Gemini Ultra 1.0 набрала 90.0. 5-shot - это 5 раз по 100 вопросов из произвольного набора категорий. Всего вопросов там 15908. Там даже из школьной математики есть вопросы, на которые большинство людей вообще не ответит.
отдельный лайк за Арк браузер) Тоже сегодня тестанул новый Claude на написание кода - 4 промпта и ни одной ошибки) вот это уже показатель) На те же запросы GPT че то наворотил невоспроизводимое, даже не стал разбираться)
Прошу прощения за путаницу, давайте разберёмся 😂 и опять ошибки 😅😅😅
Возмоожно ли как-то им пользоваться если у есть только SIM РФ? Или только виртуальный номер покупать для регистрации?
виртуальный номер
Подскажите пожалуйста новичку, какие gpt лучше работают с Экселем ?
Хороший контент. Приятно что не шатается микрофон в кадре
Пока там не сделают удобное создание ассистентов, даже прикасаться не буду)
Ждём теперь ответку от OpenAI
Не жди особо, оттуда мозги утекли
Чем отвечать? Claude как бы зацензуренной помойкой так ею и остался, никто в серьёз Claude рассматривать не будет
Пока что ждём хотя бы голосовую модель новую, которая до сих пор еще не развернута, а прошло уже больше месяца
Что за мода пошла: презентовать то, чего ещё нет? Вот Anthropic молодцы, никаких "анонсов"
они походу работают в основном на правительство. Видимо создают модель которая сможет взламывать системы рф и китая
дядя Д, и тебе привет от роботов
нам говорят, что эти модели сдают какие-то экзамены, а тут оказывается это школьный уровень обычного образованного человека =)
это реально гонка, сейчас каждая обновленная модель чем-то выделяется и уделывает остальных
В этот Клод сонет бесплатный, ссылку можно получить?
Бесплатный с лимитами как gpt4o поэтому 20 баксов на базу)
@@monte-cristo9710у Клода подписка тоже 20 $ стоит?
Из всех LLM что я тестировал своим списком тестов, Claude 3.5 Sonnet превзошел всех. Был очень удивлен. Особенно удивили более правильные ответы чем у GPT-4o. Считаю, что это пока самая сильная LLM.
Какие тесты тестил? можешь пример.
Было бы классно больше реальных примеров из жизни и для реальной жизни и реальных задач ❤
хиппо ин тукседо вполне реальный пример, ведь)
Ну довольно сомнительно все эти таблицы, учитывая, что тесты их собственные, а разница в десятых долях процента и то не везде. А кодирование - тут часто как повезёт: иногда с первого раза в нужное русло, а иногда и с 10го не напишет все правильно. И это про все нейронки. Лучше максимально точно запрос формулировать. Там какой-то рэндом с расстановкой весов и вариантов на каждом первом запросе влияет сильно на весь диалог. А в целом спасибо за выпуск, интересная тема, будем тестить)
Клауд 3 хайку доступен бесплатно и без ограничений. Ллама3 и чатгпт 3.5 тоже. На сторонних сайтах
Я создал такой же запрос в glaude 3.5 sonet и у меня никакого окошка с превью не вылезло.
Просто дали два варианта кода и привет.
Я не до конца досмотрел, однако что бы было превью надо в настройках где то включить artifacts, у меня Клода нет поэтому говорить не могу
заше, сайт не работает, написано испытывают временные трудновсти
Ссылку добавить руки отсохли?
А что, несколько процентов это уже достижение? Даж прирост производительности железа на 10-15% за поколение - не такая уж мотивация для обновления.
Давай на примере фпс в играх.
Разница между 45 и 60?
Между 60 и 75?
Огромная )
В этот раз наоборот: цифры не до конца передают, насколько качественный прирост
@@HlebniyBuРазница не в 45-60, а в 54-60 при 10% разницы и 51-60 при 15%
@@destroy1440 я вообще тебя не понял.
Откуда ты взял эти проценты ?
В моей голове 100 fps это 100%
Тебя не учили искать Х в школе ?
Чел дал процент, я дал фпс из 15%
Как узнать что разница между 45-60 фпс это 15% ?
Узнать сколько 100%.
Не поверишь, 100 fps это 100%, то что ты выcpaл я вообще не понял.
@@HlebniyBu Что за чушь ты несёшь? Как 100 фпс может быть 100%? 110 значит - 110%? У тебя проблемы с логикой, какой ещё Х искать? Причём тут вообще уравнение? Тебя учили проценты считать или нет? На калькуляторе посчитай, умник. Ну ты обосрался по полной
10к хорошо )
🤩
спасибо
Клод 3.5 Сонет стал слагать более глубокие и рифмованные стихи на русском языке, что автоматически сделало его моим фаворитом! А ранее моим фаворитом был Опус. Теперь уже он слагает стихи хуже модели Sonnet.
Реклама?
Нет)
не нужно путать глупость GPT# с его хитростью))
С кайфом❤
Скоро начнётся такая же гонка чисел, как у браузеров. Firefox раньше неохотно менял версию, потом плюнул и погнался за Хромом. Само "3,5" уже звучит как отстойное и устарелое (по ассоциации с ЖоПаТы 3,5), которое будет кидать тень на Claude. Даёшь Клоид 5,4!
Grok сразу в пятой версии выйдет?
Ложь, клод не имеет ничего общего с ChatGPT, поэтому и числа в версиях моделей даже на ум не приходит сравнивать. Кто вообще будет сравнивать айфон 15 и пс5 например? Айфон в 10 раз круче? Логика. Для меня "глупой" звучит слово Haiku, это субъективность и глупость, которой подчиняются только незнающие люди
I just wonder why 🤔 should we believe your opinion 🤨
Без VPN туда не зайти
500р мес свой личный сервер в США
Скидки это зло)
зато это не зло
А как можно оплатить подписку на Клоде? Есть ли доступные платежки, а то он очень вредничает и мало какие карты/банки принимает(
www.chekpayment.com/
После нескольких лет предвкушений супер технологии взаимопонимания человека и компьютера, начинает намечаться нехорошая тенденция. Зацикленность ии на своих же продуктах приводит к вырождению адекватной инфы с просторов интернета. Соответственно, гонка технологий превращается в мыльную гонку маркетинг-отделов. Широким массам становиться скучно. 3.5 или 4.3, а может 4.3pro на 20 баксов дороже?😂 Хз, в чем там разница. Такое произошло со смартфонами и многим другим. Скорее всего, такая же участь ждет все эти ии.
если бы ещё отключили соевые фильтры, было бы намного лучше. Но в целом все эти модели бы интегрировать в игры с нпс, но почему-то студии не хотят этим заниматься, а продолжают клепать сжв фигню. По настоящему никто не хочет создать agi
@@nikkimikki5274 игры немного по другому устроены, интеграция в нпс, скорее всего, только усложнит процесс расчета и оптимизации, а также поведение т.н. накопительного псевдоинтеллекта непредсказуемо. А так пока игроки платят, менять то, что работает, не особо то и нужно.
@@nikkimikki5274Все стремятся к AGI, думаешь, это так просто? Будто взял и создал. Никто даже не понимает, как именно устроен мозг человека. Все эти языковые модели лишь "умная" игрушка
@@nikkimikki5274 Так они нам и скажут, что они хотят. AGI опасен, очень опасен, поэтому никто его не выложит и не покажет.
инфа полный калл. доступ из россии запрещён, попытка из под впн требует зарубежный номер и об этом ни слова за всё видео. и это уже не первый раз, чую отпишусь
аривидерчи. Ну по-моему, уже всем должно быть понятно, что из рф запрещено все или почти все и надо искать алтернативные способы. Коих уйма
@@ProdAdvice с gpt проблем с доступом через впн нет, зачем агитировать русскую аудиторию сидеть на сомнительном сервисе?
"Раз всем понятно" то кому?
Я в целом согласен с автором комментария, послушал вас и наступил в говно.
Только зря время потратил на через жопу сделанную на сайте регистрацию, двойную...
Отпишись лучше от своего вождя престарелого. Может тогда в РФ доступ к ИИ появится. Как у всех нормальных стран.
@@Oleksiy777 почему не на родном говоришь?
А ещё лучше, на английском.
Он как никак международный.
Неужели наш вождь тебя в заложниках держит и вынуждает говорить на враждебном?
@@HlebniyBu Да запросто. Но я в отличии от вас цивилизованный человек. И говорю на языке топикстартера, как минимум из уважения к нему. Но могу и на украинском, могу и на английском языке, нет проблем. А во вторых, ты и такие как ты другие языки не поймете, так как невежды. Смысл тогда? Мне надо было мысль довести до вас о вашем престарелом кровавом диктаторе, на которого вы променяли все остальное, - я это сделал. Все.
Дядя Д, ой какой же ты смешной...
🫥
Дядя д пиздец кринж
почему?
плохо что antropic забанила дохрена аккаунтов. Зачем это делать спрашивается. Политика у них просто говно
Зато у вас Кремль ТВ с говорящим вождем есть. Наслаждайтесь.
@@Oleksiy777 я не смотрю тв а тем более на этого старого маразматика
Наслаждайся зелей, до последнего украинца, тогда победите))@@Oleksiy777