O3: сильнейшая модель рассуждений. Когда будет достигнут AGI?

Поделиться
HTML-код
  • Опубликовано: 26 дек 2024
  • НаукаНаука

Комментарии • 19

  • @Роберт628
    @Роберт628 6 часов назад

    5:20 предполагаю, что эту модель выпустят Qwen. Они буквально недавно выпустили QVQ-72B-Preview.

  • @АндрейКрисанов-ь1м
    @АндрейКрисанов-ь1м 2 часа назад

    Напоминает ли принцип, предположительно использованный разработчиками, ДОКТОРА СТРЕНДЖА, пересчитавшего 14.000.625 вариантов исходов?

  • @François_Gellert
    @François_Gellert День назад

    Спасибо за видео! С наступающим!

  • @ПетрФомин-щ9ж
    @ПетрФомин-щ9ж День назад +1

    Будет ли обзор свежей модели Microsoft_Phi-4 ? По моему они значительно улучшили поддержку русского языка и качество ответов у неё даже выше чем у Llama-3-70b хотя параметров у неё всего 14b. Такую можно даже на обычном геймерском пк попробовать запустить.

  • @user-ey2vv1dl3n
    @user-ey2vv1dl3n День назад +1

    сделай плз разбор мелких моделей с которыми может начинующий дома играться типа 3Б или новую квин с резонингом

    • @Denis_W3S
      @Denis_W3S 21 час назад

      тоже интересует эта тема, но я бы планку опустил до 1Б

  • @АлександрР-щ4ь
    @АлександрР-щ4ь 23 часа назад

    спасибо

  • @internetnickname8923
    @internetnickname8923 День назад +1

    о3 модель не для смертных, т.е. она создана по сути по большей части для решения сложных вопросов математики, медицины, программирования и науки в целом. Ни о каком AGI и говорить не приходится. По прежнему o1 не может решать даже некоторые детские задачи. AGI не нужно будет подталкивать к решению проблем через промпты, он сам будет их искать и решать в полуавтоматическом режиме, но до этого ещё минимум 4-5 лет. Я убеждён, что настоящий AGI и супер ИИ будет функционировать только на нейроморфных чипах интел и IBM.

    • @Denis_W3S
      @Denis_W3S 21 час назад

      Выскажу предположение, что сильный скачек в качестве моделей завязан на нескольких методах - рефлексии на основе повторяющихся циклов генерации, а также RAG in-memory. Последние может подгружать вместе с LLM в VRAM базу данных со структурированной информацией в виде справочников по наукам. Предполагаю что без MemoRAG в O3 не обошлось. По этому методу вообще инфы мало... Было бы интересно услышать мнение Руслана на этот счет🧐

  • @aigood-u2x
    @aigood-u2x День назад

    лайк!

  • @ПетрФомин-щ9ж
    @ПетрФомин-щ9ж День назад

    Ну понятно что это пока не AGI, потому что нет внутреннего состояния для эпизодичской памяти и эту модель очень дорого обучать на видео-токенах так как слишком много электро-энергии на это тратится, нужно дождаться аналоговоых или световых нейромофных чипов которые удешевят обучение и инференс моделей в разы тогда ОИИ замаячит на горизонте.

    • @vitall789
      @vitall789 День назад

      К Аналогу, нужен обязательно параллелизм в вычислении и запоминании состояния и не столь важно, что для этого будут использовать, магнетизм или фотоны, это уже будет достаточно для "замаячивания...", все остальное это жалкая пародия!

  • @yaroslavdmitriev3028
    @yaroslavdmitriev3028 День назад +1

    Как же хочется пощупать новую модель 😅

    • @ruslandev
      @ruslandev  День назад

      😁 а вы подайте заявку на ранний доступ для safety testing

    • @zigf
      @zigf 16 часов назад

      @@ruslandev я уже подавал. Но модель сказала, что я нищеброд и чтобы шел лапать доярок.

  • @vitall789
    @vitall789 День назад

    Думаю эта уже точно не потянет текущ. техническую базу для масс! Нужен науч. прорыв в микропроцессорах и памяти!

    • @SashaKuzikov
      @SashaKuzikov День назад

      Для масс и не требуется. Если AI позволит получать военное преимущество, разработки мгновенно станут закрытыми и секретными.

  • @igorlitvin1779
    @igorlitvin1779 16 часов назад

    Звучит бредово))) Почему 85 процентов)) Почему именно эти тесты? Кто вообще судья. Это очень субьективно. Да и вообще сама задача странная и не определенная точно. Звучит как просто очередной хайп модели которую натренировали решать именно эти задачи. Челы посидели и решили датасет сдедать где похожие задачи решаются. Уверен чуть вправо или влево и будет провал. Визуальные тесты и взаимодействие с реальным миром должны быть проведены. Хотя это тоже не факт будет.