Stable Cascade - НОВАЯ НЕЙРОСЕТЬ от создателей Stable Diffusion. Как установить на ПК

Поделиться
HTML-код
  • Опубликовано: 19 фев 2024
  • Паблик ВК: turbinskiy_artwork
    Телеграм: t.me/turbinskiy_art
    ⭐ Поддержать великодушно:
    www.donationalerts.com/r/alek...
  • ХоббиХобби

Комментарии • 65

  • @alexs1681
    @alexs1681 3 месяца назад +3

    Супер. Отличные результаты, благодарю за подсказки!

  • @user-qg4gx7be2j
    @user-qg4gx7be2j 3 месяца назад +2

    Смотрел куча видео на английском на эту тему, у тебя самая лучшая информация. Спасибо!

  • @74mihain
    @74mihain 3 месяца назад +5

    На Civitai один из выложенных по каскаду воркфлоу содержит таблицу разрешений, очень удобно.
    Собственно про сам каскад на сегодняшний день, это пока, если сравнивать с играми, бета версия. Модель по сути одна, хотя и состоит из отдельных частей, о чем показано в видео. Лор нет, ничего нет, населена роботами...но умеет работать со встроенными в Комфи стилями. Причем интересно, что ноды для стилей подходят только от SD. На XLевской вылазит та же ошибка совместимости с SD моделью, что и на обычной версии. Я так понял - основа SD?
    По поводу использования видео памяти, на 8 все работает примерно так же как и на стандарте. Ни о каких больше 8гб речи нет. Но интересное происходит в нагреве видеокарты, при гораздо большей длительности генерации в каскаде температура ниже. Если при стандарте доходит до 72, то здесь не выше 57., хотя может и от видюхи зависит.
    Что касается качества... добиться результатов на подобии того, что представлено в качестве примеров на странице каскада, не получилось. Скорее всего просто терпения не хватило разобраться, очень уж долго каскад генерирует, в итоге получается что то не слишком естественное. Ну и самое главное, на данный момент каскад не понимает того что понимает та же XL.То есть один и тот же промт в каскаде требует уточнять многие детали дополнительно. Наследие SD модели? Понимание сути из общей фразы, например когда в качестве промта пишешь текст стихов или песни, тут каскад смог справиться на хорошем уровне. Суть улавливает и это уже есть гуд.
    Теперь пальцы, руки, ноги... Мало тестировал по причинам указанным выше, но в том что было криминала не увидел. Но если вы генерируете персонажа с предметом в руке (не с тем что вы подумали, каскад пока что в ЭТО не умеет никак), то готовьтесь к арсеналу как из мемной фотки с десантником. Если предмет в одной руке. то персонаж держит его правильно зажав пальцы. Если нужен предмет во 2й руке, то этот доп предмет слетает с позиционирования.
    В итоге, продукт пока сырой, слишком массивный из-за структуры, когда нужны по сути 4 модели в одной пачке- VAE (он же а). b, c, CLIP и все это весит от 6 до 14гб по отдельности (интересно кто будет заморачиваться с созданием новых моделей в таком случае), требующий изначально минимум 2 прохода генерации по KSampler-у, помимо всех прочих обработок, что влияет существенно на время работы. А прибавьте сюда всяких обработчиков-улучшайзеров, да с контролнетами, да поболее, да что бы все в одном... В общем ждем оптимизацию и доработки.

  • @_Zemlya
    @_Zemlya 3 месяца назад +9

    Теперь ждём, когда коммьюнити всё это дело дообучит, тогда посмотрим, как это всё будет выглядеть

    • @TovSpaskin
      @TovSpaskin 3 месяца назад +1

      Sdxl уже дождалось?)

    • @OZbMG8jsJTX14AWYne4omBw
      @OZbMG8jsJTX14AWYne4omBw 3 месяца назад

      Как в фильме Апгрейд

    • @Sadako_Yamomura
      @Sadako_Yamomura 3 месяца назад

      ​@@TovSpaskinКто знает, руки не одна нейронка с нуля не делает.
      Только импаинтом.....

  • @danilsi6431
    @danilsi6431 3 месяца назад

    Спасибо очень доступно и понятно, даже новичкам😌

  • @SwallowKPSS
    @SwallowKPSS 3 месяца назад +4

    Думаю, Fooocus для меня сейчас более чем достаточно) Хотя, конечно, молодцы, что продолжают оптимизировать.

    • @SwallowKPSS
      @SwallowKPSS 3 месяца назад

      @@user-sq5rq7dx4x Это не так, все зависит от выбранного промта и модели.

  • @user-hi8ci7nr6f
    @user-hi8ci7nr6f 3 месяца назад

    Спасибо!

  • @user-eh5lb9fc1x
    @user-eh5lb9fc1x 3 месяца назад

    получилось, спасибки)

  • @vip_studio7481
    @vip_studio7481 3 месяца назад

    спасибо большое, полезно

  • @user-cy8ms4uf5f
    @user-cy8ms4uf5f 3 месяца назад

    Спасибо!!! Супер!!!!!

  • @Onsearching
    @Onsearching 3 месяца назад

    👍

  • @Onsearching
    @Onsearching 3 месяца назад

    Только вышел Каскад да еще и не финальная версия, а уже стейбл дифужен 3 на подходе просто без слов...

  • @artemshenev7422
    @artemshenev7422 3 месяца назад +1

    это всё здорово, а что с руками и пальцами в итоге?) Последние фотки с девушками в этой сетке сделаны?

    • @user-ej2lm9vo5m
      @user-ej2lm9vo5m 3 месяца назад

      че вы до пальцев доебались, давно уже есть лоры для исправляения рук да и в целом все получше встало

    • @artemshenev7422
      @artemshenev7422 3 месяца назад

      @@user-ej2lm9vo5m с лорами мне не нужна новая нейронка, мне бы хотелось чтоб как они рекламируют - в один клик норм фотка, а не полчаса потом еще допиливать чем то, надоели костыли.

  • @timifree
    @timifree 3 месяца назад

    Подскажите, а можно ли нейросетью генерить надписи с красивыми шрифтами ? И если "да", то с помощью каких бесплатных нейросетей это возможно ?
    Stable Diffusion умеет такое ?

    • @TURBINSKIY
      @TURBINSKIY  3 месяца назад

      Adobe Firefly предназначен для красивых генераций шрифтов. Stable Diffusion не умеет сам этого делать.

    • @timifree
      @timifree 3 месяца назад

      @@TURBINSKIY посмотрел, что в плане шрифтов умеет Adobe Firefly.
      Сильно в детали не вдавался, но, исходя из того, что увидел - это не то, что нужно, увы.
      Он, как я понял, генерит не стили и разновидности шрифтов, а заливку одного и того же шрифта разными графическими паттернами - шоколадками, грибочками, нитками, чешуёй и т.п. А нужна именно генерация надписей разными шрифтами - то, чего я не увидел в FireFly. (заливать паттернами сами буковки, конечно, тоже имеет значение, но это уже на втором месте).

  • @ambersbaz
    @ambersbaz 3 месяца назад

    Stability AI анонсировали Stable Diffusion 3! Столько громких новостей за последнее время... Ждём обзор

  • @nikolaj8523
    @nikolaj8523 3 месяца назад +5

    Установил себе попробовать версию, которая типа "в один клик". Встала без проблем. Интерфейс минимальный, но настроек там нет. По умолчанию было 1024х1024 и при 16гб оперативки и 16гб видео больше не смог ничего сгенерировать. Из 16гб забирает практически всё. У меня только после загрузки оболочки уже занято 13.7гб видео памяти. От результата хотелось получить "ВАУ!" Но на первый взгляд никаких плюсов не увидел. По скорости дольше, картинка похуже и только полное потребление ресурсов компьютера. Это заметно сразу. Может допилят, но пока по ресурсы-скорость-качество у меня Forge потом А1111 остальное на вкус и цвет😊😊😊

    • @CRYPTOLAVKA
      @CRYPTOLAVKA 3 месяца назад +1

      Forg? Не слышал. Это что?

    • @romanioamd5319
      @romanioamd5319 3 месяца назад

      видеокарту не бось костарт купил по видеопамяти?

    • @Sky_Eagle
      @Sky_Eagle 3 месяца назад

      Абсолютно с вами согласен!

    • @Sky_Eagle
      @Sky_Eagle 3 месяца назад

      @@CRYPTOLAVKA stable-diffusion-webui-forge - оптимизированная версия автоматика.

    • @nikolaj8523
      @nikolaj8523 3 месяца назад

      @@romanioamd5319 не совсем понял. Видеокарта с двумя вертушками RTX4060Ti 16gb если интересует это.

  • @Luiza-bl9qh
    @Luiza-bl9qh 3 месяца назад

    Есть ссылка ?

  • @user-sv3km4rz8t
    @user-sv3km4rz8t 3 месяца назад +1

    💯💯💯💯💣💣💣💣💥💣💥💥🔥🔥🔥👍👍👍👍

  • @diurddruid
    @diurddruid 2 месяца назад

    С большими разрешениями (15360*4320 с параметром "very good highly ultra‑detailed 16K" (но, требуется большое кол-во RAM, при 64Gb бывает в SWAP скидывает порядка 20Gb, при 128Gb SWAP не задействован, но оператива грузится на 80-90Gb; еще так-же, средствами реестра и BIOS расширена VRAM за счет RAM, хоть чуть-чуть лучше и стабильней работает, хотя 2-е видюшки, 2080 под нейросеть задействую и вспомогательная на 2-ой монитор RX5800XT, уже фильмы и прочее смотрю; единственное что плохо, в "Фокусе" не могу полностью проц задействовать, SD задействует и грузит проц на 70-80%, "Фокус" 2-5%, максимум до 10% (но это если еще и играть во что-то параллельно), было-бы идеально, задействовать Nv+Ati+CPU - но как это сделать...???)) пока единственное, что корректно может работать это "Fooocus". Все остальное, сколько не пробовал, огромные искажения и артефакты. Особенно с конечностями и лицами. Ну и конечно, размытость, расфокусировка, наложение.

  • @wiwwiw2890
    @wiwwiw2890 3 месяца назад +4

    Не вижу различий с SD

    • @yuduz367
      @yuduz367 3 месяца назад

      Я немного тестировал каскаду. Она лучше понимает промпт и получить с её помощью более сложную композицию легче. Как по мне это попытка приблизиться к миджорни в плане соответствия между подсказкой и результатом. До Dall E 3 всё ещё далеко.

  • @user-kv6nc3nt1j
    @user-kv6nc3nt1j 3 месяца назад +1

    По разрешению - проверь зависимость соответствия требования что бы стороны делились на 64.

    • @TURBINSKIY
      @TURBINSKIY  3 месяца назад +2

      Да, именно в подобном направлении надо копать

  • @calibanirvam5814
    @calibanirvam5814 3 месяца назад

    народ, подскажите плиз: при генерации выдает ошибку CUDA out of memory, 8gb видеокарта 3070ti, 16 гигов оперативки. Кто-нибудь сталкивался с такой ошибкой?

    • @AloneStroller
      @AloneStroller 3 месяца назад

      Минимум 32 Гб оперативки надо, как и для SDXL.

  • @CrazyPCman
    @CrazyPCman 3 месяца назад

    Алгоритм под названием вюрстхен - это колбаска по-немецки

  • @TheMaxvin
    @TheMaxvin 3 месяца назад

    Все хорошо, но нет главного - нафик этот каскад нужен?

  • @Dota-xk8nj
    @Dota-xk8nj 3 месяца назад +2

    как \ понимаю, амд его не потянет, да?

    • @igemon4845
      @igemon4845 3 месяца назад

      Амд вообще не тянет нейросети

    • @Dota-xk8nj
      @Dota-xk8nj 3 месяца назад

      Тянет. У меня стоит sd адаптированный на амд. Правда, амд тянет слабо. 12гб тянет как будто 8гб из нвидиа

    • @Dota-xk8nj
      @Dota-xk8nj 3 месяца назад

      Постепенно, алаптируют на амд. Даже fooocus адаптировали на него. Неделю назад скачал и его тоже

    • @funnyfun9017
      @funnyfun9017 3 месяца назад

      Долго на амд, да и разрешение не тянет нормальное

  • @rahen2111
    @rahen2111 3 месяца назад +3

    вы бы хоть иногда системные требования говорили, и что без 32-64гб рам тут ловить нехер.🤔

    • @expl01t25
      @expl01t25 3 месяца назад +1

      у меня отлично работает и sc и sdxl на 16gb ram + 8gb vram

    • @Andreas_Willamette
      @Andreas_Willamette 3 месяца назад

      ты нищенка что ли? сходи купи 32 гб рам, если нет денег - заработай

    • @funnyfun9017
      @funnyfun9017 3 месяца назад

      20 Гб рам полет нормальный

  • @by0uki
    @by0uki 3 месяца назад

    Какой шанс портирования на телефоны

  • @PWPvP85
    @PWPvP85 3 месяца назад

    Какие вообще основные преимущества над Stable Diffusion у неё?

    • @alexs1681
      @alexs1681 3 месяца назад

      полезные

    • @PWPvP85
      @PWPvP85 3 месяца назад

      @@alexs1681 Как и твой комментарий)

  • @TovSpaskin
    @TovSpaskin 3 месяца назад +1

    Я не понимаю, для чего они делают нейронки которые генерят типа высокое разрешение, если sd 1.5 с апскеллером выдает такой же результат? Неужели нельзя было дальше простую sd развивать? (сам пользуюсь Delibrate)

    • @alexs1681
      @alexs1681 3 месяца назад

      Ваше непонимание совершенно понятно. Оно кроется в неспособности видеть, анализировать изображения и воспринимать элементарные отличия деталей. Также понимать отличия общего и частного. Проще говоря, примитивная нейронка в вашей голове не позволяет проводить сравнительные визуальные операции.

    • @TovSpaskin
      @TovSpaskin 3 месяца назад

      @@alexs1681 то есть я не вижу разницы, потому что я не вижу разницы… заебись, спасибо кэп😆

    • @funnyfun9017
      @funnyfun9017 3 месяца назад

      Ну нет уж, если невысокое разрешение апскейлить скажем в фул хд и выше, всплывают косяки.

    • @TovSpaskin
      @TovSpaskin 3 месяца назад

      @@funnyfun9017 инпайнт отдельных участков решает эту проблему.
      Если конечно cascade без косяков бы рисовала сразу то было бы норм. А так и в том и другом случае все равно косяки исправлять. (Даже в видео 4-7 пальцев в конце эт несерьезно) А генерация на каскаде медленней.