Stable Cascade - НОВАЯ НЕЙРОСЕТЬ от создателей Stable Diffusion. Как установить на ПК

TURBINSKIY

Просмотров 12 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 19 фев 2024
Паблик ВК: turbinskiy_artwork
Телеграм: t.me/turbinskiy_art
⭐ Поддержать великодушно:
www.donationalerts.com/r/alek...
Хобби

Комментарии • 65

@alexs1681 3 месяца назад ⁺³
Супер. Отличные результаты, благодарю за подсказки!
@user-qg4gx7be2j 3 месяца назад ⁺²
Смотрел куча видео на английском на эту тему, у тебя самая лучшая информация. Спасибо!
@74mihain 3 месяца назад ⁺⁵
На Civitai один из выложенных по каскаду воркфлоу содержит таблицу разрешений, очень удобно.
Собственно про сам каскад на сегодняшний день, это пока, если сравнивать с играми, бета версия. Модель по сути одна, хотя и состоит из отдельных частей, о чем показано в видео. Лор нет, ничего нет, населена роботами...но умеет работать со встроенными в Комфи стилями. Причем интересно, что ноды для стилей подходят только от SD. На XLевской вылазит та же ошибка совместимости с SD моделью, что и на обычной версии. Я так понял - основа SD?
По поводу использования видео памяти, на 8 все работает примерно так же как и на стандарте. Ни о каких больше 8гб речи нет. Но интересное происходит в нагреве видеокарты, при гораздо большей длительности генерации в каскаде температура ниже. Если при стандарте доходит до 72, то здесь не выше 57., хотя может и от видюхи зависит.
Что касается качества... добиться результатов на подобии того, что представлено в качестве примеров на странице каскада, не получилось. Скорее всего просто терпения не хватило разобраться, очень уж долго каскад генерирует, в итоге получается что то не слишком естественное. Ну и самое главное, на данный момент каскад не понимает того что понимает та же XL.То есть один и тот же промт в каскаде требует уточнять многие детали дополнительно. Наследие SD модели? Понимание сути из общей фразы, например когда в качестве промта пишешь текст стихов или песни, тут каскад смог справиться на хорошем уровне. Суть улавливает и это уже есть гуд.
Теперь пальцы, руки, ноги... Мало тестировал по причинам указанным выше, но в том что было криминала не увидел. Но если вы генерируете персонажа с предметом в руке (не с тем что вы подумали, каскад пока что в ЭТО не умеет никак), то готовьтесь к арсеналу как из мемной фотки с десантником. Если предмет в одной руке. то персонаж держит его правильно зажав пальцы. Если нужен предмет во 2й руке, то этот доп предмет слетает с позиционирования.
В итоге, продукт пока сырой, слишком массивный из-за структуры, когда нужны по сути 4 модели в одной пачке- VAE (он же а). b, c, CLIP и все это весит от 6 до 14гб по отдельности (интересно кто будет заморачиваться с созданием новых моделей в таком случае), требующий изначально минимум 2 прохода генерации по KSampler-у, помимо всех прочих обработок, что влияет существенно на время работы. А прибавьте сюда всяких обработчиков-улучшайзеров, да с контролнетами, да поболее, да что бы все в одном... В общем ждем оптимизацию и доработки.
@_Zemlya 3 месяца назад ⁺⁹
Теперь ждём, когда коммьюнити всё это дело дообучит, тогда посмотрим, как это всё будет выглядеть
@TovSpaskin 3 месяца назад ⁺¹
Sdxl уже дождалось?)
@OZbMG8jsJTX14AWYne4omBw 3 месяца назад
Как в фильме Апгрейд
@Sadako_Yamomura 3 месяца назад
@@TovSpaskinКто знает, руки не одна нейронка с нуля не делает.
Только импаинтом.....
@danilsi6431 3 месяца назад
Спасибо очень доступно и понятно, даже новичкам😌
@SwallowKPSS 3 месяца назад ⁺⁴
Думаю, Fooocus для меня сейчас более чем достаточно) Хотя, конечно, молодцы, что продолжают оптимизировать.
@SwallowKPSS 3 месяца назад
@@user-sq5rq7dx4x Это не так, все зависит от выбранного промта и модели.
@user-hi8ci7nr6f 3 месяца назад
Спасибо!
@user-eh5lb9fc1x 3 месяца назад
получилось, спасибки)
@vip_studio7481 3 месяца назад
спасибо большое, полезно
@user-cy8ms4uf5f 3 месяца назад
Спасибо!!! Супер!!!!!
@Onsearching 3 месяца назад
👍
@Onsearching 3 месяца назад
Только вышел Каскад да еще и не финальная версия, а уже стейбл дифужен 3 на подходе просто без слов...
@artemshenev7422 3 месяца назад ⁺¹
это всё здорово, а что с руками и пальцами в итоге?) Последние фотки с девушками в этой сетке сделаны?
@user-ej2lm9vo5m 3 месяца назад
че вы до пальцев доебались, давно уже есть лоры для исправляения рук да и в целом все получше встало
@artemshenev7422 3 месяца назад
@@user-ej2lm9vo5m с лорами мне не нужна новая нейронка, мне бы хотелось чтоб как они рекламируют - в один клик норм фотка, а не полчаса потом еще допиливать чем то, надоели костыли.
@timifree 3 месяца назад
Подскажите, а можно ли нейросетью генерить надписи с красивыми шрифтами ? И если "да", то с помощью каких бесплатных нейросетей это возможно ?
Stable Diffusion умеет такое ?
@TURBINSKIY 3 месяца назад
Adobe Firefly предназначен для красивых генераций шрифтов. Stable Diffusion не умеет сам этого делать.
@timifree 3 месяца назад
@@TURBINSKIY посмотрел, что в плане шрифтов умеет Adobe Firefly.
Сильно в детали не вдавался, но, исходя из того, что увидел - это не то, что нужно, увы.
Он, как я понял, генерит не стили и разновидности шрифтов, а заливку одного и того же шрифта разными графическими паттернами - шоколадками, грибочками, нитками, чешуёй и т.п. А нужна именно генерация надписей разными шрифтами - то, чего я не увидел в FireFly. (заливать паттернами сами буковки, конечно, тоже имеет значение, но это уже на втором месте).
@ambersbaz 3 месяца назад
Stability AI анонсировали Stable Diffusion 3! Столько громких новостей за последнее время... Ждём обзор
@nikolaj8523 3 месяца назад ⁺⁵
Установил себе попробовать версию, которая типа "в один клик". Встала без проблем. Интерфейс минимальный, но настроек там нет. По умолчанию было 1024х1024 и при 16гб оперативки и 16гб видео больше не смог ничего сгенерировать. Из 16гб забирает практически всё. У меня только после загрузки оболочки уже занято 13.7гб видео памяти. От результата хотелось получить "ВАУ!" Но на первый взгляд никаких плюсов не увидел. По скорости дольше, картинка похуже и только полное потребление ресурсов компьютера. Это заметно сразу. Может допилят, но пока по ресурсы-скорость-качество у меня Forge потом А1111 остальное на вкус и цвет😊😊😊
@CRYPTOLAVKA 3 месяца назад ⁺¹
Forg? Не слышал. Это что?
@romanioamd5319 3 месяца назад
видеокарту не бось костарт купил по видеопамяти?
@Sky_Eagle 3 месяца назад
Абсолютно с вами согласен!
@Sky_Eagle 3 месяца назад
@@CRYPTOLAVKA stable-diffusion-webui-forge - оптимизированная версия автоматика.
@nikolaj8523 3 месяца назад
@@romanioamd5319 не совсем понял. Видеокарта с двумя вертушками RTX4060Ti 16gb если интересует это.
@Luiza-bl9qh 3 месяца назад
Есть ссылка ?
@user-sv3km4rz8t 3 месяца назад ⁺¹
💯💯💯💯💣💣💣💣💥💣💥💥🔥🔥🔥👍👍👍👍
@diurddruid 2 месяца назад
С большими разрешениями (15360*4320 с параметром "very good highly ultra‑detailed 16K" (но, требуется большое кол-во RAM, при 64Gb бывает в SWAP скидывает порядка 20Gb, при 128Gb SWAP не задействован, но оператива грузится на 80-90Gb; еще так-же, средствами реестра и BIOS расширена VRAM за счет RAM, хоть чуть-чуть лучше и стабильней работает, хотя 2-е видюшки, 2080 под нейросеть задействую и вспомогательная на 2-ой монитор RX5800XT, уже фильмы и прочее смотрю; единственное что плохо, в "Фокусе" не могу полностью проц задействовать, SD задействует и грузит проц на 70-80%, "Фокус" 2-5%, максимум до 10% (но это если еще и играть во что-то параллельно), было-бы идеально, задействовать Nv+Ati+CPU - но как это сделать...???)) пока единственное, что корректно может работать это "Fooocus". Все остальное, сколько не пробовал, огромные искажения и артефакты. Особенно с конечностями и лицами. Ну и конечно, размытость, расфокусировка, наложение.
@wiwwiw2890 3 месяца назад ⁺⁴
Не вижу различий с SD
@yuduz367 3 месяца назад
Я немного тестировал каскаду. Она лучше понимает промпт и получить с её помощью более сложную композицию легче. Как по мне это попытка приблизиться к миджорни в плане соответствия между подсказкой и результатом. До Dall E 3 всё ещё далеко.
@user-kv6nc3nt1j 3 месяца назад ⁺¹
По разрешению - проверь зависимость соответствия требования что бы стороны делились на 64.
@TURBINSKIY 3 месяца назад ⁺²
Да, именно в подобном направлении надо копать
@calibanirvam5814 3 месяца назад
народ, подскажите плиз: при генерации выдает ошибку CUDA out of memory, 8gb видеокарта 3070ti, 16 гигов оперативки. Кто-нибудь сталкивался с такой ошибкой?
@AloneStroller 3 месяца назад
Минимум 32 Гб оперативки надо, как и для SDXL.
@CrazyPCman 3 месяца назад
Алгоритм под названием вюрстхен - это колбаска по-немецки
@TheMaxvin 3 месяца назад
Все хорошо, но нет главного - нафик этот каскад нужен?
@Dota-xk8nj 3 месяца назад ⁺²
как \ понимаю, амд его не потянет, да?
@igemon4845 3 месяца назад
Амд вообще не тянет нейросети
@Dota-xk8nj 3 месяца назад
Тянет. У меня стоит sd адаптированный на амд. Правда, амд тянет слабо. 12гб тянет как будто 8гб из нвидиа
@Dota-xk8nj 3 месяца назад
Постепенно, алаптируют на амд. Даже fooocus адаптировали на него. Неделю назад скачал и его тоже
@funnyfun9017 3 месяца назад
Долго на амд, да и разрешение не тянет нормальное
@rahen2111 3 месяца назад ⁺³
вы бы хоть иногда системные требования говорили, и что без 32-64гб рам тут ловить нехер.🤔
@expl01t25 3 месяца назад ⁺¹
у меня отлично работает и sc и sdxl на 16gb ram + 8gb vram
@Andreas_Willamette 3 месяца назад
ты нищенка что ли? сходи купи 32 гб рам, если нет денег - заработай
@funnyfun9017 3 месяца назад
20 Гб рам полет нормальный
@by0uki 3 месяца назад
Какой шанс портирования на телефоны
@funnyfun9017 3 месяца назад ⁺¹
Нулевой
@PWPvP85 3 месяца назад
Какие вообще основные преимущества над Stable Diffusion у неё?
@alexs1681 3 месяца назад
полезные
@PWPvP85 3 месяца назад
@@alexs1681 Как и твой комментарий)
@TovSpaskin 3 месяца назад ⁺¹
Я не понимаю, для чего они делают нейронки которые генерят типа высокое разрешение, если sd 1.5 с апскеллером выдает такой же результат? Неужели нельзя было дальше простую sd развивать? (сам пользуюсь Delibrate)
@alexs1681 3 месяца назад
Ваше непонимание совершенно понятно. Оно кроется в неспособности видеть, анализировать изображения и воспринимать элементарные отличия деталей. Также понимать отличия общего и частного. Проще говоря, примитивная нейронка в вашей голове не позволяет проводить сравнительные визуальные операции.
@TovSpaskin 3 месяца назад
@@alexs1681 то есть я не вижу разницы, потому что я не вижу разницы… заебись, спасибо кэп😆
@funnyfun9017 3 месяца назад
Ну нет уж, если невысокое разрешение апскейлить скажем в фул хд и выше, всплывают косяки.
@TovSpaskin 3 месяца назад
@@funnyfun9017 инпайнт отдельных участков решает эту проблему.
Если конечно cascade без косяков бы рисовала сразу то было бы норм. А так и в том и другом случае все равно косяки исправлять. (Даже в видео 4-7 пальцев в конце эт несерьезно) А генерация на каскаде медленней.

Следующие

Автовоспроизведение

С этой БЕСПЛАТНОЙ нейросетью фотошоп больше не нужен??? Мокапы в Recraft