На Civitai один из выложенных по каскаду воркфлоу содержит таблицу разрешений, очень удобно. Собственно про сам каскад на сегодняшний день, это пока, если сравнивать с играми, бета версия. Модель по сути одна, хотя и состоит из отдельных частей, о чем показано в видео. Лор нет, ничего нет, населена роботами...но умеет работать со встроенными в Комфи стилями. Причем интересно, что ноды для стилей подходят только от SD. На XLевской вылазит та же ошибка совместимости с SD моделью, что и на обычной версии. Я так понял - основа SD? По поводу использования видео памяти, на 8 все работает примерно так же как и на стандарте. Ни о каких больше 8гб речи нет. Но интересное происходит в нагреве видеокарты, при гораздо большей длительности генерации в каскаде температура ниже. Если при стандарте доходит до 72, то здесь не выше 57., хотя может и от видюхи зависит. Что касается качества... добиться результатов на подобии того, что представлено в качестве примеров на странице каскада, не получилось. Скорее всего просто терпения не хватило разобраться, очень уж долго каскад генерирует, в итоге получается что то не слишком естественное. Ну и самое главное, на данный момент каскад не понимает того что понимает та же XL.То есть один и тот же промт в каскаде требует уточнять многие детали дополнительно. Наследие SD модели? Понимание сути из общей фразы, например когда в качестве промта пишешь текст стихов или песни, тут каскад смог справиться на хорошем уровне. Суть улавливает и это уже есть гуд. Теперь пальцы, руки, ноги... Мало тестировал по причинам указанным выше, но в том что было криминала не увидел. Но если вы генерируете персонажа с предметом в руке (не с тем что вы подумали, каскад пока что в ЭТО не умеет никак), то готовьтесь к арсеналу как из мемной фотки с десантником. Если предмет в одной руке. то персонаж держит его правильно зажав пальцы. Если нужен предмет во 2й руке, то этот доп предмет слетает с позиционирования. В итоге, продукт пока сырой, слишком массивный из-за структуры, когда нужны по сути 4 модели в одной пачке- VAE (он же а). b, c, CLIP и все это весит от 6 до 14гб по отдельности (интересно кто будет заморачиваться с созданием новых моделей в таком случае), требующий изначально минимум 2 прохода генерации по KSampler-у, помимо всех прочих обработок, что влияет существенно на время работы. А прибавьте сюда всяких обработчиков-улучшайзеров, да с контролнетами, да поболее, да что бы все в одном... В общем ждем оптимизацию и доработки.
@@user-ej2lm9vo5m с лорами мне не нужна новая нейронка, мне бы хотелось чтоб как они рекламируют - в один клик норм фотка, а не полчаса потом еще допиливать чем то, надоели костыли.
Подскажите, а можно ли нейросетью генерить надписи с красивыми шрифтами ? И если "да", то с помощью каких бесплатных нейросетей это возможно ? Stable Diffusion умеет такое ?
@@TURBINSKIY посмотрел, что в плане шрифтов умеет Adobe Firefly. Сильно в детали не вдавался, но, исходя из того, что увидел - это не то, что нужно, увы. Он, как я понял, генерит не стили и разновидности шрифтов, а заливку одного и того же шрифта разными графическими паттернами - шоколадками, грибочками, нитками, чешуёй и т.п. А нужна именно генерация надписей разными шрифтами - то, чего я не увидел в FireFly. (заливать паттернами сами буковки, конечно, тоже имеет значение, но это уже на втором месте).
Установил себе попробовать версию, которая типа "в один клик". Встала без проблем. Интерфейс минимальный, но настроек там нет. По умолчанию было 1024х1024 и при 16гб оперативки и 16гб видео больше не смог ничего сгенерировать. Из 16гб забирает практически всё. У меня только после загрузки оболочки уже занято 13.7гб видео памяти. От результата хотелось получить "ВАУ!" Но на первый взгляд никаких плюсов не увидел. По скорости дольше, картинка похуже и только полное потребление ресурсов компьютера. Это заметно сразу. Может допилят, но пока по ресурсы-скорость-качество у меня Forge потом А1111 остальное на вкус и цвет😊😊😊
С большими разрешениями (15360*4320 с параметром "very good highly ultra‑detailed 16K" (но, требуется большое кол-во RAM, при 64Gb бывает в SWAP скидывает порядка 20Gb, при 128Gb SWAP не задействован, но оператива грузится на 80-90Gb; еще так-же, средствами реестра и BIOS расширена VRAM за счет RAM, хоть чуть-чуть лучше и стабильней работает, хотя 2-е видюшки, 2080 под нейросеть задействую и вспомогательная на 2-ой монитор RX5800XT, уже фильмы и прочее смотрю; единственное что плохо, в "Фокусе" не могу полностью проц задействовать, SD задействует и грузит проц на 70-80%, "Фокус" 2-5%, максимум до 10% (но это если еще и играть во что-то параллельно), было-бы идеально, задействовать Nv+Ati+CPU - но как это сделать...???)) пока единственное, что корректно может работать это "Fooocus". Все остальное, сколько не пробовал, огромные искажения и артефакты. Особенно с конечностями и лицами. Ну и конечно, размытость, расфокусировка, наложение.
Я немного тестировал каскаду. Она лучше понимает промпт и получить с её помощью более сложную композицию легче. Как по мне это попытка приблизиться к миджорни в плане соответствия между подсказкой и результатом. До Dall E 3 всё ещё далеко.
народ, подскажите плиз: при генерации выдает ошибку CUDA out of memory, 8gb видеокарта 3070ti, 16 гигов оперативки. Кто-нибудь сталкивался с такой ошибкой?
Я не понимаю, для чего они делают нейронки которые генерят типа высокое разрешение, если sd 1.5 с апскеллером выдает такой же результат? Неужели нельзя было дальше простую sd развивать? (сам пользуюсь Delibrate)
Ваше непонимание совершенно понятно. Оно кроется в неспособности видеть, анализировать изображения и воспринимать элементарные отличия деталей. Также понимать отличия общего и частного. Проще говоря, примитивная нейронка в вашей голове не позволяет проводить сравнительные визуальные операции.
@@funnyfun9017 инпайнт отдельных участков решает эту проблему. Если конечно cascade без косяков бы рисовала сразу то было бы норм. А так и в том и другом случае все равно косяки исправлять. (Даже в видео 4-7 пальцев в конце эт несерьезно) А генерация на каскаде медленней.
Супер. Отличные результаты, благодарю за подсказки!
Смотрел куча видео на английском на эту тему, у тебя самая лучшая информация. Спасибо!
На Civitai один из выложенных по каскаду воркфлоу содержит таблицу разрешений, очень удобно.
Собственно про сам каскад на сегодняшний день, это пока, если сравнивать с играми, бета версия. Модель по сути одна, хотя и состоит из отдельных частей, о чем показано в видео. Лор нет, ничего нет, населена роботами...но умеет работать со встроенными в Комфи стилями. Причем интересно, что ноды для стилей подходят только от SD. На XLевской вылазит та же ошибка совместимости с SD моделью, что и на обычной версии. Я так понял - основа SD?
По поводу использования видео памяти, на 8 все работает примерно так же как и на стандарте. Ни о каких больше 8гб речи нет. Но интересное происходит в нагреве видеокарты, при гораздо большей длительности генерации в каскаде температура ниже. Если при стандарте доходит до 72, то здесь не выше 57., хотя может и от видюхи зависит.
Что касается качества... добиться результатов на подобии того, что представлено в качестве примеров на странице каскада, не получилось. Скорее всего просто терпения не хватило разобраться, очень уж долго каскад генерирует, в итоге получается что то не слишком естественное. Ну и самое главное, на данный момент каскад не понимает того что понимает та же XL.То есть один и тот же промт в каскаде требует уточнять многие детали дополнительно. Наследие SD модели? Понимание сути из общей фразы, например когда в качестве промта пишешь текст стихов или песни, тут каскад смог справиться на хорошем уровне. Суть улавливает и это уже есть гуд.
Теперь пальцы, руки, ноги... Мало тестировал по причинам указанным выше, но в том что было криминала не увидел. Но если вы генерируете персонажа с предметом в руке (не с тем что вы подумали, каскад пока что в ЭТО не умеет никак), то готовьтесь к арсеналу как из мемной фотки с десантником. Если предмет в одной руке. то персонаж держит его правильно зажав пальцы. Если нужен предмет во 2й руке, то этот доп предмет слетает с позиционирования.
В итоге, продукт пока сырой, слишком массивный из-за структуры, когда нужны по сути 4 модели в одной пачке- VAE (он же а). b, c, CLIP и все это весит от 6 до 14гб по отдельности (интересно кто будет заморачиваться с созданием новых моделей в таком случае), требующий изначально минимум 2 прохода генерации по KSampler-у, помимо всех прочих обработок, что влияет существенно на время работы. А прибавьте сюда всяких обработчиков-улучшайзеров, да с контролнетами, да поболее, да что бы все в одном... В общем ждем оптимизацию и доработки.
Теперь ждём, когда коммьюнити всё это дело дообучит, тогда посмотрим, как это всё будет выглядеть
Sdxl уже дождалось?)
Как в фильме Апгрейд
@@TovSpaskinКто знает, руки не одна нейронка с нуля не делает.
Только импаинтом.....
Спасибо очень доступно и понятно, даже новичкам😌
Думаю, Fooocus для меня сейчас более чем достаточно) Хотя, конечно, молодцы, что продолжают оптимизировать.
@@user-sq5rq7dx4x Это не так, все зависит от выбранного промта и модели.
Спасибо!
получилось, спасибки)
спасибо большое, полезно
Спасибо!!! Супер!!!!!
👍
Только вышел Каскад да еще и не финальная версия, а уже стейбл дифужен 3 на подходе просто без слов...
это всё здорово, а что с руками и пальцами в итоге?) Последние фотки с девушками в этой сетке сделаны?
че вы до пальцев доебались, давно уже есть лоры для исправляения рук да и в целом все получше встало
@@user-ej2lm9vo5m с лорами мне не нужна новая нейронка, мне бы хотелось чтоб как они рекламируют - в один клик норм фотка, а не полчаса потом еще допиливать чем то, надоели костыли.
Подскажите, а можно ли нейросетью генерить надписи с красивыми шрифтами ? И если "да", то с помощью каких бесплатных нейросетей это возможно ?
Stable Diffusion умеет такое ?
Adobe Firefly предназначен для красивых генераций шрифтов. Stable Diffusion не умеет сам этого делать.
@@TURBINSKIY посмотрел, что в плане шрифтов умеет Adobe Firefly.
Сильно в детали не вдавался, но, исходя из того, что увидел - это не то, что нужно, увы.
Он, как я понял, генерит не стили и разновидности шрифтов, а заливку одного и того же шрифта разными графическими паттернами - шоколадками, грибочками, нитками, чешуёй и т.п. А нужна именно генерация надписей разными шрифтами - то, чего я не увидел в FireFly. (заливать паттернами сами буковки, конечно, тоже имеет значение, но это уже на втором месте).
Stability AI анонсировали Stable Diffusion 3! Столько громких новостей за последнее время... Ждём обзор
Установил себе попробовать версию, которая типа "в один клик". Встала без проблем. Интерфейс минимальный, но настроек там нет. По умолчанию было 1024х1024 и при 16гб оперативки и 16гб видео больше не смог ничего сгенерировать. Из 16гб забирает практически всё. У меня только после загрузки оболочки уже занято 13.7гб видео памяти. От результата хотелось получить "ВАУ!" Но на первый взгляд никаких плюсов не увидел. По скорости дольше, картинка похуже и только полное потребление ресурсов компьютера. Это заметно сразу. Может допилят, но пока по ресурсы-скорость-качество у меня Forge потом А1111 остальное на вкус и цвет😊😊😊
Forg? Не слышал. Это что?
видеокарту не бось костарт купил по видеопамяти?
Абсолютно с вами согласен!
@@CRYPTOLAVKA stable-diffusion-webui-forge - оптимизированная версия автоматика.
@@romanioamd5319 не совсем понял. Видеокарта с двумя вертушками RTX4060Ti 16gb если интересует это.
Есть ссылка ?
💯💯💯💯💣💣💣💣💥💣💥💥🔥🔥🔥👍👍👍👍
С большими разрешениями (15360*4320 с параметром "very good highly ultra‑detailed 16K" (но, требуется большое кол-во RAM, при 64Gb бывает в SWAP скидывает порядка 20Gb, при 128Gb SWAP не задействован, но оператива грузится на 80-90Gb; еще так-же, средствами реестра и BIOS расширена VRAM за счет RAM, хоть чуть-чуть лучше и стабильней работает, хотя 2-е видюшки, 2080 под нейросеть задействую и вспомогательная на 2-ой монитор RX5800XT, уже фильмы и прочее смотрю; единственное что плохо, в "Фокусе" не могу полностью проц задействовать, SD задействует и грузит проц на 70-80%, "Фокус" 2-5%, максимум до 10% (но это если еще и играть во что-то параллельно), было-бы идеально, задействовать Nv+Ati+CPU - но как это сделать...???)) пока единственное, что корректно может работать это "Fooocus". Все остальное, сколько не пробовал, огромные искажения и артефакты. Особенно с конечностями и лицами. Ну и конечно, размытость, расфокусировка, наложение.
Не вижу различий с SD
Я немного тестировал каскаду. Она лучше понимает промпт и получить с её помощью более сложную композицию легче. Как по мне это попытка приблизиться к миджорни в плане соответствия между подсказкой и результатом. До Dall E 3 всё ещё далеко.
По разрешению - проверь зависимость соответствия требования что бы стороны делились на 64.
Да, именно в подобном направлении надо копать
народ, подскажите плиз: при генерации выдает ошибку CUDA out of memory, 8gb видеокарта 3070ti, 16 гигов оперативки. Кто-нибудь сталкивался с такой ошибкой?
Минимум 32 Гб оперативки надо, как и для SDXL.
Алгоритм под названием вюрстхен - это колбаска по-немецки
Все хорошо, но нет главного - нафик этот каскад нужен?
как \ понимаю, амд его не потянет, да?
Амд вообще не тянет нейросети
Тянет. У меня стоит sd адаптированный на амд. Правда, амд тянет слабо. 12гб тянет как будто 8гб из нвидиа
Постепенно, алаптируют на амд. Даже fooocus адаптировали на него. Неделю назад скачал и его тоже
Долго на амд, да и разрешение не тянет нормальное
вы бы хоть иногда системные требования говорили, и что без 32-64гб рам тут ловить нехер.🤔
у меня отлично работает и sc и sdxl на 16gb ram + 8gb vram
ты нищенка что ли? сходи купи 32 гб рам, если нет денег - заработай
20 Гб рам полет нормальный
Какой шанс портирования на телефоны
Нулевой
Какие вообще основные преимущества над Stable Diffusion у неё?
полезные
@@alexs1681 Как и твой комментарий)
Я не понимаю, для чего они делают нейронки которые генерят типа высокое разрешение, если sd 1.5 с апскеллером выдает такой же результат? Неужели нельзя было дальше простую sd развивать? (сам пользуюсь Delibrate)
Ваше непонимание совершенно понятно. Оно кроется в неспособности видеть, анализировать изображения и воспринимать элементарные отличия деталей. Также понимать отличия общего и частного. Проще говоря, примитивная нейронка в вашей голове не позволяет проводить сравнительные визуальные операции.
@@alexs1681 то есть я не вижу разницы, потому что я не вижу разницы… заебись, спасибо кэп😆
Ну нет уж, если невысокое разрешение апскейлить скажем в фул хд и выше, всплывают косяки.
@@funnyfun9017 инпайнт отдельных участков решает эту проблему.
Если конечно cascade без косяков бы рисовала сразу то было бы норм. А так и в том и другом случае все равно косяки исправлять. (Даже в видео 4-7 пальцев в конце эт несерьезно) А генерация на каскаде медленней.