Искусственный интеллект учится самопожертвованию
HTML-код
- Опубликовано: 29 мар 2021
- Ссылка на курс по искусственному интеллекту от GeekBrains: geekbrains.ru/link/yYo2FN
В этом видео мы с тобой проведём эксперимент: а сможет ли нейросеть научиться самопожертвованию или нет?
В самом начале мы обучим нейросеть играть по обычным правилам, в которых не предусмотрен штраф за самопожертвование. Но после правила изменятся и мы проверим, будет ли нейросеть добровольно получать штраф, ради общей цели главных Dungeon Master'ов.
Музыка из видео:
Evan King - Binge ( • SYNTHWAVE ♫ Binge )
Evan King - Metro City ( • SYNTHWAVE ♫ Metro City )
Evan King - Contemplation ( • SYNTHWAVE ♫ Contemplation )
Evan King - Vectors( • Video )
Контакты для связи со мной:
Мой вк: id152101174
Email для сотрудничества: krashher.delovoi@gmail.com
#ИскусственныйИнтеллект #ИИ #МашинноеОбучение #KrashheR - Игры
Надо было добавить награду за скорость самопожертвования, из за этого жертвой был бы не только мелкий, а тот кто ближе ко врагу
*самопожертвование Тони Старка нервно курит в сторонке*
Когда? В каком фильме?
@@Hell_Serpent мстители финал
@@user-lc8dn5sb7f спасибо.
@@Hell_Serpent ВСЕ: FACEPALM
Вьетнамские флэшбеки
Фри хандрет бакс :D
неожиданно
@Asenstiven Odin Other Просто Тришка иногда научпоп смотрит
Она и у Онигири появлялась, и у foo52ru, и у Пайпа
Все больше нового узнаю о Тришке))
Че за нн с галкой
@@ydua теоретик по Андеру и другим играм
Все как в жизни : кто то первый решает жертвовать собой, а второй лишь пожинает плоды не желая что-то менять.
А нет в этой симуляции ничего после смерти, кроме нового цикла. Два ИИ и знать не знают другого. Цикл ИИ заканчивается после смерти. И только воля случая дала вкусить одному из персонажей, что такое самопожертвование. Другой лишь делает что должен, он не знает, - нет способа украсть деньги себе, нет ничего кроме цели закончить начатое.
Ты гегий
Сценарий сделал какой-то slave, которому заплатили 3 hundred bucks
Именно так и родились dungeon masters
300
Чел проработай модельки Билла и Вана, их враги такие эпичные, а они просто голышом ходят
@@electroultra8544 по моeму с минимализмом ужe пeрeбор)
@@Drakonita_96 согласен. Хотя бы маску им одеть.
Лайк за название канала.
Не глядя.
Глубокий смысл: Люди предают себе подобных чтобы сделать лучше себе,это показывает данное видео
только это не люди
Колокол наконец-то сработал!
Ой а это действительно радует))
Согласен
После часа
Крашер учит ИИ самопожертвованию:
также ИИ: 5:24
Ахахкхккх
@@krashher_ai в этом случае нужно ввести штраф за рукоприкладство
А сделай 1,5 баллов тому кто сбегает с деньгами в красный выход, но потом чтобы какое - то последствие произошло. Думаю было бы интересно
угу, отнимание всех денег с определённым шансом
Вся проблема нейросетей это то что это чистая математика. Если сбегать будет выгодно то он будет сбегать, если же нет то и сбегать не будет. Здесь нет не логичных решений как у людей
@@TamirlanVelikii вто время мозг человека которий комп 🙂👍
Просто нейросеть нужно улутьшить
Внимание: не один искусственный интеллект не постролал
Ладно не постралал , а пострадали то сильно
Делай видосы почаще! Мы тебя любим))
Спасибо, и я вас))
А новый видос прям очень скоро будет, я уже нейросеть доделал, сейчас с монтажом запарюсь и где-то к четвергу будет)
@@krashher_ai Спасибо, у вас очень качественный контент!
@@krashher_ai Это правда ты крутой (лайк)
@@krashher_ai У тебя лучший контент!
Скоро: ИИ учится быть человеком.
Детройт:Стать Человеком
@@ecartelement Да :000
Ждём обучение WWE и тогда мы увидем настоящих ♂️ Dungeon Master's♂️
было бы интересно посмотреть на работу ии на примере 10 солдат и что бы некоторые имели какие-то особенности
как бы они действовали
Хмм... было бы интересно посмотреть если бы штраф для того, кто умирает был не в 2 раза меньше, а на совсем маленькую долю, скажем на 0.01, через сколько ходов бы нейросеть догадалась бы, что лучше пожертвовать собой. Так же можно было бы убирать 0.15 или даже 0.2 очка тому, кто выживает, как дебафф от потери своего.
Друзья моих знакомых: (моим знакомым) «Я буду за тебя горой!»
Мои друзья: 5:25
То чуство что даже ИИ смогли поделить свой обязанности
Пытаясь создать альтруиста
Случайно породил сата..кхм.. Эгоиста
Я конечно понимаю что на ролик это не растянуть и что это может быть слишком запарно, но что если добавить 3-й "мозг" для нашего Рикардо чтобы он старался избегать Билли и Вэна, а для честности ( на самом деле для того чтобы Рикардо не забил на главную цель) добавить препятствий в виде маленьких стен и рандомный спавн всех 3-х участников. Как бонус оба выхода будут в одной комнате
Надо будет научить ИИ меняться ролями при надобности (например: что бы пройти в следующею комнату нужно дёрнуть рычаг, но рычаг будет в разных местах например: рычаг может находиться за жалюзи и туда может пройти только Вэн или рычаг может стоять высоко и только Билли до него может дотянутся)
Так подобное было в серии про побег из тюрьмы.
Самый лучший канал по созданиям нейросетей
Спасибо))
Блин, я только что понял, что Билли и Вэн это Billy Herrington и Van Darkholme
А three hundred bucks это триста долларов дада, все так.
Можно прилумать что нибудь ещё связанное с разделением обязанностей. Всё таки наблюдать обучение делегирации очень интересно
Крашер красавчик, даже читает коменты под прошлые видосами
Спасибо тебе за твои ролики! Это каждый раз такое чудо ^^
Спасибо большое))
Предлагаю попробовать следующий сценарий: сделать подряд несколько сессий. Например изначально нейросети есть по одному баллу. Если баллов не остаётся, то напарник пропадает. Выиграть становится невозможным. Таким образом напарник нейросети будет вынужден начать чередоваться со своим товарищем, если он хочет выиграть, а не уйти в минуса.
По идее это должно улучшить командную работу.
При настоящем пожертвовании ты теряешь абсолютно все,и не получаешь какие то очки(это если смотреть объективно,а не с точки морали).Они просто научились находить в этой ситуации меньшее из зол ,а чтобы они стали реально заниматься самопожертвованием надо им дать какие то чувства чтобы на основе их решали эту задачу.
@Mqzdc Dpenu наоборот.Вы в примере указали деструктивное решение мозга без получения выгоды.Простите если я вас не так понял.
А что если сделать не мгновенную смерть, а по ударам. То есть один бьёт грабителя, а урон получает тот кто бил и грабитель. Суть в том чтобы дать шанс выжить обоим героям за счёт чередования их ударов.
Поддерживаю
Умножаю.
Крутой контент,снимай чаще💪
Нужно было сделать еще два эксперимента, один, где у них обший счет, а другой, где раздельный
Снимай в том же духе! Видосы класс! Каждый раз мы узнаём что-то новое про поведение неиросетей
Спасибо большое, рад стараться))
Настоящие dungeon masters, так отважно жертвуют собой ради общего блага)
Больше таких видео!!) ну и код бы ещё у нему)
Надо было добавить получение очков за время, без этого им не было смысла спешить, поэтому они вечно тупили
это верно
Попробуй реализовать кооператив 3-х нейросетей (чем больше людей в одной команде, тем больше балов)
Через Q обучение
самый печальный финал, лучше чем в драмах
Надо было наказание, за смерти одного и того же участника подряд, увеличивать, чтобы они менялись.
Так нельзЯ делать. Каждая попытка не связана с остальными
@@Grizlek В том то и дело, из-за того что не связана они и не думают о том что было раньше. Кто запретил так делать? А что если бы в задаче напавший не умирал а ранил себя, и на следующем уровне мог регенерировать если не ранен? Тогда научится подменять друг друга стало бы частью стратегии победы.
2:00 также я который написал нейросеть на scratch
А будет ролик, где ии решает моральные задачи типа задачи с неуправляемой вагонеткой?
А разве всё зависит не от того сколько баллов ему дают? Если дают за спасение того или иного количества людей меньше чем штраф за убийство то ИИ будет выбирать всегда только тот вариант при котором он получает больше чем теряет. Например если обмен двоих спасённых на одного убитого будет не выгодным, то он будет бездействовать, но с теми же числами за спасение но уже с 10 людьми он решит что их спасение даёт больше баллов чем штраф за убийство одного, соответственно сделает выбор в их сторону. Конечно это только в рамках этого метода обучения ИИ, но кажется с другими видами обучения ситуация не сильно отличается.
Отличный ролик. Жду ещё подобных "моральных" дилемм для нейросетей)
Спасибо)
Думаю нужно изменить способ обучения нейросети. Ведь когда кто-то жертвовал собой ради победы, то он получал -0.5+1=0.5 очков. А при поражении -0.5. Тут что-то не так. Он должен был обучиться самопожертвованию. Скорее всего дело в том что программа считает что полученный потом 1 очок за победу уже не связян с предыдущим поведением. Я думаю что настройкой обучения нейросети можно сделать чтобы эта связь сохранялась дольше.
Вэн навсегда останется в наших сердцах героем
Помним, любим, слушаем гачи миксы
я придумал следующее видео неиросеть учится убивать
Ура новый видос))
Круто!
Обожаю тебя
Спасибо))
А вообще очень интересно как именно реализуются очки в коде и как именно мы "выдаем" очки или "убираем" в зависимости от результата.
каждое получение очков даёт нейросети сигнал что она совершила правильное действие, алгоритм анализирует его и делает корректирование в поведении чтобы именно такие действия совершались чаще, с штрафом очков аналогично, другой вопрос в том что человек не сможет просто залезть в мозг нейросети и прочитать её поведение т к оно записывается очень трудно
@@Bam_Byk оно - то ясно, но мне было интересно как именно мы даем эти очки в виде кода.
@@paperwhite3853 if (ai == molodec)
{
ochki = ochki + 0.5;
}
@@paperwhite3853 в виде кода выглядит очень просто а вот какие именно корректировки делает нейросеть мы скорее всего не узнаем т к это черный ящик
@@bebroff8828 ахахах) неплохо
Я бы доработал карту, создавая условия, когда убить врага может только один
5:14 лучший союзник
а если в условия добавить к примеру "смерть в бою" - если один толкает другого он получает +0.25, и не убивает соперника, но при этом забирает деньги, а толкнутый получает штраф за смерть, бот сам полетел на врага то он получает + 0.25
Возможно стоило добавить мини штраф за приближение разбийника к зоне. + штраф/бонус за время: минусы ежесекундные или + к победным очкам за скорость (что бы стремились быстро действовать), хотя остаётся шанс, что это сломает им "психику".
Обучи неиросеть предательству главное правило чем меньше персонажей дошло до финиша тем больше награда интересно будет ли неиросеть устронять конкурентов или решит поделиться наградой с другими
Крашер: Выпускает классный ролик за которым стоит немалая работа и просит лайкнуть ролик если рубрика нравится.
Все: Поддержим лайком!
Какой-то 1 чувак: А не поставить ли дизлайк?
Ох уж эти австралийские фокусы
Крааааашееееер, а вот что собственно представляют из себя библиотеки Юнити? Типа, они какие то методы добавляют? Где можно почитать о них?
Если б убийство своего напарника всё же стало выигрышной стратегией, я бы поверил в живость этого ии))
Ура, новый видос!!!
Они научились подставлять...Они научились думать...ОНИ ЖИВЫЕ,БЕГИТЕ!!!
Тест Камски.
Способна ли машина к эмпатии?
Создай ИИ который будет ходить в магазин
Будет создаваться рандомный список покупок где ИИ должен выбирать их, НО если ИИ не пройдёт кассу а сразу побежит к выходу то ему потратят очки
Если он доберётся до кассы и пойдёт на выход то он получит очки
Если ты сделаешь это то назови пожалуйста персонажа Глеб, просто так
7:58 забейте - Вен просто клал на всю идею
Ожидание приводит к выходу твоего ролика🤔
А лайки делят время ожидания пополам🤔
Попробуй сделать, чтобы трупу не давали "баллы". Очень жду
Ну прям Вдова и соколиный глаз....
Годно)
Я ожидал того чтобы они дург друга толкали на врага
Billy не умер... Он просто ♂️Boy Nextdoor♂️
Надо было сделать еще так чтобы награду получал только тот к то её донес. Ну или кто донес получался бы больше награду. Интересно как бы она начали конкурировать)
фактически тот кто нёс деньги и так получал больше очков, у него же не было штрафа на убийство
Ты топ кстати
Спасибо))
Нужно было зделать так чтобы когда один умирал другой получал очки
кто выжил и вернул деньги на место, ему нужно было сделать меньше бонус на эти ,25 очка и тоже посмотреть что бы вышло
Что бы нейросеть не действовала по одной тактике то система штрафа должна умножаться, за серию ошибок больше штраф. За предательство также должен быть штраф чуть ниже смерти, но увеличивающийся при серии. Смерть должна быть чуть более выше чем отпустить преступника, но при увеличении штрафа отобьёт желание каждый раз отпускать преступника и серия штрафов должна обнуляться если ии выигрывает по другой тактике.
В общем опыт слишком линеен и не сильно дает другого выбора для ИИ, это не самопожертвование, а просто поиск простого пути. По сути ии не выбирает жертвовать собой или нет, она делает то что принесёт больше очков, но при более детальном продумывании, тактики всегда будут меняться.
P.s. в конце концов конечно все равно появится лишь одна тактика, но так интереснее)
надо было сделать , что-бы если тшраф уходил в - баланса , до штрафует в 2 раза сильнее , дабы они поочерёдно жертвовали собой
Мне кажется данный эксперимент раскрывает проблему, которую в будущем придётся решать с ии роботов, ведь в будущем получается есть вероятность, что ии сможет подвергать опасности человека для достижения своей цели.
А что будет если повысить штраф за невыполнение задачи? А за смерть вернуть на 0,5
не нужно было добавить два портала в которые можно отнести деньги после самопожертвования но один это типо искушение оставить себе а другой вернуть обратно
было бы круто если бы ты добавил возможность предательства
попробуй прописать код на очки за выживание чтобы была мотивация жить
Ну чето как-то костыльно. Ну что ж, отрицательный результат - тоже результат.
Сделай нейросеть которая будет играть в CS GO
А что если две нейросети будут управлять одним "роботом"? Например один двигает налево и направо, а другой вперёд и назад.
они просто синхронизируются я думаю, например есть люди у которых 2 головы и одно тело редкие ситуации но всё же, и у них как раз управляет голова только своей половиной, вроде живут и даже не плохо
Кстати возможно будет так, да, если будет достаточно частей тела, либо действий, чтобы они смогли обязанности разделить
Задумка интересная блин, спасибо за идею)
Здесь должен быть мем про ДИМОН!!!!та да дан
А если добавить ещё одну нейросеть которая будет мотивировать скорость действовать хоть как-то ,например вор получает за каждую удачную попытку убежать (+0.1) плюсы ,а Били и Вен наоборот получают минус (-0.1) из полного цикла обучения ,(за первый цикл игры если выиграл Били и Вен (общий щёт у них 2-их 1.5) это рассуждения к тактике с предательством )
можешь в следующем абсолютно в любом эксперименте создать условие, за минимальное движение... то есть сдвиг на один пиксель это один шаг, а 10000 шагов это -1 балл.
Пожалуйста сделай сражения ботов на мечах.
А что если сделать эволюцию существ в 3D масштабе, что боты сами выбирали эволюцию на пример добавочную конечность или рост или корпус но они были бы в разных условиях
Это очень труднореализуемо.
@@paperwhite3853 это скорее труднооптимизируемо
на самом деле даже 2д существа не реализовали в полной мере (только с эволюционирующими клеточками), а ты уже про 3д говоришь
@@paperwhite3853 ИИ само по себе труднореализуемо.
Не ну били вообще ничего так устроился, мне бы так жить
Следующее видео: ИИ учиться чувствовать
Чувствовать касание 🗿
@@user-zr9cd6mx7h нет, я про эмоциональную состовляющую, просто не знал как написать по другому
Крутое видео, не буду писать идею 3 раз подрят.
Я все идеи читаю и выписываю себе/скриню обычно, поэтому спасибо)
@@krashher_ai Спасибо, надеюсь у тебя будет много подписчиков, годные видосы делаешь.
При условиях того, когда смерть отнимает 0,5 очков у "пушечного мяса", а победа Б&В дает обоим 1 очко, было бы круто, если бы Б&В имели, как личный счётчик очков, так и общий, в которой каждый из 10 раундов бы добавлялось по 50% от текущего счета каждого. Сбежавший враг же получает 3,8 очков за раунд. Победа присуждается только тогда, когда герои имеют на общем счете больше очков чем враг.
Изменили бы они тогда свою тактику?
Смешно и круто
Когда сделаешь нейросеть которая снимает видео?
Я тут в первые и после слов про данжен мастеров и сри хандред сразу подписался не глядя
А так такое я вижу в первые
И подписчиков для такого что то маловато
Ты достоин как минимум пол ляма подписоты
Ахаха, спасибо))
Один ИИ пришел к тому что умереть и потерять 0,25 лучше чем 0.5
Второй же вообще вышел из системы - он лишь знал что если поднимет заначку - то получит 1.
Это не разделение обязанностей и самопожертвование.
Думаю в идеале было бы если бы они пришли к тому чтобы умирать по очереди. Так они оба бы выигрывали меньшую часть...
Однако оба 100% получали бы хоть сколько-то.
Жаль конечно. Но они все же поступают как люди.
Идеально было бы если они по очереди умирали. ( Жаль не показали в конце их очки )
Крашер, а что если научить ии проходит квесты?)
Интересно, а если добавить ии замедление от разрыва очков, к примеру тот у кого очков меньше получает замедление по нарастающей, и так до тех пор, пока он не будет настолько медленным что не сможет догнать грабителя, а другой у которого очков больше наоборот будет ускоряться, как в этом случае будет поступать ии? Смогут ли они придти к балансу очков в котором они допускают минимальный их разрыв?
Я бы хотел видеть подобный эксперемент но с ИИ детективом.
Неважны условия и прочее. Я просто хочу чтобы был ИИ детектив.
Видио очень иньересные и позновательные✔️. Научи нейро сеть залезать по леснитсе
Начнем со ступенек))
@@krashher_ai а ну да
Нет блин со стримянки
С каких пор рикардо потребовалось 300$? Я думал для него фистинг в dungeon бесплатный
Он украл их для своих fucking slaves
Ждём перестрелку двух ботов))