БЫСТРЫЙ КОД - ФУЛ ГАЙД

Winderton

Просмотров 52 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 14 ноя 2024

Комментарии • 224

@rtgiyrefbgowigi3406 13 дней назад ⁺⁷⁵
06:00 - ошибки при проведение замеров: 1) не прогрел кэши путем вызова функци до замеров, 2) измерение провел одним наблюдением (необходимо проводить множественные наблюдения и выполнять статистическую обработку, 3) перед измерением необходимо подготовить рабочий стенд (хотябы выключить все фоновые программы, а лучше еще и зафиксировать настройки аппаратной платформы - иначе рискуете получать лучшие результаты на бусте процессора и худшие на его базовой частоте и получить неверный результат). Это все придирки, если вы наносекунды выдрачиваете (что эквивалентно единицам, десяткам и сотням тактов процессора), а не миллисекунды (что уже миллионы и миллиарды тактов процессора).
@Qrlik 13 дней назад ⁺¹⁴
возможно надо просто для начала не замерять debug 😊
@Sylvadorr 13 дней назад ⁺²
Я так понимаю ты по опыту всё это заметил. В какой области его обрёл? Интересно где такие дикие замеры делают
@rtgiyrefbgowigi3406 12 дней назад ⁺³
@@Sylvadorr такие замеры корректно делать в любом месте, где стремятся выжать из железа максимум
@rtgiyrefbgowigi3406 12 дней назад ⁺²
@@Qrlik а еще не использовать для замеров системные счетчики, а только процессорные
@Sylvadorr 12 дней назад
@@rtgiyrefbgowigi3406 Вот мне и интересно где к этому так стремятся)
Я бэкендер и нам не платят за производительность, нам платят за фичи)
Производительность берется во внимание только в случае критической ситуации
@rtgiyrefbgowigi3406 13 дней назад ⁺⁶⁶
04:00 - автор дает неверное понимание (вывод) обсуждаемой им скорости операции сложения двух целых чисел: именно скорость сложения (как код на языке ассемблера, выполняющий сложение двух целых) не отличается. Отличается здесь количество инструкций, предшествующий операции сложения и контекст выполнения. Для C-программы это попадание в точку входа программы, загрузка операндов, выполнением операции и выход из программы. Для Python же между точкой входа программы (а она обязательно есть) и загрузкой операндов происходит исполнение части программы, интерпретирующей язык. Т.е. в скорости сложения отличий-то нет, есть отличия скорости работы программы в целом, т.к. С-программа уже собрана для выполнения на процессоре одной операции, а Python-программа runtime интерпретируется из исходного текста программы, доходит до операции и выполняет ее. Неверно утверждение для питона про "сотни инструкций чтобы сложить a+b". Верно будет "сотни инструкций, чтобы добраться до сложения a+b"
@demeisterx 13 дней назад ⁺¹⁹
Думаю автор это и имел в виду, лично я так и понял
@kooorpatovnikooolay8340 13 дней назад ⁺¹
Тоесть если прога доберется до 1 сложения, то второе сложение будет +- как в c?
@AntonyKondr 13 дней назад
@@kooorpatovnikooolay8340да, типо того, интерпретатор - та же программа написанная на Си, банально её выполнение и инициализация ядра (если угодно) гораздо дольше, чем короткая программа сложения двух чисел, но когда интерпретатор инициализируется, в дело вступает уже интерпретация байт кода (читай выполнение сложения двух чисел), но всё равно, интерпретация будет происходить дольше, чем выполнение чистых инструкций, если нужно оптимизировать такие места, то пишут модули для питона на Си
@HelloThere-ki5zg 13 дней назад
@@kooorpatovnikooolay8340 операция сложения на уровне процессора выполняется одинаково для любой программы. Будь она написана на си или на питоне. Главное помнить про трансляцию в байт код некоторыми языками (питон один из них), а так же связанную JIT компиляцию.
В целом, мой первый курс был довольно хорошим, раз я помню это до сих пор
@DiDiLightChannel 13 дней назад ⁺¹
Автор прям так и сказал) Да и любой кто кликнул на это видео и так бы понял это)
@crimfi 12 дней назад ⁺⁴³
"команда выполняется за один герц" -- чувак, ну это непростительно. Кто-то из зрителей так и запомнит теперь. После этого дальше смотреть как-то не хочется, если на уровне школьной программы такие траблы, как верить всему остальному
@Awbool 9 дней назад
Согласен, физику в школе прогулял, теперь рассказывает то, о чём не знает.
@ivanprokofyev 9 дней назад ⁺²
Да ладно, понятно, что за такт.
@pav28amur 8 дней назад
Автор видео никак не мог так оговориться. Это специально было сделано, что бы была движуха в комментах) И это можно понять, ведь ютуб продвигать будет именно такие комменто-активные видео
@ivanprokofyev 8 дней назад ⁺¹
@@pav28amur, ой, да ладно всё в конспирологию превращаеть! )
Автор не оговорился, а искренне так понимает физические процессы в CPU.
@ИванВоронин-и2м 8 дней назад ⁺³
За один Герц - это за время жизни Генриха Герца - примерно 36 лет и 10 месяцев )))
@whitebeef3723 13 дней назад ⁺⁸⁶
Ускорил циклы на 10%, сэкономив 30 мс, а потом оказалось, что запрос в базу выполняется секунду(
@goginot_YT 13 дней назад ⁺²
Можно использовать асинхронность, чтобы процессор не простаивал
@shinkey7808 12 дней назад ⁺⁴
@@goginot_YTТы правя, но все в итоге свелется а тому, что задержка сети станет наибольшим узким горлышком, и ие не оптимизиркешь
@whitebeef3723 12 дней назад ⁺¹¹
@@goginot_YT Использовал асинхронность, а потом оказалось, что один запрос в базу зависит от запросов в другую базу(((
@darktmdarkness6952 11 дней назад ⁺²
ага и именно потому что запрос в базу выполняется секунду, у тебя логает поле в вода, при вводе текста больше n символов. Ох, уж эти адепты все упрется в базу, потому пофиг и не парьтесь, пишите парсер текста как угодно, похрен что он может ast построить за 20мс против 5 секунд, запрос в базу то целую секунду длится....
@necroticuss6780 11 дней назад ⁺²
А чё вы так тупо упёрлись в запрос к базе?
А ещё прикиньте бывают базы разные... С блюмфильтрами на wyhash работали? Всё очень быстро!
Не несите чушь!
@hater0k985 12 дней назад ⁺²⁴
Для справки, инструкция обрабатывается не за герц, а за такт, точнее за n-ое количество тактов. Такт - вибрация на кристалле процессора. Тактовая частота процессора показывает количество этих самых вибраций в одну секунду, а герц - это всего-лишь единица измерения тактовой частоты.
@sphardegod5451 11 дней назад ⁺³
то есть если у меня моя программа например занимает 1000 тактов, а проц на частоте 3.2 ГГц, то проц выполнит ее за 1*1000/(3.2*10^9)=312 наносекунд, это так работает?
@hater0k985 11 дней назад
@@sphardegod5451 Да, именно. Иными словами она выполнится очень быстро.
@artemking4460 10 дней назад
@@sphardegod5451ну почти, там еще время на запросы к памяти, если ты с ней работаешь
@Awbool 9 дней назад ⁺¹
Позитивные вибрации... Ещё один.
Сказал бы уж Импульс. Тактовый импульс, который переводит процессор в следующее состояние.
@vitalyl1327 8 дней назад
За один такт на любом современном OoO процессоре завершается более одной инструкции. Не путать throughput и latency.
@terpiIa 12 дней назад ⁺³
я думал это видео про rust, ведь он имеет ⚡blazingly✨fast 🦀performance🔥
@mffatty2371 4 дня назад
А ещё у него есть супер ⭐система 💻сборки 🗑cargo 💼
@mirrim_job 13 дней назад ⁺¹⁸
А где 10 часов C++???
@gleb-dev 6 дней назад
Удивляет количество критики в комментах. Спасибо большое, автор, смотрится интересно и с удовольствием!
Предлагаемые в видео подходы - не только и не столько погоня за мелкими и преждевременными оптимизациями. Пусть они мелкие и преждевременные, но программисты, которые не обращают внимания на перформанс на этом этапе, в дальнейшем начинают городить тяжёлую архитектуру, слать последовательные, а не параллельные запросы в сеть, писать тяжеловесные event-bus'ы вместо простого вызова методов и т. д. Суть в том, чтобы воспитывать в разработчиках дисциплину компактного и производительного кода, а благодаря этому он станет и более читаемым, и более поддерживаемым, и более прибыльным.
Неоднократно видел удручающе тяжеловесный код, написанный моими коллегами, где вместо 500 строк можно было написать 100. И после рефакторинга всем становилось легче и приложение начинало работать быстрее. Эта проблема действительно существует, и любое освещение темы очень ценно.
@TigerRUS 13 дней назад ⁺²³
Вот это уже очень интересно.
Need for Speed: Undercode
@kamenyFX 10 дней назад ⁺⁵
"я на винде", дальше не стал смотреть
@alexeiskipetrov6016 8 дней назад ⁺⁹
Я искренне надеюсь, что люди после этого видео не начнут вводить такого рода оптимизацию с сложением чисел с помощью 128б регистров в свои программы. В 99% случаев для конечного потребителя ( клиента или бизнеса, без разницы) никакой пользы для этого не будет, а нам, потом этот код поддерживать.
Пример с гуглом и 1% производительности == лярд долларов -- не состоятельный. Потому как если бы люди запаривались над этим 1 процетом, то написали бы меньше кода, соответсвенно компания бы запустила меньше продуктов, и получила меньше прибыли.
В остальном тема действительно интересная только в каких-нибудь аспектах где это действительно может потребоваться, там где используются большие массивы данных. Например при обучении или использовании нейронок. Вот действительно хороший пример, который показывает насколько важна оптимизация.
А вообще осуждение за название видеоролика, очевидный кликбейт.
@Turqure_rombus 6 дней назад
Если да кабы
Ты просто оправдываешь лень и не желание разбираться .-.
@DrMarkusMoro 5 дней назад
Можно запустить 100 продуктов за день и в каждом стараться писать меньше кода, в этом же идея... Но почему-то "меньше кода" стало "меньше продуктов" и "меньше прибыли".
@alexeiskipetrov6016 День назад
@@Turqure_rombus В том числе)
@ivanprokofyev 8 дней назад ⁺¹
9:10 На канале Casey Muratori всего 19 видео, по каким его работам учился?
@call_nick 13 дней назад ⁺²³
1 герц чтобы быть обработанной 0:50. Не герц, а такт
@Денис-о5с9ш 13 дней назад ⁺³
такт,который обрабатывается за один герц,если тебе угодно
@rtgiyrefbgowigi3406 13 дней назад ⁺²
@@Денис-о5с9ш только скорость выполнения инструкций все-таки прописывается в мануалах в тактах, а не в герцах
@genzonlinew 13 дней назад ⁺⁴
@@Денис-о5с9ш герц - не единица измерения времени, а единица измерения частоты - равная 1/сек. Такт не может обрабатываться за один или сколько-то ещё герц.
@user-xu6hn2yf3l 13 дней назад
@@genzonlinew а почему тогда говорят "тактовая частота"? Частота измеряется в герцах. Так если процессор 100 герц, то он делает 100 тактов в секунду. Можно ли в этом случаи сказать, что команда выполняемая за один такт выполняется за один герц? Конечно нет, потому что герц всегда 100.
@Egor00f 12 дней назад
@@Денис-о5с9штакт выполняется за 1/частота
@xorax-cq6pl 6 дней назад
Спасибо за классный разбор. Напомнило разборки за Clear code, проповедующий читаемые исходики любым дядей с улицы - как итог сравнения "СС" и человеческого в производительности СС уступает в 30раз. 30, блин. И люди продвигают эту идею чистого кода, но не продвигают идею чистого разума( Действительно, прогресс принес крутые железки для програмеров, но и тут палка о двух частях, с одной крутое железо, а с другой человеческая лень))) Вот и получаем патчи оптимизации скорости и плавности работы исправляющие косяки, по какой-то причине в процессе разработки и тестирования не замеченные.
@tldr_rm_-rf 8 дней назад ⁺¹
12:08 вообще-то обороты скорее сбавляются. Это в 80-х выжимали из железа максимум.
@gendalfgray7889 13 дней назад
В анрил энжоне в ниагаре для частиц выбираются разные алгоритмы, если алгоритм не динамичный то он сделает сам все кэши.
Например если было указано что эммитер живет 5 сек и он создает 20 частиц каждую секунду, а частица живет 0.2 сек то система сама посчитает сколько одновременно частиц будет максимально и выделит ровно столько памяти.
В компиляторах надо такую же штуку сделать, указываешь что у тебя цикл будет от столько до стольки максимум например.
@ПолапановВладимир 8 дней назад
Даёшь вторую часть!
@goldsucc6068 8 дней назад ⁺¹
В энтэрпрайс программировании скорость выполнения не имеет значения, важна только надёжность. Если использованы правильные алгоритмы конечно. С текущими микросервисными ландшафтами большую часть времени комп будет ждать передачи данных в любом случае. Кстати, преждевременная оптимизация - корень зла. Такие дела, калики. Дееем дальш.
@shurmurray 13 дней назад ⁺³⁹
Бомбануло от того, что программисты трудятся, чтобы программы станрвились быстрее ))
Это в какой реальности так? Наоборот, все становится тяжелее и медленнее. Деньги платятся за новые фичи, и крайне редко - заулучшение старого или за быстродействие.
Ну и общая проблема медленного, тяжелого кода в потребительском софте - не в том, что программисты не умеют или не знают за оптимизацию. Проблема в том, что код в принципе совершает бесполезные действия - открываешь простую на вид веб-страницу, там текст с картинками. А твой ноут начинает все вентиляторы раскручивать, будто взлетать собрался! В джаваскрипте в бесконечном цикле запросы на какой то сервер летают, а сбоку в дырку для рекламного банннера приехало видое весом 0,5 Гб. Программирование сломано на более высоком уровне. Здесь никакие simd и jit проблемы производительности не решат.
@rimux8898 13 дней назад ⁺³
Программисты могут и зачастую даже хотят сделать программы эффективнее, просто бизнесу не до этого, ему нужно увеличивать количество зарабатываемых денег, что в принципе понять можно.
@diam0nddangel336 13 дней назад
Ну так в том то и мем, теперь модно не фичи выпускать, а оптимизировать
@Drochuk 13 дней назад
Всегда писал с расчётом на оптимизацию и всегда не понимал тех, кто дрочит на пыху или пуптон
@goginot_YT 13 дней назад
Это всë NVDIA! Компания рептилоидов, которая заставляет разработчиков писать на пайтоне или скретче и кажду секунду расчитывать синус. Это всë они!
@vincentvince2136 13 дней назад ⁺²
Лол, так ты попробуй найти время на оптимизацию, когда тебе компания выделяет 10 минут на написание программы запуска ракеты на марс.
Программисты может и не против оптимизировать, но на это просто не выделяют финансирования
@SadKavkaz 10 дней назад ⁺¹
Срасибо за ссылки, за инфу +-.
Не удаляй пожалуйста комментарии (я видел, что ты сказал не будешь удалять, но все же)
В комментах адская жара, сюда похоже залетели все супер щарящие типы (о длинных поправках в адрес видео)
Супер интересно, удачи всем
@kosar33 10 дней назад ⁺¹
0:43 Нет, инструкция не обрабатывается за 1 Герц (1 Раз в секунду) при тактовой частоте процессора 3 Гигагерца (3000000000 раз в секунду). И тем более 1 Герц (1 раз в секунду) не может быть быстрее 200 Герц (200 раз в секунду). По сути, автор сказал, что более сложная операция выполнялась бы 200 раз за время простой операции. 1 секунда не быстрее 0.005 секунды. Такой вот trouble 😅.
@apkawa 13 дней назад ⁺³
Вообще-то оптимизация - стезя инженеров, а не программистов. Обычные программисты дальше компилятора ничего не видят. Поэтому, чтобы писать быстрый код, нужно быть еще и инженером; понимать, какой код нужен, какой не нужен.
@necroticuss6780 11 дней назад
Дожили, вот и быдлокодеры.
Для успешного кода надо понимать 3 вещи.
Архитектуру железа,чёткое знание языка программирования и понимать структуру исполнения. Где на базе всех трёх описанных выше вещей будет плнимание узких мест в исполнении!
Быдлокодеры...
@aleksanderostrowski7785 13 дней назад ⁺¹
Круть! Обожаю эти видео)) Спасибо!
@DlinnyLag 8 дней назад ⁺¹
4:32 - а где кэширование и распараллеливание?
@rtgiyrefbgowigi3406 4 дня назад
кэширование там есть. Распараллеливание - не такая уж и простая оптимизация
@Satoshic_ 13 дней назад ⁺²
6:20 только забыл упомянуть, в реальном коде никогда так делать не надо, это не имеет никакого смысла, у тебя есть компилятор и это его работа оптимизировать твой код, и по факту если посмотреть на все 3 варианта в том же godbolt, то по факту вывод в ассебмлере будет одинаковый, так как компилятор сделал оптимизацию и выбрал самый эффективный вариант, а тот который ты написал стал менее понятным
@Tezla0 13 дней назад
И эту работу компилятор выполняет крайне плохое, поэтому так делать надо
@Satoshic_ 10 дней назад ⁺¹
@@Tezla0 я закинул пример в godbolt, уже при использовании -O1 компилятор вычислял результат во время компиляции и при вызове функции просто возвращал его, можете пожалуйста дать пример кода, который компилятор не смог так оптимизировать
@gendalfgray7889 13 дней назад
9:15 как его полностью зовут?
@88coolv 10 дней назад ⁺⁷
Говорить, что производительность - одна из главных проблем, на этапе развития индустрии, когда эта проблема стоит исторически наименее остро (и по сути в принципе проблемой практически ни в каких отраслях не является) - это просто ультракек, конечно. Я понимаю, что ты только вылез из криокапсулы, но сейчас 2024, не 1970.
@mffatty2371 4 дня назад
Не рассказаны как оптимизировать основные длительные операции, которые встречаются в вебе, хотя о нем было затронуто
@ivanprokofyev 8 дней назад
5:36 Поясните, кто нибудь, как и за счёт чего это работает - unrolled2 и unrolled4 обрабатывают 2 и 4 элементов массива или миллион?
@Inhuno 13 дней назад
3:05
что за менюшка, как её вызвать?
@mndtr0 13 дней назад ⁺⁴⁰
Промпт-инжиниринг - вот настоящая новая мета программирования!
@D06P9lK 13 дней назад ⁺¹
Если ты программист да)
@Torbjorn-ph7rt 13 дней назад ⁺⁵
Потом добавят в промпты ветвления, циклы, переменные, функции, классы и модули и наконец настоящая мета программирования будет достигнута!
@ramazangit 13 дней назад
А где учить
@Lodarev 13 дней назад ⁺²
@@ramazangit нигде , про эту профессию все говорят, но что она из себя будет представлять никто не знает. Главное трубить , что это будущее ребята камон и все бегут сразу
@thefirstuwu8874 13 дней назад
Тот самый, который сам уже заменен ИИ))))
@ПолапановВладимир 8 дней назад
А ООП замедляет?
@melsior1 10 дней назад ⁺¹
оптимизируешь, зп получаешь, потом раз и обновление микрокода прилетает и херачит перфоманс на 10 - 15%
@rtgiyrefbgowigi3406 4 дня назад
поэтому надо переходить на VLIW. Никакой микрокод оптимизации не сломает, только компилятор)
@rtgiyrefbgowigi3406 4 дня назад
Сильно оптимизировать под x64 смысла нет, когда приложение идет под работу на куче процессоров разных микроархитектур.
@mixail154 10 дней назад
А где алгоритмы и структуры данных? Как раз засчет них ускорение происходит не на 10-20% а буквально в десятки раз
@ИванДорофеев-в8з 13 дней назад ⁺³
хотел поставить лайк, но потом началась реклама скилфектори
@VeneraMilosskaya-w9v 9 дней назад
А чем не нравится эта школа? У них хорошие курсы, я после них работу быстро нашла, причём по их же наводке)
@nay3fire 8 дней назад
@@VeneraMilosskaya-w9v Мне кажется там проблема с возвратом, где-то слышал как чувак пытался вернуть курсы, тк. он понял, что уже это знает, а его послали.
PS: Но хотелось бы все же реально узнать в чем проблема, мало ли
@ДанилДанилов-н7м День назад
Гораздо масштабнее проблемы на верхнем уровне: архитектура кода, эффективное распараллеливание, асинхронность, распределение нагрузки, масштабирование с поддержкой консистентности данных, latency сетей и тд и тп. Оптимизацией циклов на 1% CPU пусть занимаются Intel и разработчики конкретного ЯП и его кора.
@Name_of_Name_of 6 дней назад
Божечки, какие же тут супер спецы собрались. И про "зачем sse, когда avx512 есть", и про оптимизацию через -о2 (почему-то про -о3 не говорят), и про "компилятор всё сам умеет"...
Я всем хочу привести простой пример. Мы перепесали Java-бэкенд, котрый крутился на VDS, на плюсы. И знаете что? Бэкенд не просто стал быстрее, он стал плавнее и меньше потреблять ресурсов на 60% (примерно). Хотя всё до этого говорило, что такое не осуществимо и не особо перспективно. Но в итоге, клиент за облако стал платить в несколько раз меньше (уменьшилось количество VDS, нагрузки и т.п.).
И таки да, мы использовали тпкие вот "преждеврепенные оптимизации".
@sequenc3ofactions 13 дней назад ⁺²
хотелось бы увидеть видео про углубление в comp scie
@zuzananovak6886 11 дней назад ⁺¹
У него целый плейлист есть на эту тему
@vryaboshapko 9 дней назад
5:16 тут, видимо, опечатка, в правом примере забыл убрать, собственно, цикл.
@SPRBBR 12 дней назад
Наконец-то видос про оптимизацию
@l1ps802 13 дней назад ⁺¹
Товарищи требуем 10 часов C++.
@Wladmaster 13 дней назад ⁺¹
Бро, я хочу отлично разбираться в программировании, но какое бы обучающее видео я не открыл, я всегда вижу то, как рассказчик показывают путь, но не говорят о направлении этого пути: они объясняют что к чему но не объясняют зачем, более того, даже в обучающих видео, если я не ошибаюсь, берут айтишные термины будто бы из ниоткуда (может всем людям которые смотрят айтишные видео объясняют всю самую базу слов которую мне не выдали...). Есть ли у тебя какие нибудь материалы, которые бы помогли с этими проблемами?
@tusman4ik 13 дней назад
Найди себе (+/-) опытного чувака, и пуляй вопросами.
@diam0nddangel336 13 дней назад ⁺⁸
Специально для таких как ты существует chatGPT. Или он тебя в ЧС добавил?
Я не хочу показаться токсиком, но в 2024 уже стыдно такие вопросы задавать
@tusman4ik 13 дней назад
@@diam0nddangel336 ничего не стыдно. Всё нормально.
@SalatikInMyHead 13 дней назад ⁺¹
зач те это изучать ваще если цели нет(что создать хочеш назнешь) ??? 🤦🤦😆😅😅 сначала сам подумай без говорящих голов че делать хочешь потом тока гайды смотри ПО ТЕМЕ 👍👍👍 + проги начинай клепать
@seriously1191 10 дней назад
Чекни шортс с названием "The Best Way To Learn Programming" от ThePrimeTime. Там на английском, но очень интересная мысль выражена. И да, желательно знать английский, чтобы прогу учить, куча годных материалов на нём
@DartKane 2 дня назад
Ох... Программистам хрома бы начать так делать. А ещё, тем, кто пишет сайты вконтакта, мыльной почты и ДНС. Их сайты тяжёлые, что капец! И жрут тонны оперативы!
@ИгорьНекрасов-р1ц 11 дней назад
где ты монтируешь видео ?
@SalatikInMyHead 11 дней назад
kdenlive
@cijic 13 дней назад ⁺⁴³
Опять ты продвигаешь эту глупость с оптимизацией там, где не надо.
На выходе сразу код становится не расширяем, тяжело поддерживаемым. И для чего это всё? Для какой галочки? Зачем разработчики компиляторов вводили уровни оптимизаций, если их игнорируют и вручную хотят сделать код, который будет делать компилятор при разных уровнях оптимизаций, только код будет поддерживаемым?
Ты так давно свернул не туда.
И самое интересное, что оно бесполезно. Заниматься оптимизацией когда всё и так быстро работает (да, да, та самая преждевременная оптимизация), когда самые медленные части это Ввод/Вывод, а не ЦПУ/ГПУ - зачем?
И при чём здесь метапрограммирование, которое должен делать компилятор, до сравнения C++/Python? Я не ухватил суть.
Не увидел в болтовне Кейси топовости. Не знаю почему ты его таковым считаешь.
@Ankalot 13 дней назад ⁺¹
База
@stanislaw8179 12 дней назад
@@sls1475 Верно, работаю в компании с самой крупной экосистемой для бизнеса, большинству пользователей нет разницы на время выполнение запроса (+100 мс или +200 мс). Так что хоть тройные вложенные циклы и постоянное копирование массивов делай, в конечном счете все равно никто ничего не заметит. А сидеть бэнчить это все по часу, когда все в итоге упирается в скорость интернета пользователей и поход в БД ради 3 мс, которые окупятся минимум после 2М запросов на каждого пользователя - смело !
@dominuspiritus 11 дней назад
Тут прикол в том, что он не имел ввиду метапрограммирование, а мету программирования
@wndtn 11 дней назад ⁺³
Ты в последнем пассаже оспорил мнение типа, которого взяли в RAD.
Ты мету программирования интерпретировал как метапрограммирование.
Я, после этого, все что ты написал - по определению уже не воспринимаю.
Не удаляю твой спич, просто потому что мне похуй.
Пусть парни фанятся.
@alexandrshatilov8227 9 дней назад ⁺¹²
@@wndtn
Чел привел аргументы, затрагивающие вопросы целесообразности подобных решений - ты решил от них отвернуться, сославшись на авторитет и ошибку интерпретации.
Как 14-летний дединсайдик ЧЕЛТЫкнул и попытался вывезти на крутизне
И над чьим спичем парни ещё фаниться должны?
@sergeysem4681 12 дней назад ⁺¹
Я чет не понял, где 10 часов с++!???
@tazeey 13 дней назад ⁺¹
Computer Enhance! Course from muratori, basically said the same thing
@Dik131WZD 13 дней назад
Спасибо за ссылки
@EgorFrade 7 дней назад
В реальном мире 99.9% проблем с производительностью лежат на совершенно другом уровне; микрооптимизации валидны только в том случае, если ты досконально знаешь целевую платформу и уверен ,что компилятор этого не умеет. Те же векторные инструкции иногда с лихвой нивелируются планировщиком проца. неудачный loop unrolling может сломать спекулятивное исполнение и снизить перформанс. Современные процы на столько сложные, "умные" и разные, что нет какого то общего рецепта на микрооптимизации. Возможно один из самых универсальных советов - попытаться поместить данный в L1 кэш, и работать с ними эффективными алгоритмами. остальные трюки - это больше баловство.
@Kirieshkaxs 13 дней назад ⁺¹
Это ладно,где 10 часов С++
@Satoshic_ 13 дней назад
8:35 мне интересно где ты на 64-битном процессоре нашел 128 битный регистр, да есть инструкции, которые используют пару регистров, но это совсем не одном и то же
@mxkv67 13 дней назад ⁺¹
Не поверишь, они еще на 32-битном проце появились, назывались xmm0-xmm7, на 64-битном их стало 16: xmm0-xmm15.
@vincentvince2136 13 дней назад ⁺²
Я тебе больше скажу, на 64 битном проце есть 256 битные инструкции. И это работает по принципу, что они берут эту инструкцию и разбивают ее на 64 битные
@Satoshic_ 10 дней назад
@@vincentvince2136 я как раз таки это и писал, что разбить можно, но это не один регистр
@Satoshic_ 10 дней назад
@@mxkv67 да есть, но оперции с ними занимают больше времени, так как в отличии от регистров общего назначения ты не можешь просто взять и положить константу туда, тебе придётся класть значение в память, что будет в несколько раз медленнее, чем взаимодействие с регистрами напрямую
@mxkv67 10 дней назад
@@Satoshic_ Ну да, при работе со скалярами от них толка никакого. Зато при обработке массивов, когда все операции конверизуются и долгая загрузка перестает играть роль, можно получать по четыре результата за такт.
@kirillshestakov3180 13 дней назад ⁺¹
добрый вечер джентельмены
@nickkovaliov3525 13 дней назад ⁺¹
Я-то думал, видео про метапрограммирование...
@hate_winter 12 дней назад
10:36 кэширование для флотов)))
хех
@sleepybear101 13 дней назад
Расскажи про DOTS стек в юнити
@ilyalight1389 13 дней назад
Расскажи ещё про RISC-V
@rtgiyrefbgowigi3406 4 дня назад
обрати внимание на доклады сотрудников
Yadro
@ilyalight1389 4 дня назад
@@rtgiyrefbgowigi3406 я сотрудничаю с ядром. Хочу просто услышать мнение Виндертона
@nicivanov5135 13 дней назад ⁺¹
Все логично. Отличный подход.
Потом прилетает обновление винды 100500 гигабайт которое сносит старый но нужный софт. Может они не знают, что так можно...
@sshorins 9 дней назад
что за потрясающий арт на 4:20
@TheWaRmeN13 10 дней назад
Ну, я конечно далеко не гений перфоманс ревью, но мне кажется, что нет смысла заниматься оптимизацией cpu bound нагрузкой ОТНОСИТЕЛЬНО io bound. Исключениями могут стать лишь всякие мегагиганские корпорации по типу гугла , меты и прочего, где даже десятые доли оптимизации сэкономят сотни ты сяч долларов. Зачем пытаться оптимизировать условные 30 мс в 24, когда чтение из базы/файлика/сетки занимает 300 мс?
@sgs1662 13 дней назад ⁺²
2:17 Чел про годболт не слышал
@SalatikInMyHead 12 дней назад ⁺¹
зач ему это нужно когда есть ЛОКАЛЬНЫЙ дизасм?? с удобным ui 🤣🤣🤦 saass 👉💩💩
@vulduk3679 12 дней назад ⁺¹
Чел не слышал про -о2 оптимизации, когда эти 2 числа просто на компайл тайме посчитаются
@SalatikInMyHead 12 дней назад
@@vulduk3679 может ты еще в уме все считать предложиш а в проге тока writeln оставить??? 🤣🤣🤣🤦🤦
@keldibekov 13 дней назад
Продолжай в том же духе
@anatolykosychenko8038 13 дней назад
Hi Ya & best wishes. Thanks for work. Be Happy. Sevastopol/Crimea.
@lookfor6733 12 дней назад ⁺¹
nglsh much.
@amig0842 13 дней назад ⁺¹
навали братва 10-20к лайков
@lednikov8512 13 дней назад
Хочу некст видос по этой теме =)
Коммент в поддержку продвижения
@symbolminded5167 13 дней назад
The name is Primeagen?
@hatiko8227 13 дней назад
Ждем выпуск в красной рубашке в белый цветочек.
@Venellede 11 дней назад
Это не новая мета, а старая база…
@AneteRomanova 13 дней назад
ждем вторую часть
@fantasypicture3355 13 дней назад
10:53 это как b = 10?
@chelol208 13 дней назад
Оптимизация. Вот про что ролик.
@olegch-w3f 13 дней назад ⁺³
норм, а то я думал будет про ускорение через обкладывание себя нейросетями)
@Mohnatcin 13 дней назад ⁺²
Герц это одна операция в секунду. Школьная физика с размерносиями величин прошла мимо тебя. Процессор делает такты или операции.
@tusman4ik 13 дней назад ⁺³
Герц - мера частоты. Т е количество операций за ед. времени.
@VladislavMankevich 13 дней назад ⁺¹
да. пятница
@Zonord 13 дней назад ⁺¹
Я нихуа непонимаю аааааааааааааааааааааа
@AndreyP165 13 дней назад
Одиссею на 100%
@roujoded 13 дней назад
вовремя ты
@alexanderegoroff 10 дней назад ⁺¹
На самом деле, самое большое влияние на производительность, оказывает не то что в ролике сказано, а асимптотика основных алгоритмов программы - если вы сортируете пузырьком с квадратичной асимптотикой (вместо n log n) или для поиска используете массив вместо двоичного дерева или хэш таблицы, - вам не поможет никакой SIMD и ппрочие оптимизации. Правильные алгоритмы на "медлленном" языке, всегда будут лучше, чем неправильные но с описанным в ролике. Да, если все алгоритмы в порядке - никто не спорит что низкоуровневые языки и описанные оптимизации могут дать очень много. Но таких задач, в реальной жизни, кот наплакал. Большая часть кодеров занята перекладыванием джейсонов из одного места, в другое
@strapochek798 13 дней назад
хорошее видео
@justmarfix 13 дней назад
Огромное спасибо за видео, очень рад, что ты приобщаешь к великой базе новых людей.
@MOCHET5 13 дней назад
е прирост в несколько процентов ради ничего. ура. А пример про гугл настолько актуален, что каждый смотрящий работает в гугле. (нет)
@MOCHET5 10 дней назад
@@КириллКириллович спасибо, ценная информация, без тебя этого никто не знал, ты же один подключен к интернету во всем мире
@grosshypno 13 дней назад ⁺²
НАКОНЕЦ-ТО!!!! Как же меня бесило то, что мою программу для самопрограммирования, весившую до 50Кб антивирус распознавал как вирус и приходилось раздувать её вес картинкой.
@Rokinso 11 дней назад
Больше половины самых залайканных комментов о том, что автор в чём-то неправ. Как маслёнок, я внемлю мнению толпы и перестаю смотреть.
@lookfor6733 12 дней назад
😴 валидно для компаний с мировым охватом, и даже там не на всех направлениях. Дороги с курсами белых хакеров от лохфактори туда нет.
@qandak 13 дней назад
Экономить надо не на инструкциях и циклах, а на глазном давлении читающего код с открывающимися скобками на отдельной строке. Мракобесие индусское копируют друг у друга как черти.
@anatolykosychenko8038 13 дней назад
Shalom
@tusman4ik 13 дней назад ⁺¹
Преждевременная оптимизация - корень всех зол...
@diam0nddangel336 13 дней назад
Да вроде видос не про это
@sakrofise.7758 13 дней назад
ок
@anatolykosychenko8038 13 дней назад
👋🤜🤛🤝👏💥
@Salabar_ 13 дней назад
8:54 Если в первой функции заменить sum на массив, то получится такая же векторизация, но без непереносимой магии.
10:27 Это плохой пример, потому что корень квадратный вычисляется за 4 такта и никакое кеширование ты быстрее не сделаешь..
@DiIov 13 дней назад
Не получится так же.
Вся суть в использовании SIMD регистров процессора.
@Salabar_ 13 дней назад
@@DiIov Компилятор тоже знает про SIMD регистры.
@Nurk-hq9fz 13 дней назад
меньше 1ккк просмотров за 10 минут, скатился
@Колпак-я7ц 10 дней назад
После этого видео я понял, что код необязательно должен быть понятным. В первую очередь он должен быть быстрым
@manunaSid 13 дней назад
потому что все хотят быстро писать а не чтобы это быстро работало. asm это класс конечно но тебя не поймут люди которые не знают как жили с 16М ОЗУ
@Qew77 13 дней назад
да пофиг всем на производительность как на проблему, скорость это чисто мерялка между языками программирования, типа как хз там когда богатые меряются у кого больше ухо сломано потому что ну щас модно так
@milenko1642 13 дней назад
Первое слово на украинском прочитал
@Ais_Hunt 13 дней назад
Вывод: нахер питон.
Представить страшно что происходить у питона внутри когда обучаются нейросети.
Ещё из кул стори... а вот представте питон на 8-битном камне))))
@eil_rovisoft7097 13 дней назад
всегда можно использовать компилируемый Cython, например. Там разница скорости уже не такая большая, но да, это всё-таки компилятор, причём не такой оптимизированный, как сппшный.
@pavelkillechannel 13 дней назад
Не, скорее нужны чуваки которые делают продукт и делают его на питоне и чуваки которые просто пишут код и оптимизируют переписывают и вот это все на С++. Тогда у нас скорость разработки не упадет (а она не должна падать) и производительность появится
@SalatikInMyHead 13 дней назад
@@pavelkillechannel наконец-то с++ прогеры получат заслуженный unskilled job 👍👍
@736939 11 дней назад
Библиотеки машинного обучения для Python, под капотом пишутся на C++ и Rust. Например Pytorch, Numpy, sklearn... А создавать сложные нейронные модели в натив С++, это головная боль, даже на Python коды они очень сложные. Так-что по любому, ваш код переводится на оптимальный при сохранения нейронной сети, а дальше, можете вызывать эту модель, через Java, Go и вообще, на чем хотите.
@saionarascarsgard6023 13 дней назад
Пятый 🎉

Следующие

Автовоспроизведение