Что такое CLICKHOUSE и колоночные СУБД

Listen IT

Просмотров 53 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 21 сен 2024
В этой статье мы узнаем:
- Что такое Clickhouse
- Что такое колоночные СУБД
- Чем колоночные СУБД отличаются от обычных строковых
- Почему Clickhouse работает так быстро
- Преимущества использования Clickhouse
- Трудности при работе с Clickhouse
- Для каких проектов используется Clickhouse
- В каких сферах используется Clickhouse
- Где не нужен Clickhouse
- Советы по работе с Clickhouse
Поддержать канал разово - yoomoney.ru/to...
Поддержать канал подпиской - boosty.to/list...
Я.Дзен - zen.yandex.ru/...
Телеграм-канал - t.me/listenit_...
События и статьи про анализ и проектирование ИТ-систем - t.me/itsysdes_...
По вопросам сотрудничества - t.me/ed_akimov
Ссылка на статью 1 - tproger.ru/art...
Ссылка на статью 2 - webdevblog.ru/...
Ссылка на статью 3 - highload.today...
Что такое Big Data за 6 минут - • Что такое Big Data за ...
Что такое SQL и реляционные базы данных - • Что такое SQL и реляци...
Что такое NoSQL за 6 минут - • Что такое NoSQL за 6 м...
Синтаксис SQL запросов: Часть 1 - • Синтаксис SQL запросов...
Что такое SQL ИНДЕКСЫ за 10 минут - • Что такое SQL ИНДЕКСЫ ...
Что такое ELK за 10 минут - • Что такое ELK за 10 ми...
Что такое МИКРОФРОНТЕНД за 10 минут - • Что такое МИКРОФРОНТЕН...
Различия SOA и микросервисной архитектуры за 9 минут - • Различия SOA и микросе...
Компиляция и интерпретация за 10 минут - • Компиляция и интерпрет...
Что такое TypeScript за 9 минут - • Что такое TypeScript з...
Что такое Swagger и OpenAPI за 3 минуты - • Что такое Swagger и Op...
Введение в REST API за 7 минут - • Введение в REST API за...
Различия REST и SOAP за 4 минуты - • Различия REST и SOAP з...
Что такое HTTP и HTTPS за 9 минут - • Что такое HTTP и HTTPS...
Что такое TCP/IP - • Что такое TCP/IP: Объя...
Что такое прокси-сервер за 7 минут - • Что такое прокси-серве...
Что такое Kubernetes за 9 минут - • Что такое Kubernetes з...
Что такое Docker за 5 минут - • Что такое Docker за 5 ...
Что такое ETL и ELT за 10 минут - • Что такое ETL и ELT за...
Что такое CRUD за 6 минут - • Что такое CRUD за 6 минут
Что такое middleware за 7 минут - • Что такое middleware з...
Что такое идемпотентность - • Что такое идемпотентно...
Что такое ACID за 9 минут - • Что такое ACID за 9 минут
Что такое HATEOAS за 4 минуты - • Что такое HATEOAS за 4...
Что такое CI/CD - • Что такое CI/CD? Разби...
Что такое Code First подход за 4 минуты - • Что такое Code First п...
Что такое Contract First подход за 4 минуты - • Что такое Contract Fir...

Комментарии • 65

@da_volkov 7 месяцев назад ⁺²⁶
Случайно наткнулся на канал, и офигел от количества и качества материалов. У меня как раз задача - верхнеуровнево ознакомиться с разными технологиями, и у вас на канале почти все что мне нужно есть. Причем в доступной форме и с ссылками на референтные материалы. Спасибо за вашу работу!
@ListenIT_channel 7 месяцев назад
Круто, рад! Напишите, если какую-то тему ещё хочется послушать, чего нет на канале
@AlexDanilovFapsiSu 4 месяца назад
Качество? Разбор запроса к таблице (3-я минута). where color=543, автор читает 542; ... 2. найти колонку с именем type и её значение, когда по этому запросу нужно найти колонку с именем color.
На этом просмотр видео закончил.
Качество?
@AlexDanilovFapsiSu 4 месяца назад
@@da_volkov причём тут, что видео "обзорное"? Человек взялся публично рассказать о неких вещах, и стал сыпаться на ошибках с самого начала. И право предъявлять за ошибки возникает как раз по факту публичности.
И хамить вот не надо.
@AlexDanilovFapsiSu 4 месяца назад
@@da_volkov от тебя же корректностью так и прёт.
@KozhinDev 7 месяцев назад ⁺¹²
Только сейчас узнали, что нашу статью использовали для видео. Спасибо, что упомянули нас) Отличное видео, лайк!
@ListenIT_channel 7 месяцев назад ⁺¹
Спасибо вам за отличный сурс! ♥️
@doomox6001 Год назад ⁺³⁴
Хорошая разработка, заточенная под решение конкретных задач. В принципе так и должен создаваться софт. А когда пытаешься получить все и сразу, то обычно ничего не выходит. Считаю что разработчики яндекса молодцы.
@rudolfsikorsky7900 2 месяца назад ⁺¹
Спасибо, полезно! Хотелось бы такое же сжатое изложение по Apache Cassandra :)
@SomeGuy-q1d 5 месяцев назад ⁺¹
Спасибо! Это лучший обзор что я видел про clickhouse!
@Dimedrolity 6 месяцев назад ⁺¹
Качественный материал, полезно для меня как для разработчика грейда Middle 👍
@Артем-х7п6с Год назад ⁺⁵
Очень классное видео, спасибо! Очень не хватает уроков кликхауз для чайников, в Ютубе их почти нет)
@lolpwn6528 5 месяцев назад ⁺²
Спасибо, отличный материал
подписываюсь
@nav6526 Год назад ⁺⁶
В недостатки можно еще добавить проблемв с join-ами таблиц. Если данных много и они не помещаются в памяти то запрос упадет с ошибкой. Мы решили эту проблему с помощью разделения одрого запроса на N запросов, каждый из которых обрабатывает часть данных. Например есть таблица клиентов и таблица их заказов. В каждой из таблиц есть номер телефона клиента и нужно сделать join по номеру телефона. Если попытаться соединить сразу весь набор данных то запрос упадет из-за недостатка памяти. Но можно сначала сдрлать join для телефонов попадающих под условие something_hash(phone_number)%6 = 0, затем 1,...5. После чего объединить данные.
А еще лучше явно указывать извлекаемые поля и не использовать звездочку в select. Оитимизатор запроса в clickhouse гораздо более простой чем в oracle, postgresql, поэтому разработчик сам должен состаалять эффективные запросы.
@ListenIT_channel Год назад
Круто, спасибо, интересный опыт!
@wsxpocxeafx 11 дней назад
3:38 тот факт, что столбцы отсортированы открывает возможность бинарного поиска по столбцу, а он работает очень быстро. Раз значения отсортированы, значит добавление в таблицу строки может быть медленным, если только данные физически на диске тоже хранятся в отсортированом виде.
@artyomkhrenn Год назад ⁺²
Спасибо, отличная подача видео, быстро познакомился с кликхаусом
@mikurrey416 6 месяцев назад
Большое спасибо, очень ценно для вхождения в тему и очень легко для понимания
@SiarheiAkhramenia 2 месяца назад
Мэтод :)
Прэкрасный матэриал! (без сарказма, но про мэтод это вы конечно прикольно)
@sovrinfo Год назад ⁺²
Спасибо за видео. Коммент в поддержку!
@user-uq4ix5ie3q Год назад ⁺¹
Благодарю! Я врубился в отличия!
@andreypopov5018 Год назад ⁺¹
Найс! Сил вам и здоровья! Выжимка отличная
@ArchDevWorkshop Год назад ⁺²
Круто, спасибо! Очень интересное видео
@apristen Год назад ⁺²
спасибо! отлично рассказано!
@dasydasy9268 Год назад ⁺²
Отличное видео!
@LeonidYakovlev85 11 месяцев назад ⁺³
Большое спасибо за выпуск, было очень интересно, полезно и информативно 👍
@Василий-о1ф2ь Год назад ⁺¹
Спасибо!
Интересно, полезно и понятно)
@Denisko123 Год назад ⁺¹
Использую на работе. Действительно большие объемы обрабатывает просто с космической скоростью. Типа статы и фильтров на ней. А вот с единичными записями, обновлением и удалением (через мутации) тут все тяжко. Приходиться манипулировать
@kironpapon Год назад ⁺⁹
Привет
Там кажется, на 2:30 ошибка, когда ты показываешь как происходит запрос к БД. Нужно колонкой ты указываешь строку, в которой значение color = 5235, но в запросе попросил color = 543
И на 3:30 ты говоришь "С цветом 542", а ищем мы цвет 543
Сорри, если душно....
Видос пушка, спасибо большое
@ListenIT_channel Год назад ⁺³
Привет! Да не, не душно, там автор статьи, видимо, напутал, а я не сразу заметил ошибки. На суть сильно не влияет, поэтому решил оставить. Буду внимательнее, спасибо!
@kironpapon Год назад
@@ListenIT_channel да, сто проц не влияет, все супер понятно и очень круто изложен материал, еще раз спасибо!
@skarfex Год назад ⁺²
Если уж душнить, то пополной)
В пункте 2 мы ищем не колонку с названием type, а колонку color и значение 543
@andreyprokhorov3371 4 месяца назад
2:33 почему по type пишите? Если color
@rootgorfal9811 Год назад ⁺³
2:47 в запросе поиск по столбцу color в пояснении type
@АндрейИльин-д6ж 2 месяца назад ⁺¹
автору то откуда знать как должно быть?
@non5309 Год назад
Хорошие ролики, спасибо!
@Alexander-ws6wl 8 месяцев назад ⁺²
А можно для непрофильных специалистов объяснить, как столбцовая СУБД выдаёт в результате строку, если все столбцы хранятся отдельно? Что связывает элементы разных столбцов?
@heheheyhey5234 7 месяцев назад ⁺¹
ключ есть у каждой ячейки .типа НомерСтроки
@linust5892 11 месяцев назад
Опа KozhinDev)) Красноярским привет
@the_Timmy_93 7 месяцев назад
Палатка первой помощи на первой секунде =)
@ListenIT_channel 7 месяцев назад
😏
@letsdosmth7666 Год назад ⁺¹
сделайте пожалуйста ролик про WSDL !!!
@андрейшаульский-в5к Год назад ⁺¹
Интересно
@Чонгукчкук Год назад
Сделай видео про руководство по стилю в SQL
@lsandreyls 10 месяцев назад
Ну так себе статься, про класторизированные индексы понятно , но вот самое ведь интересно не как факт указать когда не нужно использовать не класторизированные индексы, а почему .
@reveuzze777 11 месяцев назад ⁺¹
listen TO IT💡
@kuzmaprut 7 месяцев назад ⁺¹
в clickhouse есть primary key
@IgorZimaev Год назад ⁺¹
«Пропустить колонки, которые не нужны для анализа - невозможно»
Даже если повесить на колонку индекс? Как же он тогда ускоряет поиск?)
@vladislavstepanov7591 Год назад
В любом случае это будет не так быстро. Есть Index Scan Only, который будет читать данные только из индекса.
Но как только ты добавишь в SELECT поле не из индекса или из другого индекса, операция сразу замедлится в несколько раз, потому что это будет уже Index Scan, а значит БД будет подглядывать в heap и забирать данные из оригинальной таблицы
А в колоночной бд такого нет потому что она просто может посчитать byte offset для соседней колонки и сразу считать данные, без поиска
@nav6526 Год назад ⁺²
В строковых бд обычный индекс позволяет получить место хранения строки, т.е. является указателем. Перейдя по указателю получанм достап к строке, но полученная строка состоит из N полей (или по другому - колонок), и чтобы получить доступ к какому-то полю нужно прочитать все поля перед ним. В кликхаусе эти поля таблицы хранятся в отдельных отсортированных структурах, поэтому поиск по колонке очень быстрый.
В строковой бд если запрос должен выполняться по всей таблице или планировщик запроса считает что запрос не получит выгоды от индекса то будет фулскан всей таблицы и на больших данных это очень медленно.
@АлексейКузьмичёв-ц7о 6 месяцев назад
Строка, только повернутая на 90 градусов)
@RWU13 Год назад ⁺¹
Сделайте пожалуйста про касандру
@nauryzzz Год назад ⁺¹
Ну по сути, обычная таблица, где каждый столбец представляет собой некластеризованный индекс.
@sighupcmd Год назад
Буффер вставок придется самому имплементить? На стороне КХ нет такой фичи?
@seriych Год назад
Есть таблицы с движком buffer, есть асинхронные вставки. В каких-то случаях этого может хватить. Но в целом желательно вставлять пачками, то есть да, самому имплементить.
@vladislavstepanov7591 Год назад
Есть адаптеры из коробки на уровне Clickhouse которые позволяют подключить ее напрямую к RabbitMQ/Kafka, а CH сам оттуда будет забирать на вставку. Но не уверен насколько это работает, не пробовал
@oyaebunterkrah_ 3 месяца назад
ruclips.net/video/2b4heaO3U8k/видео.html в колонке style правильные номера записей?
@wce-tube 9 месяцев назад ⁺¹
542 vs 543
Fight!
@tihon4979 3 месяца назад
Как же много оговорок, это ужас какой-то. На экране одно, вслух произносится совсем другое...
@andriibodashevskyi Год назад ⁺¹
На минусах сразу понятно что это создавали россиянские «гении»
@ListenIT_channel Год назад ⁺¹³
Колоночные базы как технологию придумали ещё в 1969, это не новинка. А что именно смутило в минусах?
@ArchDevWorkshop Год назад ⁺³
Вполне годная база, главное правильно использовать. А что вы придумали и реализовали?
@zorro3481 Год назад
Хохол детектед
@bunta8789 8 дней назад
Хохлятские гении в свою очередь что сделали? Пукнули в ладошку и занюхнули
@vectrasale Год назад ⁺²
Отличное видео!

Следующие

Автовоспроизведение