Владимир Ситников - B-tree индексы в базах данных на примере PostgreSQL

Поделиться
HTML-код
  • Опубликовано: 13 июн 2023
  • Ближайшая конференция - Heisenbug 2024 Autumn, 10 октября (Online), 17-18 октября (Санкт-Петербург + трансляция).
    Подробности и билеты: jrg.su/Tq0vcu
    - Ближайшая конференция: Heisenbug 2023 Autumn - 10-11 октября (online), 15-16 октября (offline)
    Подробности и билеты: bit.ly/3qd3swV
    - -
    Доклад о том, как работают обычные™ индексы в базах данных. Будет крайне полезно как тем, кто начинает работать с базами данных, так и тем, кто работал, но подзабыл. У вас в проекте наверняка есть база данных. Наверняка изредка запросы тормозят, и довольно часто это случается либо из-за нехватки, либо из-за переизбытка индексов. На докладе мы научимся измерять производительность запросов, узнаем про то, как работают индексы, и научимся правильно их применять. Примеры будут на PostgreSQL, но знания подойдут и ко многим другим базам, ведь алгоритм b-tree изобрели в 1970 году, и его вариации используются сейчас очень часто.
    Рассмотрим:
    - Как индекс ускоряет поиск;
    - Нужно ли индексировать условия where;
    - Нужно ли индексировать условия в order by;
    - Нужно ли индексировать foreign keys;
    - Что делать, если критериев поиска несколько;
    - В каком порядке указывать колонки в индексе;
    - Случаи, когда индекс замедляет работу, и как снизить влияние индекса на приложение.
    #database #postgresql

Комментарии • 36

  • @user-uf8tc4vg5r
    @user-uf8tc4vg5r 10 месяцев назад +19

    Вот это да. 10 лет программирую, столько текстов прочитал о всякой-всячине, но конкретику нашел именно тут. Спасибо за видео

    • @igorseledtsov7345
      @igorseledtsov7345 3 месяца назад +1

      Что ж вы читали то? тутто как раз вода водой без конкретики

    • @pyramidhead9692
      @pyramidhead9692 3 месяца назад

      ​@@igorseledtsov7345а можете подсказать где подробнее всего описана работа индексов без воды? Хочу подробнее разобраться, непонятны некоторые моменты

  • @gregoryrubies6045
    @gregoryrubies6045 7 месяцев назад +7

    Очень полезный доклад. Побольше бы такого. Достаточно прикладные вещи, но мало где это подробно описано

  • @adilkhanzaidulla8244
    @adilkhanzaidulla8244 Месяц назад

    Материал, презентация, доклад, все на высшем уровне, спасибо Владимиру за работу

  • @user-cn6wu1db7w
    @user-cn6wu1db7w 4 месяца назад

    Владимир, спасибо огромное за доклад!

  • @vladglushak4306
    @vladglushak4306 6 месяцев назад

    Отличный доклад, спасибо !

  • @levorlov8788
    @levorlov8788 7 месяцев назад

    Познавательно. Спасибо :)

  • @user-hh1hf9cw8m
    @user-hh1hf9cw8m Месяц назад

    Спасибо, отличный материал)

  • @Serj1c
    @Serj1c 3 месяца назад +1

    отличный доклад, спасибо

  • @sergeng-gd5ev
    @sergeng-gd5ev 3 месяца назад

    Владимир, отличный доклад, спасибо!

  • @user-mu8wd3vn8s
    @user-mu8wd3vn8s 3 месяца назад +1

    Прекрасный доклад
    Спасибо!

  • @user-bz9tz1mf3r
    @user-bz9tz1mf3r Год назад +4

    Отличный доклад, большое спасибо автору 🙂

  • @romanlunin386
    @romanlunin386 5 месяцев назад +2

    Шикарный доклад, посмотрел с удовольствием, хотя знал это всё)

  • @RaptorT1V
    @RaptorT1V 8 месяцев назад +2

    Я только начинаю в PostgreSQL, мало что понял, но было интересно

  • @Aleksey_P
    @Aleksey_P 2 месяца назад

    Очень доступно для новичков

  • @MrVitalirapalis
    @MrVitalirapalis 3 месяца назад

    Очень интересный доклад, больше года к сожалению приходится работать только с nosql elasticsearch и там структура данных при индексирование не b-tree а inverted index (array) что оптимизировано для поиска по тексту, кайфанул от просмотра, очень детально.

  • @TheNo0ker
    @TheNo0ker 8 месяцев назад

    Ситников - топ

  • @coox4546
    @coox4546 11 месяцев назад +5

    Хорошее объяснение. Буду шарить всем неверующим, что юид не самый лучший вариант для айдишки )))

    • @nikitabukov1292
      @nikitabukov1292 6 месяцев назад +1

      Это не так. Есть такая штука как "последовательный uuid" и проблема со вставкой уходит.

    • @TheMrMagyar
      @TheMrMagyar 3 месяца назад

      @@nikitabukov1292 дополню, сортировку поддерживают uuid v6 и v7

    • @vasyavasin7364
      @vasyavasin7364 3 месяца назад

      ​@@nikitabukov1292 uuid v6

  • @aleona136
    @aleona136 2 месяца назад

    В последнем примере про поиск по статусу и имени почему просто не создать частичный индекс куда войдут только строчки с PENDING если мы ищем только по таким строчкам?

  • @mcolegon
    @mcolegon 8 месяцев назад

    Насколько мне известно, при покрытии индекса (когда данные в таблице отсортированы) механизм индексирования не в таблицу заглядывает для определения видимости строк, а в так называемую карту видимости, в которой vacuum отмечает строки которые не менялись очень долгое время, и доступны всем транзакциям. И если идентификатор строки попадает в эту карту то видимость можно не проверять. Поправьте если не прав.

    • @amarazmable
      @amarazmable 6 месяцев назад +1

      Эта штука называется Visibility Map и да она для ускорения и там целый блок помечается битом содержит он данные старые или нет.

  • @sergeypoprygin2670
    @sergeypoprygin2670 4 месяца назад +2

    не понял про индекс по статусу и имени, не понял почему выгодно делать индекс статус-имя, ведь у статуса всего три значения и селективность у него будет явно хреновая, а вот у имени, особенно если именем будет какой-то никнейм, ну или даже имя человека, то там будет огромное количество разных значений у колонки и селективность будет явно больше, чем у статуса

    • @user-fc7ch3yx4c
      @user-fc7ch3yx4c 2 месяца назад

      это только для запросов, где мы ищем сразу по обоим полям всегда. С таким индексом, будет меньше случайных обращений, потому что мы загрузим один блок, где все state будут почти всегда одинаковые и мы разом прочитаем много нужных записей.
      Если искать только по полю name, то такой индекс считай бесполезен. Тогда действительно стоит создавать (name, state) индекс. Ну или создать рядом ещё один индекс только по полю name

  • @kvintnorris9828
    @kvintnorris9828 11 месяцев назад +2

    правильно ли я понял, что случайные uuid как индекс бесполезны и поск все равно будет перебором?

    • @KikkerRus
      @KikkerRus 11 месяцев назад +3

      Нет. Речь была о скорости обновления индекса.

  • @ivanmatew568
    @ivanmatew568 Год назад

    Отсортированный по времени UUID еще называют Ulid.

    • @PVBovercomes
      @PVBovercomes 10 месяцев назад

      Это схожие, но разные виды id

  • @Ieatsomebrains
    @Ieatsomebrains 11 месяцев назад +2

    Упал на последней минуте от вопроса "например вот как-бы вот это самое".

    • @RaptorT1V
      @RaptorT1V 8 месяцев назад +1

      Девочка просто хотела понравиться докладчику, показав свою широту знаний)
      Но получилось наоборот😢

  • @mgsfdgsfdgsgssdgrsdgdrgsr16
    @mgsfdgsfdgsgssdgrsdgdrgsr16 2 месяца назад +1

    Ни о чем, если честно.

  • @user-fi9rw4vx2b
    @user-fi9rw4vx2b 6 месяцев назад +2

    Очень корявая речь, как-будто к выступлению докладчик не готовился совсем. Местами утверждения некорректные из-за этого

  • @user-fu6vj6vh5p
    @user-fu6vj6vh5p 11 месяцев назад

    Спасибо, отличный доклад. Штук 5 видео про индексы я посмотрела на ютубе, и только в этом услышала то, что помогло мне осознать суть происходящего.