Подробный разбор MERGE, JOIN & CONCAT. Типы объединения таблиц и Database-style подход в pandas.

Поделиться
HTML-код
  • Опубликовано: 21 июл 2024
  • В этом уроке я подробно расскажу о различных способах объединения данных в pandas. В начале мы вспомним принципы работы функции concat, рассмотрев различные варианты горизонтальной и вертикальной конкатенации. Основная тема данного урока -"использование Database-style подхода в pandas".
    Суть данного подхода в том, что используется очень быстрый способ объединения структур данных, который идеологически похож на операции с реляционными базами данных. Для создания и поддержки данных во многих реляционных базах данных используется специальный структурированный язык запросов SQL. В SQL за объединение таблиц отвечает оператор JOIN. В pandas функционал данного оператора реализуется с помощью функций и методов под названием merge и join.
    В этом видео я сначала подробно расскажу про различные типы объединения таблиц и о том, что такое ключ, по которому происходят эти объединения и, далее, познакомлю вас с вышеупомянутыми инструментами - аналогами JOIN (SQL) и функции ВПР (Excel).
    План урока:
    00:00 | О чем этот урок
    Часть 1 - Concat & Database-style подход в pandas
    01:55 | Функция concat (вспоминаем принципы использования)
    05:21 | О Database-style подходе в pandas (аналог SQL-запросов с оператором JOIN)
    07:20 | Общий обзор типов слияния - аргумент how = 'inner'/ 'left' / 'right' / 'outer' / 'cross'
    09:15 | Наглядный пример (типы слияния)
    13:57 | Наглядный пример в коде (типы слияния)
    14:53 | Пара слов о нормализации таблиц и нереляционных базах данных NoSQL
    Часть 2 - Merge
    17:30 | Базовое использование pandas.merge() и pandas.DataFrame.merge()
    21:30 | Столбец для ключа: аргументы on, left_on, right_on
    22:54 | Тип слияния: how = 'inner'/ 'left' / 'right' / 'outer' / 'cross'
    25:12 | Добавление информационного столбца: indicator
    26:36 | Суффиксы для пересекающихся имен столбцов: suffixes
    28:14 | Использование нескольких столбцов в качестве ключей
    30:10 | Использование индекса в качестве ключа: left_index, right_index
    Часть 3 - Join
    31:30 | Базовое использование метода join()
    31:58 | Аргументы how и on в методе join()
    32:58 | Аргументы lsuffix и rsuffix метода join() для пересекающихся имен
    33:29 | Объединение сразу нескольких DataFrame через метод join()
    Ставь ЛАЙК, если считаешь это видео полезным, и тогда его увидят другие :)
    Связанные видео-уроки
    • Комбинирование перекры...
    • Методы ASSIGN, INSERT,...

Комментарии • 1

  • @user-Nachum
    @user-Nachum 4 месяца назад +1

    Как же вовремя , как раз хотел объединять данные по акциям с курсом USD, но к сожалению не смотря на одинаковые временные промежутки размерности всегда разные