Hadoop. MapReduce (введение)

Поделиться
HTML-код
  • Опубликовано: 10 фев 2025
  • Техносфера Mail.ru Group, МГУ им. М.В. Ломоносова.
    Курс "Методы распределенной обработки больших объемов данных в Hadoop"
    Лекция №4 "MapReduce в Hadoop (введение)"
    Лектор - Алексей Романенко.
    Рабочий процесс MapReduce. Hadoop MapReduce и HDFS. Выполнение MapReduce. Архитектура и работа первой версии MapReduce. Hadoop API (типы, классы). WordCount (Congigure Job, Mapper, Reducer). Reducer в качестве Combiner. Типы данных в Hadoop. InputSplit, InputFormat, OutputFormat. Shuffle и Sort в Hadoop. Запуск и отладка задач. Hadoop Streaming. Streaming в MapReduce.
    Слайды лекции www.slideshare....
    Другие лекции курса | • Курс · Hadoop (осень 2...
    Наш видеоканал | www.youtube.com...
    Официальный сайт Технопарка | tech-mail.ru/
    Официальный сайт Техносферы | sfera-mail.ru/
    Технопарк в ВКонтакте | tpmailru
    Техносфера в ВКонтакте | tsmailru
    Блог на Хабре | habrahabr.ru/co...
    #ТЕХНОПАРК
    #ТЕХНОСФЕРА
    x

Комментарии • 2

  • @juliawolf6763
    @juliawolf6763 9 лет назад +4

    Огромное спасибо за видео. С увлечением досмотрела до конца уже 4-е видео курса. Жаль, что там практическая часть не показана. Мне бы очень хотелось самой попрактиковаться в выполнении домашних заданий. Может быть хотя бы сами задания где-нибудь посмотреть... Это возможно?

  • @irynatyshko9156
    @irynatyshko9156 8 лет назад

    В 49:36 в конце Reduce должно быть "Emit (term, sum);" после цикла вместо "Emit (term, value);" внутри цикла. В любом случае переменная value не определена.