Все не так ребяты 😂. Озеро данных это сырые не очищенные данные не согласованные данные, потребитель этих данных - дата саинтист он их сам чистит и согласует Хранилище данных - это всегда очищенные и согласованые данные, данные из хранилищ данных поступают в витрины данных где наконец появляются показатели, с данными в витринах данных работают бизнес-прльзовптели они работают с готовым набором данных.
Смешались кони, люди ... Озеро данных, или иными словами, Data lake, это хранилище данных в сыром (неизменном) виде, до востребования. Вот и все. Данные из озера зачастую не удаляются, как раз потому, что это влечет за собой накладные расходы на шринк файлов в HDFS. Вы же рассказываете о песочнице для аналитиков и датасайентистов.
спасибо
коротко и ясно
Очень круто объясняет.А главное доходчиво. Пять балов.
Все не так ребяты 😂. Озеро данных это сырые не очищенные данные не согласованные данные, потребитель этих данных - дата саинтист он их сам чистит и согласует Хранилище данных - это всегда очищенные и согласованые данные, данные из хранилищ данных поступают в витрины данных где наконец появляются показатели, с данными в витринах данных работают бизнес-прльзовптели они работают с готовым набором данных.
Смешались кони, люди ...
Озеро данных, или иными словами, Data lake, это хранилище данных в сыром (неизменном) виде, до востребования. Вот и все.
Данные из озера зачастую не удаляются, как раз потому, что это влечет за собой накладные расходы на шринк файлов в HDFS.
Вы же рассказываете о песочнице для аналитиков и датасайентистов.
Чувак продажник. Сам не понимает о чем говорит
Разве не то же самое он сказал? Разве что про удаление - да, легко оно не удаляется
Не коротко и не ясно. Так запутать элементарные вещи - надо уметь.
Долго, запутанно и в конце концов неправильно