Wyodrębnij, załaduj, przekształć - Extract, load, transform

Wyodrębnianie, ładowanie, transformowanie ( ELT ) to alternatywa dla wyodrębniania, przekształcania, ładowania (ETL) używanej w implementacjach usługi Data Lake . W przeciwieństwie do ETL, w modelach ELT dane nie są transformowane przy wejściu do jeziora danych, ale przechowywane w oryginalnym formacie surowym. Umożliwia to szybsze ładowanie. Jednak ELT wymaga wystarczającej mocy obliczeniowej w silniku przetwarzania danych , aby przeprowadzić transformację na żądanie i zwrócić wyniki w odpowiednim czasie. Ponieważ dane nie są przetwarzane przy wejściu do jeziora danych, zapytanie i schemat nie muszą być definiowane a priori (chociaż często schemat będzie dostępny podczas ładowania, ponieważ wiele źródeł danych to wyciągi z baz danych lub podobnych strukturalnych systemów danych, a zatem mają powiązany schemat). ELT to model potoku danych .

Komponenty jeziora danych w chmurze

Wspólne opcje przechowywania

Zapytanie

Bibliografia

  1. ^ Używanie Redshift Spectrum do ładowania potoków danych Opublikowane przez deductive.com 17 stycznia 2018 r., Pobrane 3 kwietnia 2019 r.

Linki zewnętrzne