Zarys baz danych - Outline of databases
Poniżej przedstawiono przegląd i przewodnik po bazach danych:
Baza danych – uporządkowany zbiór danych, dziś zazwyczaj w formie cyfrowej. Dane są zazwyczaj zorganizowane w celu modelowania odpowiednich aspektów rzeczywistości (na przykład dostępności pokoi w hotelach) w sposób wspierający procesy wymagające tych informacji (na przykład znalezienie hotelu z wolnymi miejscami).
Jakim rodzajem rzeczy są bazy danych?
Bazy danych można opisać jako wszystkie z poniższych:
- Informacja – sekwencja symboli, która może być zinterpretowana jako komunikat. Informacje mogą być rejestrowane jako znaki lub przesyłane jako sygnały.
- Dane – wartości zmiennych jakościowych lub ilościowych, należące do zbioru pozycji. Dane w obliczeniach (lub przetwarzaniu danych) są często reprezentowane przez kombinację elementów zorganizowanych w wiersze i wielu zmiennych zorganizowanych w kolumny. Dane są zazwyczaj wynikami pomiarów i można je wizualizować za pomocą wykresów lub obrazów.
- Dane komputerowe – informacje w formie odpowiedniej do wykorzystania na komputerze. Dane są często odróżniane od programów. Program to sekwencja instrukcji, które szczegółowo opisują zadanie, które komputer ma wykonać. W tym sensie dane są wszystkim w oprogramowaniu, co nie jest kodem programu.
Rodzaje baz danych
- Aktywna baza danych – zawiera architekturę sterowaną zdarzeniami (często w formie reguł ECA), która może reagować na warunki zarówno wewnątrz, jak i na zewnątrz bazy danych.
- Baza animacji – przechowuje fragmenty animacji lub ruchów człowieka, do których można uzyskać dostęp, analizować i przeszukiwać w celu opracowania i złożenia nowych animacji.
- Back-endowa baza danych – dostęp do niej użytkownicy uzyskują pośrednio przez zewnętrzną aplikację, a nie przez programowanie aplikacji przechowywane w samej bazie danych lub przez niskopoziomową manipulację danymi (np. za pomocą poleceń SQL ).
- Bibliograficzna baza danych – baza danych rekordów bibliograficznych, zorganizowany cyfrowy zbiór odniesień do opublikowanej literatury, w tym artykułów z czasopism i gazet, materiałów konferencyjnych, raportów, publikacji rządowych i prawniczych, patentów, książek itp.
- Scentralizowana baza danych – baza danych zlokalizowana i utrzymywana w jednej lokalizacji, w przeciwieństwie do bazy rozproszonej.
- Baza danych w chmurze – działa na platformie przetwarzania w chmurze, takiej jak Amazon EC2, GoGrid i Rackspace.
- Baza zbiorów – katalog zbiorów muzeum lub archiwum realizowany za pomocą komputerowej bazy danych, w której skatalogowane są obiekty lub materiały instytucji.
- Kolektywna Baza Danych Optymalizacji – otwarte repozytorium umożliwiające udostępnianie testów porównawczych, zestawów danych i przypadków optymalizacji ze społeczności, dostarczanie usług internetowych i wtyczek (obliczeniowych)|wtyczek do analizowania danych optymalizacyjnych i przewidywania przekształceń programów lub lepszych projektów sprzętowych do optymalizacji wielocelowych w oparciu o techniki statystyczne i uczenia maszynowego, pod warunkiem, że w repozytorium zebrano wystarczającą ilość informacji od wielu użytkowników.
- Baza danych zarządzania konfiguracją –
- Baza danych kooperacyjnych – przechowuje informacje o klientach i ich transakcjach.
- Korelacyjna baza danych – system zarządzania bazą danych (DBMS), który jest niezależny od modelu danych i zaprojektowany do efektywnej obsługi nieplanowanych zapytań ad hoc w środowisku systemu analitycznego.
- Bieżąca baza danych – konwencjonalna baza danych przechowująca aktualne dane.
- Katalog – repozytorium lub baza informacji zoptymalizowana pod kątem odczytu, przy założeniu, że aktualizacje danych są bardzo rzadkie w porównaniu z odczytami. Zwykle katalog obsługuje wyszukiwanie i przeglądanie oprócz prostych wyszukiwań.
- Rozproszona baza danych – baza danych, w której nie wszystkie urządzenia pamięci masowej są podłączone do wspólnego procesora.
- Baza danych zorientowana na dokumenty – program komputerowy przeznaczony do przechowywania, wyszukiwania i zarządzania informacjami zorientowanymi na dokument lub model częściowo ustrukturyzowany |
- Baza danych EDA – baza danych wyspecjalizowana na potrzeby automatyzacji projektowania elektronicznego.
- Endgame tablebase – skomputeryzowana baza danych zawierająca wstępnie obliczoną, wyczerpującą analizę pozycji szachowej w grze końcowej .
- Baza danych o składzie żywności (FCDB) – zawiera szczegółowe informacje na temat składu odżywczego żywności.
- Baza pełnotekstowa – baza danych zawierająca pełny tekst książek, rozpraw, czasopism, magazynów, gazet lub innego rodzaju dokumentów tekstowych. Nazywana również „bazą danych pełnego tekstu”.
- Baza rządowa – gromadzi dane osobowe z różnych powodów (nadzór masowy, System Informacyjny Schengen w Unii Europejskiej, ubezpieczenie społeczne, statystyki itp.).
- Baza danych wykresów – wykorzystuje struktury wykresów z węzłami, krawędziami i właściwościami do reprezentowania i przechowywania danych.
- Baza wiedzy – specjalny rodzaj bazy danych do zarządzania wiedzą. Baza wiedzy umożliwia gromadzenie, organizowanie, udostępnianie, wyszukiwanie i wykorzystywanie informacji.
- Mobilna baza danych – może być podłączona przez mobilne urządzenie komputerowe przez sieć komórkową.
- Baza nawigacyjna – baza danych, w której znajdujące się w niej obiekty (lub rekordy) znajdują się przede wszystkim na podstawie odnośników z innych obiektów.
- Non-native speech database – baza mowy zawierająca nienatywne wymowy języka angielskiego.
- Baza danych online – baza dostępna z sieci, w tym z Internetu.
- Operacyjna baza danych – dostępna przez System Operacyjny w celu prowadzenia regularnych operacji organizacji.
- Równoległa baza danych – poprawia wydajność poprzez zrównoleglenie różnych operacji, takich jak ładowanie danych, budowanie indeksów i ocena zapytań.
- Probabilistyczna baza danych – niepewna baza danych, w której możliwe światy mają powiązane prawdopodobieństwa.
- Baza danych czasu rzeczywistego – system przetwarzania przeznaczony do obsługi obciążeń, których stan stale się zmienia (Buchmann).
- Relacyjna baza danych – zbiór elementów danych zorganizowany w zestaw formalnie opisanych tabel, z których można łatwo uzyskać dostęp do danych.
- Baza danych przestrzennych – baza danych zoptymalizowana do przechowywania i wyszukiwania danych związanych z obiektami w przestrzeni, w tym punktów, linii i wielokątów.
- Temporal database – baza danych z wbudowanymi aspektami czasowymi, np. temporalny model danych i temporalna wersja Structured Query Language (SQL).
- Baza danych szeregów czasowych – szereg czasowy to asocjacyjna tablica liczb indeksowanych według daty/godziny lub zakresu daty/godziny. Te szeregi czasowe są często nazywane profilami lub krzywymi, w zależności od rynku. Szereg czasowy cen akcji można nazwać krzywą cenową, a szereg czasowy zużycia energii można nazwać profilem obciążenia. Mimo odmiennego nazewnictwa operacje na nich wykonywane są na tyle powszechne, że wymagają specjalnego traktowania bazy danych.
- Triplestore – specjalnie stworzona baza danych do przechowywania i wyszukiwania trójek, przy czym trójka to jednostka danych składająca się z podmiotu-predykatu-obiektu, np. „Bob ma 35 lat” lub „Bob zna Freda”.
- Bardzo duża baza danych (VLDB) — zawiera bardzo dużą liczbę krotek (wierszy bazy danych) lub zajmuje bardzo dużą fizyczną przestrzeń dyskową systemu plików.
- Wirtualna prywatna baza danych (VPD) – maskuje dane w większej bazie danych, dzięki czemu bezpieczeństwo pozwala na użycie tylko pozornie prywatnych danych.
- Baza danych podatności – platforma służąca do gromadzenia, utrzymywania i rozpowszechniania informacji o wykrytych podatnościach atakujących rzeczywiste systemy komputerowe.
- XLDB – oznacza „eXtremely Large Data Base”.
- Baza danych XML – dane przechowywane w formacie XML, skąd można je przeszukiwać, eksportować i serializować do żądanego formatu.
Historia baz danych
Wykorzystanie bazy danych
- Wymagania dotyczące korzystania z bazy danych –
- Teoria baz danych – obejmuje szeroki zakres tematów związanych z badaniem teoretycznej dziedziny baz danych i systemów zarządzania bazami danych.
- Maszyna bazodanowa – lub to komputer lub specjalny sprzęt, który przechowuje i pobiera dane z bazy danych. Nazywany również „procesorem zaplecza”
- Serwer bazy danych – program komputerowy świadczący usługi bazy danych innym programom komputerowym lub komputerom, zgodnie z definicją modelu klient-serwer.
-
Aplikacja bazy danych – program komputerowy, którego głównym celem jest wprowadzanie i pobieranie informacji z bazy danych zarządzanej przez komputer.
- System zarządzania bazą danych (DBMS) – pakiet oprogramowania z programami komputerowymi kontrolującymi tworzenie, utrzymanie i użytkowanie bazy danych.
-
Połączenie z bazą danych – funkcja w informatyce, która pozwala oprogramowaniu klienckiemu komunikować się z oprogramowaniem serwera bazy danych, czy to na tej samej maszynie, czy nie.
- Datasource – nazwa nadana połączeniu zestawionemu do bazy danych z serwera. Nazwa jest powszechnie używana podczas tworzenia zapytania do bazy danych. Nazwa źródła bazy danych (DSN) nie musi być taka sama jak nazwa pliku bazy danych. Na przykład plik bazy danych o nazwie „friends.mdb” może mieć nazwę DSN „school”. Następnie DSN „szkoła” byłaby następnie używana do odwoływania się do bazy danych podczas wykonywania zapytania.
- Nazwa źródła danych (DSN) – to struktury danych używane do opisu połączenia ze źródłem danych. Czasami znana jako nazwa źródła bazy danych, chociaż źródła danych nie są ograniczone do baz danych.
- Administrator bazy danych (DBA) – to osoba odpowiedzialna za instalację, konfigurację, aktualizację, administrację, monitorowanie i utrzymanie fizycznych baz danych.
- Blokada –
- Porównanie narzędzi baz danych – (zawiera tabele do porównywania informacji ogólnych i technicznych dla wielu dostępnych narzędzi administratora baz danych.)
- Architektura zorientowana na bazę danych – architektury oprogramowania, w których bazy danych odgrywają kluczową rolę. Nazywana również „architekturą zorientowaną na dane”.
- Inteligentna baza danych – została zaproponowana jako system, który zarządza informacjami (a nie danymi) w sposób naturalny dla użytkowników i wykraczający poza proste prowadzenie ewidencji.
- Blokowanie dwufazowe (2PL) – to metoda kontroli współbieżności, która gwarantuje serializowalność.
- Blokady z uporządkowanym udostępnianiem – obejmuje kilka wariantów protokołu kontroli współbieżności dwufazowego blokowania (2PL) generowanego przez zmianę semantyki blokowania blokad w przypadku konfliktów.
- Załaduj plik – w środowisku procesowym jest powszechnie określany jako plik służący do importowania danych (zakodowanych, przechwyconych lub wyodrębnionych danych z przetwarzania ESI) do bazy danych; lub plik używany do łączenia obrazów.
- Publikowanie baz danych – obszar zautomatyzowanej produkcji mediów, w której wykorzystuje się specjalistyczne techniki do generowania paginowanych dokumentów z danych źródłowych znajdujących się w tradycyjnych bazach danych.
- Halloween Problem – zjawisko w bazach danych, w którym operacja aktualizacji powoduje zmianę fizycznej lokalizacji wiersza, potencjalnie pozwalając na odwiedzenie wiersza więcej niż raz podczas operacji.
- Przesyłanie dziennika – proces automatyzacji tworzenia kopii zapasowej bazy danych i plików dziennika transakcji na podstawowym (produkcyjnym) serwerze bazy danych, a następnie przywracanie ich na serwer zapasowy.
Języki baz danych
- Język definicji danych –
- Język manipulacji danymi –
-
Język zapytań –
- Język zapytań wyszukiwania informacji – język zapytań używany do tworzenia zapytań do bazy danych, gdzie semantyka zapytania jest definiowana nie poprzez precyzyjne oddanie składni formalnej, ale przez interpretację najbardziej odpowiednich wyników zapytania.
- SQL (Structured Query Language) – specjalistyczny język programowania przeznaczony do zarządzania danymi przechowywanymi w relacyjnym systemie zarządzania bazą danych (RDBMS) lub do przetwarzania strumieniowego w relacyjnym systemie zarządzania strumieniem danych (RDSMS).
- XQuery – język programowania zapytań i funkcjonalny, który odpytuje i przekształca kolekcje danych ustrukturyzowanych i nieustrukturyzowanych.
Bezpieczeństwo bazy danych
- Monitorowanie aktywności bazy danych (DAM) – technologia bezpieczeństwa bazy danych do monitorowania i analizowania aktywności bazy danych, która działa niezależnie od systemu zarządzania bazą danych (DBMS) i nie opiera się na żadnej formie natywnego (rezydentnego w DBMS) audytu ani natywnych dzienników, takich jak śledzenie lub transakcje dzienniki.
- Audyt bazy danych –
- Kryminalistyka baz danych – dziedzina kryminalistyki cyfrowej związana z kryminalistycznym badaniem baz danych i związanych z nimi metadanych.
- Negatywna baza danych – terminologia kart kredytowych dla listy właścicieli kart kredytowych, którzy często obciążają konto.
Projekt bazy danych
- Model encji i relacji ( model ER) – abstrakcyjna i pojęciowa reprezentacja danych.
- Normalizacja bazy danych – proces organizowania pól i tabel relacyjnej bazy danych w celu zminimalizowania redundancji i zależności.
- Refaktoryzacja bazy danych – prosta zmiana w schemacie bazy danych, która usprawnia jej projekt, zachowując jednocześnie semantykę behawioralną i informacyjną.
Programowanie baz danych
- Warstwa abstrakcji bazy danych – interfejs programowania aplikacji, który ujednolica komunikację pomiędzy aplikacją komputerową a bazami danych takimi jak SQL Server, DB2, MySQL, PostgreSQL, Oracle czy SQLite.
- Mapowanie obiektowo-relacyjne ( mapowanie ORM, O/RM i O/R) – w oprogramowaniu komputerowym jest techniką programowania służącą do konwersji danych między niekompatybilnymi systemami typów w językach programowania obiektowego.
Zarządzania bazami danych
- Wirtualizacja bazy danych – jest to rozdzielenie warstwy bazy danych, która znajduje się pomiędzy warstwami pamięci masowej i aplikacji w stosie aplikacji.
-
Strojenie bazy danych – opisuje grupę czynności służących do optymalizacji i ujednolicenia wydajności bazy danych.
- Buforowanie baz danych – efektywne podejście do osiągnięcia wysokiej skalowalności i wydajności.
- Migracja danych#Migracja bazy danych –
- Zachowanie bazy danych – zwykle polega na konwersji informacji przechowywanych w bazie danych, bez utraty cech (kontekstu, treści, struktury, wyglądu i zachowania) danych do formatu, który może być używany w długim okresie, nawet jeśli technologia i na co dzień zmienia się wiedza życiowa.
- Integralność bazy danych – zapewnia, że dane wprowadzane do bazy danych są dokładne, prawidłowe i spójne.
Systemy zarządzania bazą danych
System zarządzania bazą danych –
- Model bazy danych –
- Normalizacja bazy danych – organizowanie tabel na podstawie ich atrybutów, dzięki czemu prezentowane dane mogą uniknąć nadmiarowości i zależności.
- Struktury przechowywania baz danych –
- Rozproszony system zarządzania bazą danych –
- Sfederowany system baz danych — rodzaj systemu zarządzania metabazą danych (DBMS), który w przejrzysty sposób odwzorowuje wiele autonomicznych systemów baz danych w jedną sfederowaną bazę danych.
- Integralność referencyjna – .
- Algebra relacyjna – odgałęzienie logiki pierwszego rzędu (i algebry zbiorów), zajmuje się zbiorem relacji skończonych (patrz też relacja (baza danych)), który jest zamknięty pod pewnymi operatorami.
- Rachunek relacyjny – składa się z dwóch rachunków, rachunku relacyjnego krotki i rachunku relacyjnego domeny, które są częścią modelu relacyjnego dla baz danych i zapewniają deklaratywny sposób określania zapytań do bazy danych.
- Relacyjna baza danych – zbiór elementów danych zorganizowany w zestaw formalnie opisanych tabel, z których można łatwo uzyskać dostęp do danych.
- Relational database management system (RDBMS) – system zarządzania bazą danych (DBMS) oparty na modelu relacyjnym wprowadzonym przez E.
- Model relacyjny – do zarządzania bazą danych jest model bazy danych oparty na logice predykatów pierwszego rzędu, po raz pierwszy sformułowany i zaproponowany w 1969 roku przez Edgara F.
- Obiektowo-relacyjna baza danych (ORD) – system zarządzania bazą danych (DBMS) podobny do relacyjnej bazy danych, ale z obiektowym modelem bazy danych: obiekty, klasy i dziedziczenie są bezpośrednio obsługiwane w schematach baz danych oraz w języku zapytań. Nazywany również obiektowo-relacyjnym systemem zarządzania bazami danych (ORDBMS).
- Przetwarzanie transakcji –
Koncepcje
- Baza danych – uporządkowany zbiór danych, dziś zazwyczaj w formie cyfrowej.
- ACID – ( niepodzielność, spójność, izolacja, trwałość ) to zestaw właściwości gwarantujących niezawodne przetwarzanie transakcji bazy danych.
- Twórz, czytaj, aktualizuj i usuwaj (CRUD) – to cztery podstawowe funkcje pamięci trwałej.
- Zerowy –
- Klucz kandydata – minimalny superklucz dla relacji.
- Klucz obcy – ograniczenie referencyjne między dwiema tabelami.
- Klucz podstawowy –
- Superkey – zestaw atrybutów zmiennej relacyjnej, dla której utrzymuje, że we wszystkich relacjach przypisanych do tej zmiennej nie ma dwóch odrębnych krotek (wierszy), które mają takie same wartości atrybutów w tym zestawie.
- Klucz zastępczy – unikalny identyfikator w bazie danych dla podmiotu w modelowanym świecie lub obiektu w bazie danych.
- Aksjomaty Armstronga – zbiór aksjomatów (a dokładniej reguł wnioskowania) służących do wnioskowania wszystkich zależności funkcjonalnych w relacyjnej bazie danych.
- NoSQL – klasa systemu zarządzania bazami danych identyfikowana przez niezgodność z powszechnie stosowanym modelem relacyjnego systemu zarządzania bazami danych (RDBMS):
Obiekty
- Relacja –
- Widok –
- Transakcja bazy danych –
- Dziennik transakcji – historia działań wykonywanych przez system zarządzania bazą danych w celu zagwarantowania właściwości ACID w przypadku awarii lub awarii sprzętu. Zwany także „dziennikiem transakcji”, „dziennikiem bazy danych” lub „dziennikiem binarnym”.
- Wyzwalacz bazy danych – kod proceduralny, który jest automatycznie wykonywany w odpowiedzi na określone zdarzenia w określonej tabeli lub widoku w bazie danych.
- Indeks –
- Procedura składowana – podprogram dostępny dla aplikacji uzyskujących dostęp do systemu relacyjnej bazy danych.
- Kursor –
- Partycja –
składniki
- Kontrola współbieżności – zapewnia generowanie prawidłowych wyników dla równoczesnych operacji, jednocześnie uzyskując te wyniki tak szybko, jak to możliwe.
- Słownik danych — zgodnie z definicją zawartą w słowniku IBM Dictionary of Computing , to „scentralizowane repozytorium informacji o danych, takich jak znaczenie, relacje z innymi danymi, pochodzenie, użycie i format”. Nazywany również „repozytorium metadanych”.
- Łączność z bazą danych Java – .
- Otwarta łączność z bazą danych —
- Język zapytań –
- Optymalizator zapytań – element systemu zarządzania bazą danych, który próbuje określić najbardziej efektywny sposób wykonania zapytania.
- Plan zapytań – uporządkowany zestaw kroków służących do uzyskania dostępu lub modyfikacji informacji w systemie zarządzania relacyjnymi bazami danych SQL. Nazywany również „planem wykonania zapytania”.
Funkcje
- Administracja bazą danych – praca wykonywana przez administratora bazy danych , z których część może być zautomatyzowana.
- Optymalizacja zapytań – funkcja wielu systemów zarządzania relacyjnymi bazami danych, w których bada się wiele planów zapytań w celu spełnienia zapytania i identyfikuje dobry plan zapytania.
- Replikacja bazy danych –
Produkty bazodanowe
- Lista obiektowych systemów zarządzania bazami danych –
- Lista systemów zarządzania relacyjnymi bazami danych –
- Baza danych zorientowana na dokumenty – program komputerowy przeznaczony do przechowywania, wyszukiwania i zarządzania informacjami zorientowanymi na dokument lub model częściowo ustrukturyzowany |
Modele baz danych
- Model bazy danych – teoretyczna podstawa bazy danych i zasadniczo określa, w jaki sposób dane mogą być przechowywane, organizowane i manipulowane w systemie bazodanowym. Definiuje w ten sposób infrastrukturę oferowaną przez konkretny system baz danych. Najpopularniejszym przykładem modelu bazy danych jest model relacyjny.
Modele
- Płaska baza danych – różne sposoby kodowania modelu bazy danych (najczęściej tabeli) jako pojedynczego pliku.
- Hierarchiczny model bazy danych – model danych, w którym dane są zorganizowane w strukturę przypominającą drzewo.
- Model bazy danych#Model wymiarowy –
- Model sieci – model bazy danych pomyślany jako elastyczny sposób reprezentacji obiektów i ich relacji.
- Model relacyjny –
- Model podmiot-relacja –
- Baza danych wykresów – wykorzystuje struktury wykresów z węzłami, krawędziami i właściwościami do reprezentowania i przechowywania danych.
- Obiektowa baza danych – system zarządzania bazą danych, w którym informacje są reprezentowane w postaci obiektów, tak jak w programowaniu obiektowym. Nazywany również „systemem zarządzania bazą danych zorientowanym obiektowo”.
- Model podmiot-atrybut-wartość –
Inne modele
- Przetwarzanie analityczne online#Wielowymiarowe bazy danych –
- Semantyczny model danych –
- Schemat gwiazdy – to najprostszy styl schematu hurtowni danych. Nazywany również „schematem łączenia w gwiazdę”, „ kostką danych ” lub „schematem wielowymiarowym”.
- Baza danych XML –
Realizacje
- Baza plików płaskich –
- Baza dedukcyjna – system bazodanowy, który może dokonywać dedukcji.
- Baza danych zorientowana na dokumenty –
- Obiektowo-relacyjna baza danych –
- Temporal database – baza danych z wbudowanymi aspektami czasowymi, np. temporalny model danych i temporalna wersja Structured Query Language (SQL).
- Baza danych XML –
- Triplestore – specjalnie stworzona baza danych do przechowywania i wyszukiwania trójek, przy czym trójka to jednostka danych składająca się z podmiotu-predykatu-obiektu, np. „Bob ma 35 lat” lub „Bob zna Freda”.
Hurtownia danych
Tworzenie hurtowni danych
Koncepcje
- Wymiar –
- Modelowanie wymiarowe (DM) – to nazwa zestawu technik i pojęć wykorzystywanych w projektowaniu hurtowni danych.
- Fakt –
- Przetwarzanie analityczne online (OLAP) – lub jest podejściem do szybkiego odpowiadania na wielowymiarowe zapytania analityczne (wielowymiarowe analityczne|MDA).
- Schemat gwiazdy –
- Kruszywo –
Warianty
- Modelowanie kotwic –
- DBMS zorientowany na kolumny – system zarządzania bazą danych (DBMS), który przechowuje tabele danych jako sekcje kolumn danych, a nie jako wiersze danych, jak większość relacyjnych DBMS.
- Modelowanie przechowalni danych –
- HOLAP –
- MOLAP – oznacza wielowymiarowe przetwarzanie analityczne online.
- ROLAP – oznacza relacyjne przetwarzanie analityczne online.
- Operacyjna składnica danych (ODS) – baza danych przeznaczona do integracji danych z wielu źródeł w celu wykonania dodatkowych operacji na danych.
Elementy
- Słownik danych – / Metadane –
- Data mart – warstwa dostępowa środowiska hurtowni danych, która służy do udostępniania danych użytkownikom.
- Szósta postać normalna (6NF) – termin w teorii relacyjnych baz danych, używany na dwa różne sposoby.
- Klucz zastępczy –
Fakt
- Tabela faktów – składa się z miar, metryk lub faktów dotyczących procesu biznesowego.
- Fakt wcześniejszego przyjazdu –
- Środek –
Wymiar
- Tabela wymiarów – jedna z tabel towarzyszących tabeli faktów.
- Wymiar zdegenerowany – klucz wymiaru w tabeli faktów, który nie posiada własnej tabeli wymiarów, ponieważ wszystkie interesujące atrybuty zostały umieszczone w wymiarach analitycznych.
- Powoli zmieniający się wymiar –
Pożywny
- Wyodrębnianie-przekształcanie-obciążenie (ETL) –
- Ekstrakcja danych – czynność lub proces pobierania danych z (zwykle nieustrukturyzowanych lub słabo ustrukturyzowanych) źródeł danych do dalszego przetwarzania lub przechowywania danych (migracja danych).
- Transformacja danych – konwertuje dane z formatu danych źródłowych na dane docelowe.
- Ładowanie danych –
Korzystanie z hurtowni danych
Koncepcje
- Business Intelligence (BI) – jest definiowany jako zdolność organizacji do wykorzystania wszystkich swoich możliwości i przekształcenia ich w wiedzę, ostatecznie dostarczając właściwe informacje właściwym osobom, we właściwym czasie, za pośrednictwem właściwego kanału.
- Deska rozdzielcza –
- Eksploracja danych – to proces, który skutkuje odkrywaniem nowych wzorców w dużych zbiorach danych. Jest to etap analizy procesu „Odkrywanie wiedzy w bazach danych” lub KDD.
- System wspomagania decyzji (DSS) –
- Kostka OLAP – zestaw danych, zorganizowany w sposób ułatwiający nieustalone zapytania o zagregowane informacje, czyli innymi słowy przetwarzanie analityczne online.
Języki
- Rozszerzenia eksploracji danych (DMX) –
- Wyrażenia wielowymiarowe (MDX) –
- XML do analizy (XMLA) –
Narzędzia
Ludzie
- Edgar F. Codd – angielski informatyk, który wprowadził model relacyjnej bazy danych
- Bill Inmon –
- Ralph Kimball (ur. 1944) – autor na temat hurtowni danych i wywiadu gospodarczego.
Produkty
- Ling Liu i Tamer M. Özsu (red.) (2009). " Encyclopedia of Database Systems , 4100 s. 60 il. ISBN 978-0-387-49616-0 . Spis treści dostępny na http://refworks.springer.com/mrw/index.php?id=1217
- Beynon-Davies, P. (2004). Systemy baz danych. Wydanie III. Palgrave, Houndmills, Basingstoke.
- Connolly, Thomas i Carolyn Begg. Systemy baz danych. Nowy Jork: Harlow, 2002.
- Data, CJ (2003). Wprowadzenie do systemów baz danych, wydanie piąte . Addisona Wesleya. Numer ISBN 0-201-51381-1.
- Gray, J. i Reuter, A. Przetwarzanie transakcji: koncepcje i techniki , wydanie 1, Morgan Kaufmann Publishers, 1992.
- Kroenke, David M. i David J. Auer. Koncepcje bazy danych. 3. wyd. Nowy Jork: Prentice, 2007.
- Lightstone, S.; Teorey, T.; Nadeau, T. (2007). Fizyczny projekt bazy danych: przewodnik dla specjalistów ds. baz danych dotyczący wykorzystywania indeksów, widoków, pamięci masowej i nie tylko . Prasa Morgana Kaufmanna. Numer ISBN 978-0-12-369389-1.
- Teorey, T.; Lightstone, S. i Nadeau, T. Modelowanie i projektowanie bazy danych: Projektowanie logiczne , wydanie 4, Morgan Kaufmann Press, 2005. ISBN 0-12-685352-5
Badacze baz danych
Zobacz też
- Zarys informatyki
- Baza danych
- Model bazy danych
- Schemat bazy danych
- Rekord (baza danych)
- Klucz (baza danych)
- przeszukanie internetu
- Lista akademickich baz danych i wyszukiwarek
- Lista baz danych o bioróżnorodności
- Lista forów internetowych
- Lista internetowych baz danych
Bibliografia
Zewnętrzne linki
- Bazy danych w Curlie
- Rozszerzenie DB File – informacje o plikach z rozszerzeniem DB