Zarys baz danych - Outline of databases

Poniżej przedstawiono przegląd i przewodnik po bazach danych:

Baza danych – uporządkowany zbiór danych, dziś zazwyczaj w formie cyfrowej. Dane są zazwyczaj zorganizowane w celu modelowania odpowiednich aspektów rzeczywistości (na przykład dostępności pokoi w hotelach) w sposób wspierający procesy wymagające tych informacji (na przykład znalezienie hotelu z wolnymi miejscami).

Jakim rodzajem rzeczy są bazy danych?

Bazy danych można opisać jako wszystkie z poniższych:

  • Informacja – sekwencja symboli, która może być zinterpretowana jako komunikat. Informacje mogą być rejestrowane jako znaki lub przesyłane jako sygnały.
  • Dane – wartości zmiennych jakościowych lub ilościowych, należące do zbioru pozycji. Dane w obliczeniach (lub przetwarzaniu danych) są często reprezentowane przez kombinację elementów zorganizowanych w wiersze i wielu zmiennych zorganizowanych w kolumny. Dane są zazwyczaj wynikami pomiarów i można je wizualizować za pomocą wykresów lub obrazów.
  • Dane komputerowe – informacje w formie odpowiedniej do wykorzystania na komputerze. Dane są często odróżniane od programów. Program to sekwencja instrukcji, które szczegółowo opisują zadanie, które komputer ma wykonać. W tym sensie dane są wszystkim w oprogramowaniu, co nie jest kodem programu.

Rodzaje baz danych

  • Aktywna baza danych – zawiera architekturę sterowaną zdarzeniami (często w formie reguł ECA), która może reagować na warunki zarówno wewnątrz, jak i na zewnątrz bazy danych.
  • Baza animacji – przechowuje fragmenty animacji lub ruchów człowieka, do których można uzyskać dostęp, analizować i przeszukiwać w celu opracowania i złożenia nowych animacji.
  • Back-endowa baza danych – dostęp do niej użytkownicy uzyskują pośrednio przez zewnętrzną aplikację, a nie przez programowanie aplikacji przechowywane w samej bazie danych lub przez niskopoziomową manipulację danymi (np. za pomocą poleceń SQL ).
  • Bibliograficzna baza danych – baza danych rekordów bibliograficznych, zorganizowany cyfrowy zbiór odniesień do opublikowanej literatury, w tym artykułów z czasopism i gazet, materiałów konferencyjnych, raportów, publikacji rządowych i prawniczych, patentów, książek itp.
  • Scentralizowana baza danych – baza danych zlokalizowana i utrzymywana w jednej lokalizacji, w przeciwieństwie do bazy rozproszonej.
  • Baza danych w chmurze – działa na platformie przetwarzania w chmurze, takiej jak Amazon EC2, GoGrid i Rackspace.
  • Baza zbiorów – katalog zbiorów muzeum lub archiwum realizowany za pomocą komputerowej bazy danych, w której skatalogowane są obiekty lub materiały instytucji.
  • Kolektywna Baza Danych Optymalizacji – otwarte repozytorium umożliwiające udostępnianie testów porównawczych, zestawów danych i przypadków optymalizacji ze społeczności, dostarczanie usług internetowych i wtyczek (obliczeniowych)|wtyczek do analizowania danych optymalizacyjnych i przewidywania przekształceń programów lub lepszych projektów sprzętowych do optymalizacji wielocelowych w oparciu o techniki statystyczne i uczenia maszynowego, pod warunkiem, że w repozytorium zebrano wystarczającą ilość informacji od wielu użytkowników.
  • Baza danych zarządzania konfiguracją
  • Baza danych kooperacyjnych – przechowuje informacje o klientach i ich transakcjach.
  • Korelacyjna baza danych – system zarządzania bazą danych (DBMS), który jest niezależny od modelu danych i zaprojektowany do efektywnej obsługi nieplanowanych zapytań ad hoc w środowisku systemu analitycznego.
  • Bieżąca baza danych – konwencjonalna baza danych przechowująca aktualne dane.
  • Katalog – repozytorium lub baza informacji zoptymalizowana pod kątem odczytu, przy założeniu, że aktualizacje danych są bardzo rzadkie w porównaniu z odczytami. Zwykle katalog obsługuje wyszukiwanie i przeglądanie oprócz prostych wyszukiwań.
  • Rozproszona baza danych – baza danych, w której nie wszystkie urządzenia pamięci masowej są podłączone do wspólnego procesora.
  • Baza danych zorientowana na dokumenty – program komputerowy przeznaczony do przechowywania, wyszukiwania i zarządzania informacjami zorientowanymi na dokument lub model częściowo ustrukturyzowany |
  • Baza danych EDA – baza danych wyspecjalizowana na potrzeby automatyzacji projektowania elektronicznego.
  • Endgame tablebase – skomputeryzowana baza danych zawierająca wstępnie obliczoną, wyczerpującą analizę pozycji szachowej w grze końcowej .
  • Baza danych o składzie żywności (FCDB) – zawiera szczegółowe informacje na temat składu odżywczego żywności.
  • Baza pełnotekstowa – baza danych zawierająca pełny tekst książek, rozpraw, czasopism, magazynów, gazet lub innego rodzaju dokumentów tekstowych. Nazywana również „bazą danych pełnego tekstu”.
  • Baza rządowa – gromadzi dane osobowe z różnych powodów (nadzór masowy, System Informacyjny Schengen w Unii Europejskiej, ubezpieczenie społeczne, statystyki itp.).
  • Baza danych wykresów – wykorzystuje struktury wykresów z węzłami, krawędziami i właściwościami do reprezentowania i przechowywania danych.
  • Baza wiedzy – specjalny rodzaj bazy danych do zarządzania wiedzą. Baza wiedzy umożliwia gromadzenie, organizowanie, udostępnianie, wyszukiwanie i wykorzystywanie informacji.
  • Mobilna baza danych – może być podłączona przez mobilne urządzenie komputerowe przez sieć komórkową.
  • Baza nawigacyjna – baza danych, w której znajdujące się w niej obiekty (lub rekordy) znajdują się przede wszystkim na podstawie odnośników z innych obiektów.
  • Non-native speech databasebaza mowy zawierająca nienatywne wymowy języka angielskiego.
  • Baza danych online – baza dostępna z sieci, w tym z Internetu.
  • Operacyjna baza danych – dostępna przez System Operacyjny w celu prowadzenia regularnych operacji organizacji.
  • Równoległa baza danych – poprawia wydajność poprzez zrównoleglenie różnych operacji, takich jak ładowanie danych, budowanie indeksów i ocena zapytań.
  • Probabilistyczna baza danych – niepewna baza danych, w której możliwe światy mają powiązane prawdopodobieństwa.
  • Baza danych czasu rzeczywistego – system przetwarzania przeznaczony do obsługi obciążeń, których stan stale się zmienia (Buchmann).
  • Relacyjna baza danych – zbiór elementów danych zorganizowany w zestaw formalnie opisanych tabel, z których można łatwo uzyskać dostęp do danych.
  • Baza danych przestrzennych – baza danych zoptymalizowana do przechowywania i wyszukiwania danych związanych z obiektami w przestrzeni, w tym punktów, linii i wielokątów.
  • Temporal database – baza danych z wbudowanymi aspektami czasowymi, np. temporalny model danych i temporalna wersja Structured Query Language (SQL).
  • Baza danych szeregów czasowych – szereg czasowy to asocjacyjna tablica liczb indeksowanych według daty/godziny lub zakresu daty/godziny. Te szeregi czasowe są często nazywane profilami lub krzywymi, w zależności od rynku. Szereg czasowy cen akcji można nazwać krzywą cenową, a szereg czasowy zużycia energii można nazwać profilem obciążenia. Mimo odmiennego nazewnictwa operacje na nich wykonywane są na tyle powszechne, że wymagają specjalnego traktowania bazy danych.
  • Triplestore – specjalnie stworzona baza danych do przechowywania i wyszukiwania trójek, przy czym trójka to jednostka danych składająca się z podmiotu-predykatu-obiektu, np. „Bob ma 35 lat” lub „Bob zna Freda”.
  • Bardzo duża baza danych (VLDB) — zawiera bardzo dużą liczbę krotek (wierszy bazy danych) lub zajmuje bardzo dużą fizyczną przestrzeń dyskową systemu plików.
  • Wirtualna prywatna baza danych (VPD) – maskuje dane w większej bazie danych, dzięki czemu bezpieczeństwo pozwala na użycie tylko pozornie prywatnych danych.
  • Baza danych podatności – platforma służąca do gromadzenia, utrzymywania i rozpowszechniania informacji o wykrytych podatnościach atakujących rzeczywiste systemy komputerowe.
  • XLDB – oznacza „eXtremely Large Data Base”.
  • Baza danych XML – dane przechowywane w formacie XML, skąd można je przeszukiwać, eksportować i serializować do żądanego formatu.

Historia baz danych

Wykorzystanie bazy danych

  • Wymagania dotyczące korzystania z bazy danych
  • Teoria baz danych – obejmuje szeroki zakres tematów związanych z badaniem teoretycznej dziedziny baz danych i systemów zarządzania bazami danych.
  • Maszyna bazodanowa – lub to komputer lub specjalny sprzęt, który przechowuje i pobiera dane z bazy danych. Nazywany również „procesorem zaplecza”
  • Serwer bazy danych – program komputerowy świadczący usługi bazy danych innym programom komputerowym lub komputerom, zgodnie z definicją modelu klient-serwer.
  • Aplikacja bazy danych – program komputerowy, którego głównym celem jest wprowadzanie i pobieranie informacji z bazy danych zarządzanej przez komputer.
  • Połączenie z bazą danych – funkcja w informatyce, która pozwala oprogramowaniu klienckiemu komunikować się z oprogramowaniem serwera bazy danych, czy to na tej samej maszynie, czy nie.
    • Datasource – nazwa nadana połączeniu zestawionemu do bazy danych z serwera. Nazwa jest powszechnie używana podczas tworzenia zapytania do bazy danych. Nazwa źródła bazy danych (DSN) nie musi być taka sama jak nazwa pliku bazy danych. Na przykład plik bazy danych o nazwie „friends.mdb” może mieć nazwę DSN „school”. Następnie DSN „szkoła” byłaby następnie używana do odwoływania się do bazy danych podczas wykonywania zapytania.
    • Nazwa źródła danych (DSN) – to struktury danych używane do opisu połączenia ze źródłem danych. Czasami znana jako nazwa źródła bazy danych, chociaż źródła danych nie są ograniczone do baz danych.
  • Administrator bazy danych (DBA) – to osoba odpowiedzialna za instalację, konfigurację, aktualizację, administrację, monitorowanie i utrzymanie fizycznych baz danych.
  • Blokada
  • Porównanie narzędzi baz danych – (zawiera tabele do porównywania informacji ogólnych i technicznych dla wielu dostępnych narzędzi administratora baz danych.)
  • Architektura zorientowana na bazę danych – architektury oprogramowania, w których bazy danych odgrywają kluczową rolę. Nazywana również „architekturą zorientowaną na dane”.
  • Inteligentna baza danych – została zaproponowana jako system, który zarządza informacjami (a nie danymi) w sposób naturalny dla użytkowników i wykraczający poza proste prowadzenie ewidencji.
  • Blokowanie dwufazowe (2PL) – to metoda kontroli współbieżności, która gwarantuje serializowalność.
  • Blokady z uporządkowanym udostępnianiem – obejmuje kilka wariantów protokołu kontroli współbieżności dwufazowego blokowania (2PL) generowanego przez zmianę semantyki blokowania blokad w przypadku konfliktów.
  • Załaduj plik – w środowisku procesowym jest powszechnie określany jako plik służący do importowania danych (zakodowanych, przechwyconych lub wyodrębnionych danych z przetwarzania ESI) do bazy danych; lub plik używany do łączenia obrazów.
  • Publikowanie baz danych – obszar zautomatyzowanej produkcji mediów, w której wykorzystuje się specjalistyczne techniki do generowania paginowanych dokumentów z danych źródłowych znajdujących się w tradycyjnych bazach danych.
  • Halloween Problem – zjawisko w bazach danych, w którym operacja aktualizacji powoduje zmianę fizycznej lokalizacji wiersza, potencjalnie pozwalając na odwiedzenie wiersza więcej niż raz podczas operacji.
  • Przesyłanie dziennika – proces automatyzacji tworzenia kopii zapasowej bazy danych i plików dziennika transakcji na podstawowym (produkcyjnym) serwerze bazy danych, a następnie przywracanie ich na serwer zapasowy.

Języki baz danych

Języki baz danych

  • Język definicji danych
  • Język manipulacji danymi
  • Język zapytań
    • Język zapytań wyszukiwania informacjijęzyk zapytań używany do tworzenia zapytań do bazy danych, gdzie semantyka zapytania jest definiowana nie poprzez precyzyjne oddanie składni formalnej, ale przez interpretację najbardziej odpowiednich wyników zapytania.
    • SQL (Structured Query Language) – specjalistyczny język programowania przeznaczony do zarządzania danymi przechowywanymi w relacyjnym systemie zarządzania bazą danych (RDBMS) lub do przetwarzania strumieniowego w relacyjnym systemie zarządzania strumieniem danych (RDSMS).
    • XQuery – język programowania zapytań i funkcjonalny, który odpytuje i przekształca kolekcje danych ustrukturyzowanych i nieustrukturyzowanych.

Bezpieczeństwo bazy danych

Bezpieczeństwo bazy danych

  • Monitorowanie aktywności bazy danych (DAM) – technologia bezpieczeństwa bazy danych do monitorowania i analizowania aktywności bazy danych, która działa niezależnie od systemu zarządzania bazą danych (DBMS) i nie opiera się na żadnej formie natywnego (rezydentnego w DBMS) audytu ani natywnych dzienników, takich jak śledzenie lub transakcje dzienniki.
  • Audyt bazy danych
  • Kryminalistyka baz danych – dziedzina kryminalistyki cyfrowej związana z kryminalistycznym badaniem baz danych i związanych z nimi metadanych.
  • Negatywna baza danych – terminologia kart kredytowych dla listy właścicieli kart kredytowych, którzy często obciążają konto.

Projekt bazy danych

Projekt bazy danych

  • Model encji i relacji ( model ER) – abstrakcyjna i pojęciowa reprezentacja danych.
  • Normalizacja bazy danych – proces organizowania pól i tabel relacyjnej bazy danych w celu zminimalizowania redundancji i zależności.
  • Refaktoryzacja bazy danych – prosta zmiana w schemacie bazy danych, która usprawnia jej projekt, zachowując jednocześnie semantykę behawioralną i informacyjną.

Programowanie baz danych

  • Warstwa abstrakcji bazy danych – interfejs programowania aplikacji, który ujednolica komunikację pomiędzy aplikacją komputerową a bazami danych takimi jak SQL Server, DB2, MySQL, PostgreSQL, Oracle czy SQLite.
  • Mapowanie obiektowo-relacyjne ( mapowanie ORM, O/RM i O/R) – w oprogramowaniu komputerowym jest techniką programowania służącą do konwersji danych między niekompatybilnymi systemami typów w językach programowania obiektowego.

Zarządzania bazami danych

  • Wirtualizacja bazy danych – jest to rozdzielenie warstwy bazy danych, która znajduje się pomiędzy warstwami pamięci masowej i aplikacji w stosie aplikacji.
  • Strojenie bazy danych – opisuje grupę czynności służących do optymalizacji i ujednolicenia wydajności bazy danych.
  • Migracja danych#Migracja bazy danych
  • Zachowanie bazy danych – zwykle polega na konwersji informacji przechowywanych w bazie danych, bez utraty cech (kontekstu, treści, struktury, wyglądu i zachowania) danych do formatu, który może być używany w długim okresie, nawet jeśli technologia i na co dzień zmienia się wiedza życiowa.
  • Integralność bazy danych – zapewnia, że ​​dane wprowadzane do bazy danych są dokładne, prawidłowe i spójne.

Systemy zarządzania bazą danych

System zarządzania bazą danych

  • Model bazy danych
  • Normalizacja bazy danych – organizowanie tabel na podstawie ich atrybutów, dzięki czemu prezentowane dane mogą uniknąć nadmiarowości i zależności.
  • Struktury przechowywania baz danych
  • Rozproszony system zarządzania bazą danych
  • Sfederowany system baz danych — rodzaj systemu zarządzania metabazą danych (DBMS), który w przejrzysty sposób odwzorowuje wiele autonomicznych systemów baz danych w jedną sfederowaną bazę danych.
  • Integralność referencyjna – .
  • Algebra relacyjna – odgałęzienie logiki pierwszego rzędu (i algebry zbiorów), zajmuje się zbiorem relacji skończonych (patrz też relacja (baza danych)), który jest zamknięty pod pewnymi operatorami.
  • Rachunek relacyjny – składa się z dwóch rachunków, rachunku relacyjnego krotki i rachunku relacyjnego domeny, które są częścią modelu relacyjnego dla baz danych i zapewniają deklaratywny sposób określania zapytań do bazy danych.
  • Relacyjna baza danych – zbiór elementów danych zorganizowany w zestaw formalnie opisanych tabel, z których można łatwo uzyskać dostęp do danych.
  • Relational database management system (RDBMS) – system zarządzania bazą danych (DBMS) oparty na modelu relacyjnym wprowadzonym przez E.
  • Model relacyjny – do zarządzania bazą danych jest model bazy danych oparty na logice predykatów pierwszego rzędu, po raz pierwszy sformułowany i zaproponowany w 1969 roku przez Edgara F.
  • Obiektowo-relacyjna baza danych (ORD) – system zarządzania bazą danych (DBMS) podobny do relacyjnej bazy danych, ale z obiektowym modelem bazy danych: obiekty, klasy i dziedziczenie są bezpośrednio obsługiwane w schematach baz danych oraz w języku zapytań. Nazywany również obiektowo-relacyjnym systemem zarządzania bazami danych (ORDBMS).
  • Przetwarzanie transakcji

Koncepcje

  • Baza danych – uporządkowany zbiór danych, dziś zazwyczaj w formie cyfrowej.
  • ACID – ( niepodzielność, spójność, izolacja, trwałość ) to zestaw właściwości gwarantujących niezawodne przetwarzanie transakcji bazy danych.
  • Twórz, czytaj, aktualizuj i usuwaj (CRUD) – to cztery podstawowe funkcje pamięci trwałej.
  • Zerowy
  • Klucz kandydata – minimalny superklucz dla relacji.
  • Klucz obcy – ograniczenie referencyjne między dwiema tabelami.
  • Klucz podstawowy
  • Superkey – zestaw atrybutów zmiennej relacyjnej, dla której utrzymuje, że we wszystkich relacjach przypisanych do tej zmiennej nie ma dwóch odrębnych krotek (wierszy), które mają takie same wartości atrybutów w tym zestawie.
  • Klucz zastępczy – unikalny identyfikator w bazie danych dla podmiotu w modelowanym świecie lub obiektu w bazie danych.
  • Aksjomaty Armstronga – zbiór aksjomatów (a dokładniej reguł wnioskowania) służących do wnioskowania wszystkich zależności funkcjonalnych w relacyjnej bazie danych.
  • NoSQL – klasa systemu zarządzania bazami danych identyfikowana przez niezgodność z powszechnie stosowanym modelem relacyjnego systemu zarządzania bazami danych (RDBMS):

Obiekty

  • Relacja
  • Widok
  • Transakcja bazy danych
  • Dziennik transakcji – historia działań wykonywanych przez system zarządzania bazą danych w celu zagwarantowania właściwości ACID w przypadku awarii lub awarii sprzętu. Zwany także „dziennikiem transakcji”, „dziennikiem bazy danych” lub „dziennikiem binarnym”.
  • Wyzwalacz bazy danych – kod proceduralny, który jest automatycznie wykonywany w odpowiedzi na określone zdarzenia w określonej tabeli lub widoku w bazie danych.
  • Indeks
  • Procedura składowana – podprogram dostępny dla aplikacji uzyskujących dostęp do systemu relacyjnej bazy danych.
  • Kursor
  • Partycja

składniki

  • Kontrola współbieżności – zapewnia generowanie prawidłowych wyników dla równoczesnych operacji, jednocześnie uzyskując te wyniki tak szybko, jak to możliwe.
  • Słownik danych — zgodnie z definicją zawartą w słowniku IBM Dictionary of Computing , to „scentralizowane repozytorium informacji o danych, takich jak znaczenie, relacje z innymi danymi, pochodzenie, użycie i format”. Nazywany również „repozytorium metadanych”.
  • Łączność z bazą danych Java – .
  • Otwarta łączność z bazą danych
  • Język zapytań
  • Optymalizator zapytań – element systemu zarządzania bazą danych, który próbuje określić najbardziej efektywny sposób wykonania zapytania.
  • Plan zapytań – uporządkowany zestaw kroków służących do uzyskania dostępu lub modyfikacji informacji w systemie zarządzania relacyjnymi bazami danych SQL. Nazywany również „planem wykonania zapytania”.

Funkcje

Produkty bazodanowe

Modele baz danych

  • Model bazy danych – teoretyczna podstawa bazy danych i zasadniczo określa, w jaki sposób dane mogą być przechowywane, organizowane i manipulowane w systemie bazodanowym. Definiuje w ten sposób infrastrukturę oferowaną przez konkretny system baz danych. Najpopularniejszym przykładem modelu bazy danych jest model relacyjny.

Modele

Inne modele

Realizacje

Hurtownia danych

Hurtownia danych

Tworzenie hurtowni danych

Koncepcje

Warianty

Elementy

Fakt

Wymiar

Pożywny

Korzystanie z hurtowni danych

Koncepcje

  • Business Intelligence (BI) – jest definiowany jako zdolność organizacji do wykorzystania wszystkich swoich możliwości i przekształcenia ich w wiedzę, ostatecznie dostarczając właściwe informacje właściwym osobom, we właściwym czasie, za pośrednictwem właściwego kanału.
  • Deska rozdzielcza
  • Eksploracja danych – to proces, który skutkuje odkrywaniem nowych wzorców w dużych zbiorach danych. Jest to etap analizy procesu „Odkrywanie wiedzy w bazach danych” lub KDD.
  • System wspomagania decyzji (DSS)
  • Kostka OLAP – zestaw danych, zorganizowany w sposób ułatwiający nieustalone zapytania o zagregowane informacje, czyli innymi słowy przetwarzanie analityczne online.

Języki

Narzędzia

Ludzie

  • Edgar F. Codd – angielski informatyk, który wprowadził model relacyjnej bazy danych
  • Bill Inmon
  • Ralph Kimball (ur. 1944) – autor na temat hurtowni danych i wywiadu gospodarczego.

Produkty

Organizacje związane z bazami danych

Publikacje związane z bazą danych

  • Ling Liu i Tamer M. Özsu (red.) (2009). " Encyclopedia of Database Systems , 4100 s. 60 il. ISBN  978-0-387-49616-0 . Spis treści dostępny na http://refworks.springer.com/mrw/index.php?id=1217
  • Beynon-Davies, P. (2004). Systemy baz danych. Wydanie III. Palgrave, Houndmills, Basingstoke.
  • Connolly, Thomas i Carolyn Begg. Systemy baz danych. Nowy Jork: Harlow, 2002.
  • Data, CJ (2003). Wprowadzenie do systemów baz danych, wydanie piąte . Addisona Wesleya. Numer ISBN 0-201-51381-1.
  • Gray, J. i Reuter, A. Przetwarzanie transakcji: koncepcje i techniki , wydanie 1, Morgan Kaufmann Publishers, 1992.
  • Kroenke, David M. i David J. Auer. Koncepcje bazy danych. 3. wyd. Nowy Jork: Prentice, 2007.
  • Lightstone, S.; Teorey, T.; Nadeau, T. (2007). Fizyczny projekt bazy danych: przewodnik dla specjalistów ds. baz danych dotyczący wykorzystywania indeksów, widoków, pamięci masowej i nie tylko . Prasa Morgana Kaufmanna. Numer ISBN 978-0-12-369389-1.
  • Teorey, T.; Lightstone, S. i Nadeau, T. Modelowanie i projektowanie bazy danych: Projektowanie logiczne , wydanie 4, Morgan Kaufmann Press, 2005. ISBN  0-12-685352-5

Badacze baz danych

Zobacz też

Bibliografia

Zewnętrzne linki