Architektura danych - Data architecture

W technologii informacyjnej , architektura danych składa się z modeli, polityk, przepisów lub norm, które regulują, jakie dane są zbierane iw jaki sposób jest on przechowywany, zaaranżowany, zintegrowane, a oddany do użytku w systemach transmisji danych w organizacji. Dane są zwykle jedną z kilku domen architektury, które tworzą filary architektury korporacyjnej lub architektury rozwiązań .

Przegląd

Architektura danych ma na celu ustalenie standardów danych dla wszystkich swoich systemów danych jako wizji lub modelu ewentualnych interakcji między tymi systemami danych. Na przykład integracja danych powinna zależeć od standardów architektury danych, ponieważ integracja danych wymaga interakcji danych między dwoma lub większą liczbą systemów danych. Architektura danych po części opisuje struktury danych używane przez firmę i jej oprogramowanie aplikacji komputerowych . Architektury danych adresują dane w pamięci, dane w użyciu i dane w ruchu; opisy magazynów danych, grup danych i pozycji danych; i mapowania tych artefaktów danych do jakości danych, aplikacji, lokalizacji itp.

Niezbędna do zrealizowania stanu docelowego, architektura danych opisuje sposób przetwarzania, przechowywania i wykorzystywania danych w systemie informacyjnym . Podaje kryteria operacji przetwarzania danych tak, aby umożliwić projektowanie przepływów danych, a także sterowanie przepływem danych w systemie.

Architekt danych jest zazwyczaj odpowiedzialny za określenie stanu docelowego, wyrównując w trakcie rozwoju, a następnie kontynuacji aby zapewnić ulepszenia są wykonane w duchu pierwotnego planu.

Podczas definiowania stanu docelowego architektura danych rozkłada temat do poziomu atomowego, a następnie buduje go z powrotem do pożądanej formy. Architekt danych rozkłada temat, przechodząc przez 3 tradycyjne procesy architektoniczne:

  • Koncepcyjne – reprezentuje wszystkie podmioty gospodarcze .
  • Logiczny — reprezentuje logikę powiązania jednostek.
  • Fizyczne – realizacja mechanizmów danych dla określonego typu funkcjonalności.

Kolumna „dane” z Zachman Framework dla architektury korporacyjnej –

Warstwa Widok Dane (Co) Interesariusz
1 Zakres/kontekstowe Lista rzeczy i standardów architektonicznych ważnych dla biznesu Planista
2 Model biznesowy/konceptualny Model semantyczny lub koncepcyjny / korporacyjny model danych Właściciel
3 Model systemu/logiczny Przedsiębiorstwo/ logiczny model danych Projektant
4 Model technologiczny/fizyczny Fizyczny model danych Budowniczy
5 Szczegółowe Reprezentacje Rzeczywiste bazy danych Poddostawca

W tym drugim, szerszym znaczeniu, architektura danych obejmuje pełną analizę relacji między funkcjami organizacji, dostępnymi technologiami i typami danych .

Architekturę danych należy określić na etapie planowania projektu nowego systemu przetwarzania i przechowywania danych. Główne typy i źródła danych niezbędnych do wsparcia przedsiębiorstwa powinny być zidentyfikowane w sposób kompletny, spójny i zrozumiały. Podstawowym wymaganiem na tym etapie jest zdefiniowanie wszystkich odpowiednich jednostek danych, a nie określenie elementów sprzętu komputerowego . Jednostka danych to każda rzeczywista lub abstrakcyjna rzecz, o której organizacja lub osoba fizyczna chce przechowywać dane.

Fizyczna architektura danych

Fizyczna architektura danych systemu informatycznego jest częścią planu technologicznego . Jak sama nazwa wskazuje, plan technologiczny koncentruje się na rzeczywistych, namacalnych elementach, które mają być wykorzystane w realizacji projektu architektury danych . Fizyczna architektura danych obejmuje architekturę bazy danych. Architektura bazy danych to schemat rzeczywistej technologii bazy danych, który będzie wspierał projektowaną architekturę danych.

Elementy architektury danych

Pewne elementy należy zdefiniować na etapie projektowania schematu architektury danych. Na przykład należy opisać strukturę administracyjną, która zostanie ustanowiona w celu zarządzania zasobami danych. Należy również zdefiniować metodologie, które będą stosowane do przechowywania danych. Ponadto należy wygenerować opis technologii baz danych, która zostanie zastosowana, a także opis procesów, które będą manipulować danymi. Ważne jest również, aby projektować interfejsy do danych przez inne systemy, jak również projekt dla infrastruktury , która będzie wspierać działania wspólnych danych (tj procedur awaryjnych, import danych , tworzenie kopii zapasowych danych , zewnętrznych transferów danych ).

Bez wskazówek dotyczących prawidłowo zaimplementowanego projektu architektury danych, wspólne operacje na danych mogą być realizowane na różne sposoby, co utrudnia zrozumienie i kontrolę przepływu danych w takich systemach. Ten rodzaj fragmentacji jest wysoce niepożądany ze względu na potencjalny wzrost kosztów i związane z tym rozłączenie danych. Tego rodzaju trudności mogą napotkać szybko rozwijające się przedsiębiorstwa, a także przedsiębiorstwa obsługujące różne branże (np. produkty ubezpieczeniowe ).

Prawidłowo przeprowadzona faza architektury danych planowania systemu informatycznego wymusza na organizacji precyzyjne określenie i opisanie zarówno wewnętrznych, jak i zewnętrznych przepływów informacji. Są to wzorce, których organizacja mogła wcześniej nie poświęcić czasu na konceptualizację. Na tym etapie można zatem zidentyfikować kosztowne braki informacji, rozłączenia między działami i rozłączenia między systemami organizacyjnymi, które mogły nie być widoczne przed analizą architektury danych.

Ograniczenia i wpływy

Różne ograniczenia i wpływy będą miały wpływ na projektowanie architektury danych. Obejmują one wymagania przedsiębiorstwa, czynniki technologiczne, ekonomię, zasady biznesowe i potrzeby w zakresie przetwarzania danych.

Wymagania przedsiębiorstwa
Obejmują one na ogół takie elementy, jak ekonomiczna i efektywna rozbudowa systemu, akceptowalne poziomy wydajności (zwłaszcza szybkość dostępu do systemu), niezawodność transakcji oraz przejrzyste zarządzanie danymi . Ponadto konwersja surowych danych, takich jak zapisy transakcji i pliki obrazów , w bardziej przydatne formy informacji za pomocą takich funkcji, jak hurtownie danych, jest również powszechnym wymogiem organizacyjnym , ponieważ umożliwia to podejmowanie decyzji zarządczych i inne procesy organizacyjne. Jedną z technik architektury jest podział między zarządzanie danymi transakcyjnymi i (głównymi) danymi referencyjnymi . Innym jest oddzielenie systemów przechwytywania danych od systemów wyszukiwania danych (tak jak ma to miejsce w hurtowni danych).
Sterowniki technologii
Są one zwykle sugerowane przez ukończone projekty architektury danych i architektury baz danych. Ponadto niektóre sterowniki technologii będą wywodzić się z istniejących ram i standardów integracji organizacyjnej, ekonomii organizacyjnej i istniejących zasobów witryny (np. wcześniej zakupione licencje na oprogramowanie ). W wielu przypadkach integracja wielu starszych systemów wymaga zastosowania technologii wirtualizacji danych .
Ekonomia
Są to również ważne czynniki, które należy wziąć pod uwagę na etapie architektury danych. Możliwe, że niektóre rozwiązania, choć z założenia optymalne, mogą nie być potencjalnymi kandydatami ze względu na ich koszt. Czynniki zewnętrzne, takie jak cykl koniunkturalny , stopy procentowe, warunki rynkowe i względy prawne, mogą mieć wpływ na decyzje dotyczące architektury danych.
Polityka biznesowa
Zasady biznesowe, które również wpływają na projektowanie architektury danych, obejmują wewnętrzne zasady organizacyjne, zasady organów regulacyjnych , standardy zawodowe i obowiązujące przepisy rządowe, które mogą się różnić w zależności od odpowiedniej agencji . Te zasady i zasady pomogą opisać sposób, w jaki przedsiębiorstwo chce przetwarzać swoje dane.
Potrzeby przetwarzania danych
Obejmują one dokładne i powtarzalne transakcje wykonywane w dużych ilościach, hurtownie danych dla wsparcia systemów informacji zarządczej (i potencjalnej eksploracji danych ), powtarzalne raportowanie okresowe, raportowanie ad hoc oraz wsparcie różnych inicjatyw organizacyjnych zgodnie z wymaganiami (np. budżety roczne, nowy produkt rozwój).

Zobacz też

Bibliografia

Dalsza lektura

  • Bas, L.; Jana B.; i Kates, J. (2001). Osiąganie użyteczności dzięki architekturze oprogramowania , Carnegie Mellon University.
  • Lewis, G.; Comella-Dorda, S.; Miejsce, P.; Plakosh, D.; & Seacord, R., (2001). Przewodnik po architekturze danych systemu informacyjnego przedsiębiorstwa Carnegie Mellon University.
  • Adleman, S.; Mech, L.; Abai, M. (2005). Strategia danych Addison-Wesley Professional.

Linki zewnętrzne