Metadane — Metadata

W XXI wieku metadane zazwyczaj odnoszą się do formularzy cyfrowych, ale tradycyjne katalogi kart zawierają metadane, z kartami zawierającymi informacje o książkach w bibliotece (autor, tytuł, temat itp.).

Metadane to „ dane, które dostarczają informacji o innych danych”, ale nie treść danych, na przykład tekst wiadomości lub sam obraz. Istnieje wiele różnych typów metadanych, w tym:

  • Metadane opisowe — opisowe informacje o zasobie. Służy do wykrywania i identyfikacji. Zawiera elementy takie jak tytuł, streszczenie, autor i słowa kluczowe.
  • Metadane strukturalne — metadane dotyczące kontenerów danych i wskazują, jak złożone są obiekty, na przykład jak strony są uporządkowane w rozdziały. Opisuje rodzaje, wersje, relacje i inne cechy materiałów cyfrowych.
  • Metadane administracyjne — informacje ułatwiające zarządzanie zasobem, takie jak typ zasobu, uprawnienia oraz czas i sposób jego utworzenia.
  • Metadane referencyjne — informacje o zawartości i jakości danych statystycznych.
  • Metadane statystyczne , zwane również danymi procesu, mogą opisywać procesy, które gromadzą, przetwarzają lub generują dane statystyczne.
  • Metadane prawne — zawierają informacje o twórcy, posiadaczu praw autorskich i licencji publicznej, jeśli zostały podane.

Metadane nie są ściśle związane z jedną z tych kategorii, ponieważ mogą opisywać dane na wiele innych sposobów.

Historia

Metadane mają różne cele. Może pomóc użytkownikom znaleźć odpowiednie informacje i odkryć zasoby. Może również pomóc w organizowaniu zasobów elektronicznych, zapewnianiu identyfikacji cyfrowej oraz archiwizowaniu i zabezpieczaniu zasobów. Metadane umożliwiają użytkownikom dostęp do zasobów poprzez „pozwalanie na znajdowanie zasobów według odpowiednich kryteriów, identyfikowanie zasobów, łączenie podobnych zasobów, rozróżnianie niepodobnych zasobów i podawanie informacji o lokalizacji”. Metadane dotyczące działalności telekomunikacyjnej, w tym ruchu internetowego, są bardzo szeroko gromadzone przez różne krajowe organizacje rządowe. Dane te są wykorzystywane do celów analizy ruchu i mogą być wykorzystywane do masowej inwigilacji .

Metadane był tradycyjnie stosowany w katalogach kart z biblioteki do 1980 roku, kiedy biblioteki przeliczone Katalog swoich danych cyfrowych baz danych. W 2000 roku, gdy dane i informacje były coraz częściej przechowywane w formie cyfrowej, te dane cyfrowe zostały opisane przy użyciu standardów metadanych .

Pierwszy opis „metadanych” dla systemów komputerowych został rzekomo odnotowany przez ekspertów z Centrum Studiów Międzynarodowych MIT, Davida Griffila i Stuarta McIntosha w 1967 roku: dane. Mamy również wypowiedzi w języku meta opisującym relacje i przekształcenia danych oraz relacje powinno/jest między normą a danymi”.

Istnieją unikalne standardy metadanych dla różnych dyscyplin (np. zbiory muzealne , cyfrowe pliki audio , strony internetowe itp.). Opisanie zawartości i kontekstu danych lub plików danych zwiększa ich użyteczność. Na przykład strona internetowa może zawierać metadane określające, w jakim języku oprogramowania strona jest napisana (np. HTML), jakich narzędzi użyto do jej utworzenia, jakich tematów dotyczy strona i gdzie można znaleźć więcej informacji na ten temat. Te metadane mogą automatycznie poprawić wrażenia czytelnika i ułatwić użytkownikom znalezienie strony internetowej w Internecie. Płyta CD może zawierać metadane zawierające informacje o muzykach, piosenkarzach i autorach piosenek, których prace pojawiają się na płycie.

W wielu krajach organizacje rządowe rutynowo przechowują metadane dotyczące wiadomości e-mail, połączeń telefonicznych, stron internetowych, ruchu wideo, połączeń IP i lokalizacji telefonów komórkowych.

Definicja

Metadane oznaczają „dane o danych”. Chociaż przedrostek „meta” oznacza „po” lub „poza”, w epistemologii jest używany w znaczeniu „około”. Metadane definiuje się jako dane dostarczające informacji o jednym lub kilku aspektach danych; służy do podsumowania podstawowych informacji o danych, co może ułatwić śledzenie i pracę z określonymi danymi. Oto kilka przykładów:

  • Sposoby tworzenia danych
  • Cel danych
  • Czas i data powstania
  • Twórca lub autor danych
  • Lokalizacja w sieci komputerowej, w której utworzono dane
  • Zastosowane standardy
  • Rozmiar pliku
  • Jakość danych
  • Źródło danych
  • Proces używany do tworzenia danych

Na przykład obraz cyfrowy może zawierać metadane opisujące rozmiar obrazu, jego głębię kolorów, rozdzielczość, czas utworzenia, czas otwarcia migawki i inne dane. Metadane dokumentu tekstowego mogą zawierać informacje o tym, jak długi jest dokument, kto jest autorem, kiedy został napisany oraz krótkie podsumowanie dokumentu. Metadane na stronach internetowych mogą również zawierać opisy zawartości strony, a także słowa kluczowe powiązane z treścią. Linki te są często nazywane „metatagami”, które były głównym czynnikiem określającym kolejność wyszukiwania w sieci do późnych lat 90. XX wieku. Zależność metatagów w wyszukiwaniach internetowych spadła pod koniec lat 90. z powodu „upychania słów kluczowych”. Metatagi były w dużej mierze niewłaściwie wykorzystywane do nakłaniania wyszukiwarek do przekonania, że ​​niektóre witryny mają większe znaczenie w wyszukiwaniu niż w rzeczywistości.

Metadane mogą być przechowywane i zarządzane w bazie danych , często nazywanej rejestrem metadanych lub repozytorium metadanych . Jednak bez kontekstu i punktu odniesienia może być niemożliwe zidentyfikowanie metadanych na podstawie samego patrzenia. Na przykład: sama baza danych zawierająca kilka liczb, wszystkie 13 cyfr może być wynikiem obliczeń lub listą liczb do wpięcia w równanie - bez żadnego innego kontekstu same liczby mogą być postrzegane jako dane. Ale jeśli biorąc pod uwagę kontekst, w którym ta baza danych jest dziennikiem księgozbioru, te 13-cyfrowe liczby mogą być teraz identyfikowane jako numery ISBN – informacje, które odnoszą się do książki, ale same w sobie nie są informacjami zawartymi w książce. Termin „metadane” został ukuty w 1968 r. przez Philipa Bagleya w jego książce „Extension of Programming Language Concepts”, gdzie jest jasne, że używa tego terminu w „tradycyjnym” sensie ISO 11179, czyli „metadanych strukturalnych”, tj. „danych”. o kontenerach danych”; zamiast alternatywnego sensu „treść dotycząca poszczególnych instancji zawartości danych” lub metatreści, typ danych zwykle znajdowany w katalogach bibliotecznych. Od tego czasu termin ten powszechnie przyjęły dziedziny zarządzania informacją, informatyki, technologii informacyjnej, bibliotekoznawstwa i GIS . W tych polach słowo metadane definiuje się jako „dane o danych”. Chociaż jest to ogólnie przyjęta definicja, różne dyscypliny przyjęły własne, bardziej szczegółowe wyjaśnienia i zastosowania tego terminu.

Slate poinformował w 2013 r., że interpretacja „metadanych” przez rząd Stanów Zjednoczonych może być szeroka i może obejmować treść wiadomości, taką jak wiersze tematu wiadomości e-mail.

Rodzaje

Chociaż aplikacja metadanych jest różnorodna i obejmuje wiele różnych dziedzin, istnieją wyspecjalizowane i dobrze akceptowane modele do określania typów metadanych. Bretherton i Singley (1994) rozróżniają dwie odrębne klasy: metadane strukturalne/kontrolne i metadane przewodnie. Metadane strukturalne opisują strukturę obiektów bazy danych, takich jak tabele, kolumny, klucze i indeksy. Metadane przewodnika pomagają ludziom znaleźć określone elementy i są zwykle wyrażane jako zestaw słów kluczowych w języku naturalnym. Według Ralpha Kimballa metadane można podzielić na 2 podobne kategorie: metadane techniczne i metadane biznesowe. Metadane techniczne odpowiadają metadanym wewnętrznym, a metadane biznesowe odpowiadają metadanym zewnętrznym. Kimball dodaje trzecią kategorię, metadane procesów . Z drugiej strony NISO wyróżnia trzy typy metadanych: opisowe, strukturalne i administracyjne.

Metadane opisowe są zwykle używane do wyszukiwania i identyfikacji, jako informacje do wyszukiwania i lokalizowania obiektu, takie jak tytuł, autor, tematy, słowa kluczowe, wydawca. Metadane strukturalne opisują sposób organizacji komponentów obiektu. Przykładem metadanych strukturalnych może być kolejność stron tworzących rozdziały książki. Wreszcie metadane administracyjne dostarczają informacji ułatwiających zarządzanie źródłem. Metadane administracyjne odnoszą się do informacji technicznych, w tym typu pliku lub czasu i sposobu utworzenia pliku. Dwa podtypy metadanych administracyjnych to metadane zarządzania prawami i metadane konserwacji. Metadane zarządzania prawami wyjaśniają prawa własności intelektualnej, podczas gdy metadane zachowywania zawierają informacje umożliwiające zachowanie i zapisanie zasobu.

Repozytoria danych statystycznych mają swoje własne wymagania dotyczące metadanych, aby opisać nie tylko źródło i jakość danych, ale także jakie procesy statystyczne zostały użyte do stworzenia danych, co ma szczególne znaczenie dla społeczności statystycznej w celu zarówno walidacji, jak i poprawy proces tworzenia danych statystycznych.

Dodatkowym rodzajem metadanych, które zaczynają być coraz bardziej rozwinięte, są metadane dostępności . Metadane dostępności nie są nowym pojęciem dla bibliotek; jednak postępy w uniwersalnym wzornictwie podniosły jego rangę. Projekty takie jak Cloud4All i GPII zidentyfikowały brak wspólnej terminologii i modeli opisujących potrzeby i preferencje użytkowników oraz informacje, które odpowiadają tym potrzebom, jako główną lukę w dostarczaniu rozwiązań uniwersalnego dostępu. Te rodzaje informacji to metadane dostępności. Schema.org zawiera kilka właściwości ułatwień dostępu opartych na specyfikacji IMS Global Access for All Information Model Data Element Specification. Strona Wiki Schematy sieci Web/ułatwienia dostępu zawiera listę kilku właściwości i ich wartości.

Chociaż wysiłki zmierzające do opisania i standaryzacji zróżnicowanych potrzeb osób poszukujących informacji w zakresie dostępności stają się coraz bardziej zdecydowane, ich przyjęcie w ustalonych schematach metadanych nie zostało tak rozwinięte. Na przykład, podczas gdy „odbiorcy” Dublin Core (DC) i „poziom czytania” MARC 21 można wykorzystać do identyfikacji zasobów odpowiednich dla użytkowników z dysleksją, a „Format” DC może być użyty do identyfikacji zasobów dostępnych w brajlu, audio lub dużych formatów druku, jest więcej pracy do wykonania.

Struktury

Metadane (metazawartość) lub, bardziej poprawnie, słowniki używane do tworzenia instrukcji metadanych (metazawartości), są zazwyczaj zorganizowane zgodnie ze znormalizowaną koncepcją przy użyciu dobrze zdefiniowanego schematu metadanych, w tym: standardów metadanych i modeli metadanych . Narzędzia takie jak słowniki kontrolowane , taksonomie , tezaurusy , słowniki danych i rejestry metadanych mogą być wykorzystane do dalszej standaryzacji metadanych. Wspólność metadanych strukturalnych ma również ogromne znaczenie przy opracowywaniu modeli danych i projektowaniu baz danych .

Składnia

Składnia metadanych (metazawartości) odnosi się do reguł stworzonych w celu ustrukturyzowania pól lub elementów metadanych (metazawartości). Pojedynczy schemat metadanych może być wyrażony w wielu różnych językach znaczników lub programowania, z których każdy wymaga innej składni. Na przykład Dublin Core może być wyrażony w postaci zwykłego tekstu, HTML , XML i RDF .

Typowym przykładem metatreści (przewodnika) jest klasyfikacja bibliograficzna, temat, numer klasy Dewey Decimal . W każdej „klasyfikacji” jakiegoś obiektu zawsze znajduje się dorozumiana instrukcja. Aby sklasyfikować obiekt jako, na przykład, klasę Deweya o numerze 514 (Topologia) (tj. książki mające numer 514 na grzbiecie), dorozumianym stwierdzeniem jest: „<książka><nagłówek przedmiotu><514>”. Jest to trójka podmiot-predykat-obiekt lub, co ważniejsze, trójka klasa-atrybut-wartość. Pierwsze dwa elementy trójki (klasa, atrybut) to fragmenty pewnych metadanych strukturalnych o określonej semantyce. Trzeci element to wartość, najlepiej z jakiegoś kontrolowanego słownika, jakieś dane referencyjne (wzorcowe). Kombinacja metadanych i elementów danych podstawowych daje w wyniku zestawienie będące zestawieniem metatreści, tj. „metazawartość = metadane + dane podstawowe”. Wszystkie te elementy można uznać za „słownictwo”. Zarówno metadane, jak i dane podstawowe to słowniki, które można łączyć w wyrażenia metatreści. Istnieje wiele źródeł tych słowników, zarówno meta, jak i danych podstawowych: UML, EDIFACT, XSD, Dewey/UDC/LoC, SKOS, ISO-25964, Pantone, Linnaean Binomial Nomenclature, itp. Używanie kontrolowanych słowników dla składników instrukcji metatreści, bez względu na to, czy jest przeznaczony do indeksowania, czy wyszukiwania, jest zgodny z normą ISO 25964 : „Jeśli zarówno indeksujący, jak i poszukujący są naprowadzani do wybrania tego samego terminu dla tego samego pojęcia, odpowiednie dokumenty zostaną pobrane”. Jest to szczególnie istotne w przypadku wyszukiwarek internetowych, takich jak Google. Proces indeksuje strony, a następnie dopasowuje ciągi tekstowe przy użyciu złożonego algorytmu; nie ma tam inteligencji ani „wnioskowania”, a jedynie ich iluzja.

Schematy hierarchiczne, liniowe i planarne

Schematy metadanych mogą mieć charakter hierarchiczny, gdy istnieją relacje między elementami metadanych, a elementy są zagnieżdżone, dzięki czemu między elementami istnieją relacje nadrzędny-podrzędny. Przykładem hierarchicznego schematu metadanych jest schemat IEEE LOM , w którym elementy metadanych mogą należeć do nadrzędnego elementu metadanych. Schematy metadanych mogą być również jednowymiarowe lub liniowe, gdzie każdy element jest całkowicie odrębny od innych elementów i sklasyfikowany tylko według jednego wymiaru. Przykładem liniowego schematu metadanych jest schemat Dublin Core , który jest jednowymiarowy. Schematy metadanych są często dwuwymiarowe lub planarne, gdzie każdy element jest całkowicie odrębny od innych elementów, ale sklasyfikowany według dwóch ortogonalnych wymiarów.

Ziarnistość

Stopień ustrukturyzowania danych lub metadanych jest określany jako „ziarnistość” . „Granularność” odnosi się do tego, ile szczegółów jest dostarczanych. Metadane o wysokiej szczegółowości pozwalają na uzyskanie głębszych, bardziej szczegółowych i bardziej ustrukturyzowanych informacji oraz umożliwiają wyższy poziom manipulacji technicznych. Niższy poziom szczegółowości oznacza, że ​​metadane można tworzyć przy znacznie niższych kosztach, ale nie będą dostarczać tak szczegółowych informacji. Główny wpływ granulacji dotyczy nie tylko tworzenia i przechwytywania, ale także kosztów utrzymania. Gdy tylko struktury metadanych się dezaktualizują, dezaktualizuje się również dostęp do tych danych. W związku z tym granulacja musi uwzględniać wysiłek włożony w tworzenie metadanych, a także wysiłek związany z ich utrzymaniem.

Hipermapowanie

We wszystkich przypadkach, w których schematy metadanych wykraczają poza przedstawienie planarne, wymagany jest pewien rodzaj hipermappingu, aby umożliwić wyświetlanie i przeglądanie metadanych zgodnie z wybranym aspektem i obsługiwać specjalne widoki. Hipermapping często dotyczy warstw nakładek informacji geograficznych i geologicznych.

Normy

Do metadanych mają zastosowanie międzynarodowe standardy. Wiele pracy jest wykonywane w krajowych i międzynarodowych społecznościach normalizacyjnych, zwłaszcza ANSI (American National Standards Institute) i ISO (Międzynarodowa Organizacja Normalizacyjna), aby osiągnąć konsensus w sprawie standaryzacji metadanych i rejestrów. Podstawowym standardem rejestru metadanych jest ISO / IEC 11179 Rejestry metadanych (MDR), ramy standardu opisano w ISO/IEC 11179-1:2004. Nowe wydanie Części 1 jest w końcowej fazie do publikacji w 2015 lub na początku 2016 r. Zostało ono zaktualizowane w celu dostosowania do aktualnej edycji Części 3, ISO/IEC 11179-3:2013, która rozszerza MDR o wsparcie rejestracji koncepcji Systemy. (patrz ISO/IEC 11179 ). Norma ta określa schemat rejestrowania zarówno znaczenia, jak i struktury technicznej danych do jednoznacznego wykorzystania przez ludzi i komputery. Norma ISO/IEC 11179 odnosi się do metadanych jako obiektów informacji o danych lub „danych o danych”. W ISO/IEC 11179 część 3, obiekty informacyjne są danymi o elementach danych, domenach wartości i innych obiektach informacji semantycznych i reprezentacyjnych wielokrotnego użytku, które opisują znaczenie i szczegóły techniczne elementu danych. Standard ten określa również szczegóły dotyczące rejestru metadanych oraz rejestrowania i administrowania obiektami informacyjnymi w rejestrze metadanych. ISO/IEC 11179 Część 3 zawiera również postanowienia dotyczące opisywania złożonych struktur, które są pochodnymi innych elementów danych, na przykład poprzez obliczenia, kolekcje jednego lub więcej elementów danych lub inne formy danych pochodnych. Chociaż ten standard określa się pierwotnie jako rejestr „elementów danych”, jego celem jest wspieranie opisywania i rejestrowania zawartości metadanych niezależnie od konkretnej aplikacji, umożliwiając odkrycie i ponowne wykorzystanie opisów przez ludzi lub komputery w opracowywaniu nowych aplikacji, baz danych lub do analizy danych zebranych zgodnie z zarejestrowaną zawartością metadanych. Standard ten stał się ogólną podstawą dla innych rodzajów rejestrów metadanych, ponownego wykorzystywania i rozszerzania części standardu dotyczącej rejestracji i administracji.

Społeczność geoprzestrzenna ma tradycję wyspecjalizowanych standardów metadanych geoprzestrzennych , w szczególności opierających się na tradycjach bibliotek map i obrazów oraz katalogów. Formalne metadane są zwykle niezbędne w przypadku danych geoprzestrzennych, ponieważ nie mają zastosowania wspólne podejścia do przetwarzania tekstu.

The Dublin Core Terminy metadanych to zbiór pojęć słownikowych, które mogą być używane do opisania zasobów dla celów odkrycia. Oryginalny zestaw 15 klasycznych terminów metadanych, znany jako zestaw elementów metadanych Dublin Core, jest zatwierdzony w następujących dokumentach normatywnych:

  • IETF RFC 5013
  • Norma ISO 15836-2009
  • Norma NISO Z39.85.

Słownik W3C Data Catalog (DCAT) to słownik RDF, który uzupełnia Dublin Core o klasy dla zestawu danych, usługi danych, katalogu i rekordu katalogu. DCAT wykorzystuje również elementy z FOAF, PROV-O i OWL-Time. DCAT dostarcza model RDF do obsługi typowej struktury katalogu, który zawiera rekordy, z których każdy opisuje zbiór danych lub usługę.

Chociaż nie jest to standard, mikroformat (wspomniany również w sekcji o metadanych w Internecie poniżej) jest opartym na sieci podejściem do znaczników semantycznych, które ma na celu ponowne wykorzystanie istniejących znaczników HTML/XHTML do przekazywania metadanych. Mikroformat jest zgodny ze standardami XHTML i HTML, ale sam w sobie nie jest standardem. Jeden z orędowników mikroformatów, Tantek Çelik , scharakteryzował problem z alternatywnymi podejściami:

Oto nowy język, którego chcemy się nauczyć, a teraz musisz umieścić te dodatkowe pliki na swoim serwerze. To kłopot. (Mikroformaty) obniżają barierę wejścia.

Posługiwać się

Zdjęcia

Metadane mogą zostać zapisane w pliku ze zdjęciem cyfrowym , który określi, kto jest jego właścicielem, informacje o prawach autorskich i kontaktach, marka lub model aparatu, w którym utworzono plik, wraz z informacjami o ekspozycji (czas otwarcia migawki, przysłona itp.) oraz informacje opisowe, takie jak słowa kluczowe dotyczące zdjęcia, umożliwiające wyszukiwanie pliku lub obrazu na komputerze i/lub w Internecie. Niektóre metadane są tworzone przez aparat, a niektóre są wprowadzane przez fotografa i/lub oprogramowanie po pobraniu na komputer. Większość aparatów cyfrowych zapisuje metadane dotyczące numeru modelu, czasu otwarcia migawki itp., a niektóre umożliwiają ich edycję; ta funkcja była dostępna w większości lustrzanek cyfrowych firmy Nikon od czasu wydania Nikon D3 , w większości nowych aparatów Canon od czasu Canon EOS 7D oraz w większości lustrzanek cyfrowych Pentax od czasu modelu Pentax K-3. Metadane można wykorzystać do ułatwienia organizacji w postprodukcji za pomocą słów kluczowych. Filtry mogą służyć do analizowania określonego zestawu zdjęć i tworzenia selekcji na podstawie kryteriów, takich jak ocena lub czas uchwycenia. Na urządzeniach z funkcją geolokalizacji, takich jak GPS (w szczególności smartfony), można również uwzględnić lokalizację, z której zrobiono zdjęcie.

Standardy metadanych fotograficznych są regulowane przez organizacje, które opracowują następujące standardy. Obejmują one między innymi:

  • Model wymiany informacji IPTC IIM (Międzynarodowa Rada Telekomunikacji Prasowej)
  • Schemat podstawowy IPTC dla XMP
  • XMP – Extensible Metadata Platform (standard ISO)
  • Exif – wymienny format pliku obrazu, utrzymywany przez CIPA (Camera & Imaging Products Association) i opublikowany przez JEITA (Japan Electronics and Information Technology Industries Association)
  • Dublin Core (Dublin Core Metadata Initiative – DCMI)
  • PLUS (uniwersalny system licencjonowania obrazów)
  • VRA Core (powiązanie zasobów wizualnych)

Telekomunikacja

Inną formą metadanych, w przeciwieństwie do treści wiadomości, są informacje o czasie, pochodzeniu i miejscu docelowym połączeń telefonicznych, wiadomości elektronicznych, wiadomości błyskawicznych i innych środków komunikacji. Zbiorcze gromadzenie metadanych rekordu gdetail przez agencje wywiadowcze okazało się kontrowersyjne po ujawnieniu przez Edwarda Snowdena faktu, że niektóre agencje wywiadowcze, takie jak NSA, przechowywały (i być może nadal przechowują) metadane online milionów użytkowników Internetu przez okres do rok, niezależnie od tego, czy [kiedykolwiek] byli osobami zainteresowanymi agencją.

Wideo

Metadane są szczególnie przydatne w wideo, gdzie informacje o ich zawartości (takie jak transkrypcje rozmów i opisy tekstowe scen) nie są bezpośrednio zrozumiałe dla komputera, ale pożądane jest sprawne wyszukiwanie treści. Jest to szczególnie przydatne w aplikacjach wideo, takich jak oprogramowanie do automatycznego rozpoznawania tablic rejestracyjnych i identyfikacji pojazdu, w których dane tablic rejestracyjnych są zapisywane i wykorzystywane do tworzenia raportów i alertów. Istnieją dwa źródła, z których pochodzą metadane wideo: (1) zebrane metadane operacyjne, czyli informacje o wytworzonej treści, takie jak rodzaj sprzętu, oprogramowanie, data i lokalizacja; (2) metadane stworzone przez człowieka w celu poprawy widoczności w wyszukiwarkach, wykrywalności, zaangażowania odbiorców i zapewnienia możliwości reklamowych wydawcom wideo. W dzisiejszym społeczeństwie większość profesjonalnych programów do edycji wideo ma dostęp do metadanych. Avid's MetaSync i Adobe's Bridge to dwa doskonałe przykłady tego.

Metadane geoprzestrzenne

Metadane geoprzestrzenne odnoszą się do plików systemów informacji geograficznej (GIS), map, obrazów i innych danych opartych na lokalizacji. Metadane są używane w GIS do dokumentowania cech i atrybutów danych geograficznych, takich jak pliki baz danych i dane opracowane w ramach GIS. Zawiera szczegółowe informacje, takie jak kto opracował dane, kiedy zostały zebrane, jak zostały przetworzone, w jakich formatach są dostępne, a następnie dostarcza kontekst do efektywnego wykorzystania danych.

kreacja

Metadane mogą być tworzone przez zautomatyzowane przetwarzanie informacji lub przez pracę ręczną. Podstawowe metadane przechwycone przez komputery mogą zawierać informacje o tym, kiedy obiekt został utworzony, kto go utworzył, kiedy był ostatnio aktualizowany, rozmiar pliku i rozszerzenie pliku. W tym kontekście obiekt odnosi się do dowolnego z poniższych:

  • Przedmiot fizyczny, taki jak książka, płyta CD, DVD, mapa papierowa, krzesło, stół, doniczka itp.
  • Plik elektroniczny, taki jak obraz cyfrowy, zdjęcie cyfrowe, dokument elektroniczny, plik programu, tabela bazy danych itp.

A silnik metadanych gromadzi, przechowuje i analizuje informacje o danych i metadanych (danych o danych) używanej w domenie.

Wirtualizacja danych

Wirtualizacja danych pojawiła się w 2000 roku jako nowa technologia oprogramowania uzupełniająca „stos” wirtualizacji w przedsiębiorstwie. Metadane są używane w serwerach wirtualizacji danych, które są komponentami infrastruktury przedsiębiorstwa, obok serwerów baz danych i aplikacji. Metadane na tych serwerach są zapisywane jako trwałe repozytorium i opisują obiekty biznesowe w różnych systemach i aplikacjach przedsiębiorstwa. Dla wsparcia wirtualizacji danych ważna jest również strukturalna zgodność metadanych.

Usługi statystyczne i spisowe

Prace normalizacyjne i harmonizacyjne przyniosły korzyści wysiłkom przemysłu zmierzającym do budowy systemów metadanych w społeczności statystycznej. Kilka wytycznych i standardów dotyczących metadanych, takich jak Europejski Kodeks Praktyk Statystycznych i ISO 17369:2013 ( Wymiana Danych i Metadanych Statystycznych lub SDMX), zawiera kluczowe zasady dotyczące sposobu, w jaki przedsiębiorstwa, organy rządowe i inne podmioty powinny zarządzać danymi statystycznymi i metadanymi. Podmioty takie jak Eurostat , Europejski System Banków Centralnych i Agencja Ochrony Środowiska USA wdrożyły te i inne tego typu standardy i wytyczne w celu poprawy „wydajności zarządzania statystycznymi procesami biznesowymi”.

Bibliotekoznawstwo i informatyka

Metadane były wykorzystywane na różne sposoby jako środek katalogowania elementów w bibliotekach, zarówno w formacie cyfrowym, jak i analogowym. Takie dane pomagają klasyfikować, agregować, identyfikować i lokalizować konkretną książkę, płytę DVD, czasopismo lub dowolny przedmiot, który biblioteka może przechowywać w swojej kolekcji. Do lat 80. wiele katalogów bibliotecznych używało kart 3x5 cali w szufladach do wyświetlania tytułu książki, autora, tematu i skróconego ciągu alfanumerycznego ( numer telefonu ), który wskazywał fizyczne położenie książki na półkach bibliotecznych. System dziesiętny Deweya stosowany przez biblioteki do klasyfikacji materiałów bibliotecznych według tematu jest wczesnym przykładem wykorzystania metadanych. Począwszy od lat 80. i 90. wiele bibliotek zastąpiło te papierowe kartoteki komputerowymi bazami danych. Te komputerowe bazy danych znacznie ułatwiają i przyspieszają wyszukiwanie słów kluczowych. Inną formą gromadzenia starszych metadanych jest użycie przez US Census Bureau tak zwanej „formy długiej”. Long Form zadaje pytania, które służą do tworzenia danych demograficznych w celu znalezienia wzorców dystrybucji. Biblioteki wykorzystują metadane w katalogach bibliotecznych , najczęściej w ramach Zintegrowanego Systemu Zarządzania Biblioteką . Metadane pozyskiwane są poprzez katalogowanie zasobów takich jak książki, czasopisma, płyty DVD, strony internetowe czy obrazy cyfrowe. Dane te są przechowywane w zintegrowanym systemie zarządzania biblioteką ILMS , wykorzystującym standard metadanych MARC . Celem jest skierowanie klientów do fizycznej lub elektronicznej lokalizacji przedmiotów lub obszarów, których szukają, a także dostarczenie opisu przedmiotu lub przedmiotów.

Nowsze i bardziej wyspecjalizowane przypadki metadanych bibliotecznych obejmują tworzenie bibliotek cyfrowych, w tym repozytoriów e- printów i bibliotek obrazów cyfrowych. Chociaż często opierają się na zasadach bibliotecznych, skupienie się na wykorzystaniu pozabibliotecznym, zwłaszcza w dostarczaniu metadanych, oznacza, że ​​nie stosują tradycyjnych lub powszechnych podejść do katalogowania. Biorąc pod uwagę niestandardowy charakter dołączonych materiałów, pola metadanych są często specjalnie tworzone, np. pola klasyfikacji taksonomicznej, pola lokalizacji, słowa kluczowe lub oświadczenie o prawach autorskich. Standardowe informacje o pliku, takie jak rozmiar i format pliku, są zwykle dołączane automatycznie. Funkcjonowanie bibliotek od dziesięcioleci jest kluczowym tematem w wysiłkach na rzecz międzynarodowej standaryzacji . Standardy metadanych w bibliotekach cyfrowych obejmują Dublin Core , METS , MODS , DDI , DOI , URN , schemat PREMIS , EML i OAI-PMH . Wiodące biblioteki na świecie udzielają wskazówek na temat swoich strategii dotyczących standardów metadanych.

W muzeach

Metadane w kontekście muzealnym to informacje, które przeszkoleni specjaliści ds. dokumentacji kulturowej, tacy jak archiwiści , bibliotekarze , rejestratorzy muzealni i kuratorzy , tworzą w celu indeksowania, strukturyzowania, opisywania, identyfikowania lub w inny sposób określania dzieł sztuki, architektury, obiektów kultury i ich obrazów. Metadane opisowe są najczęściej używane w kontekstach muzealnych do identyfikacji obiektów i odzyskiwania zasobów.

Stosowanie

Metadane są opracowywane i stosowane w instytucjach gromadzących i muzeach w celu:

  • Ułatw wykrywanie zasobów i wykonuj zapytania wyszukiwania.
  • Twórz archiwa cyfrowe, które przechowują informacje dotyczące różnych aspektów kolekcji muzealnych i obiektów kultury oraz służą do celów archiwalnych i zarządczych.
  • Zapewnij odbiorcom publicznym dostęp do dóbr kultury poprzez publikowanie treści cyfrowych w Internecie.

Normy

Wiele muzeów i centrów dziedzictwa kulturowego zdaje sobie sprawę, że biorąc pod uwagę różnorodność dzieł sztuki i obiektów kultury, żaden pojedynczy model ani standard nie wystarczy do opisania i katalogowania dzieł kultury. Na przykład wyrzeźbiony artefakt rdzennych mieszkańców może zostać sklasyfikowany jako dzieło sztuki, artefakt archeologiczny lub element dziedzictwa rdzennego. Wczesne etapy standaryzacji archiwizacji, opisu i katalogowania w środowisku muzealnym rozpoczęły się pod koniec lat 90. wraz z opracowaniem standardów, takich jak Kategorie opisu dzieł sztuki (CDWA), Spectrum, CIDOC Conceptual Reference Model (CRM), Katalogowanie Obiekty kulturowe (CCO) i schemat XML CDWA Lite. Standardy te wykorzystują języki znaczników HTML i XML do przetwarzania maszynowego, publikacji i implementacji. Anglo-American Katalogowanie Zasady (AACR), pierwotnie opracowany dla scharakteryzowania książki, zostały również zastosowane do obiektów kulturalnych, dzieł sztuki i architektury. Standardy, takie jak CCO, są zintegrowane z systemem zarządzania zbiorami muzealnymi (CMS), bazą danych, dzięki której muzea mogą zarządzać swoimi kolekcjami, nabywaniem, wypożyczaniem i konserwacją. Uczeni i profesjonaliści w tej dziedzinie zauważają, że „szybko rozwijający się krajobraz standardów i technologii” stwarza wyzwania dla dokumentalistów kulturowych, w szczególności profesjonalistów bez wykształcenia technicznego. Większość instytucji kolekcjonerskich i muzeów korzysta z relacyjnej bazy danych do kategoryzowania dzieł kultury i ich obrazów. Relacyjne bazy danych i metadane służą do dokumentowania i opisywania złożonych relacji między obiektami kultury i wieloaspektowymi dziełami sztuki, a także między przedmiotami i miejscami, ludźmi i ruchami artystycznymi. Struktury relacyjnych baz danych są również korzystne w instytucjach zajmujących się zbiorami i muzeach, ponieważ pozwalają archiwistom na wyraźne rozróżnienie między obiektami kultury a ich obrazami; niejasne rozróżnienie może prowadzić do mylących i niedokładnych wyszukiwań.

Obiekty kultury i dzieła sztuki

Materialność, funkcja i przeznaczenie obiektu, a także jego rozmiar (np. wymiary, takie jak wysokość, szerokość, waga), wymagania dotyczące przechowywania (np. środowisko o kontrolowanym klimacie) oraz skupienie muzeum i kolekcji, wpływają na opisową głębię dane przypisane obiektowi przez dokumentalistów kulturowych. Ugruntowane instytucjonalne praktyki katalogowania, cele i doświadczenie dokumentalistów kultury oraz struktura bazy danych również wpływają na informacje przypisywane obiektom kultury oraz na sposoby kategoryzacji obiektów kultury. Ponadto muzea często stosują standardowe oprogramowanie do zarządzania zbiorami komercyjnymi, które określa i ogranicza sposoby, w jakie archiwiści mogą opisywać dzieła sztuki i obiekty kultury. Ponadto instytucje kolekcjonerskie i muzea używają słowników kontrolowanych do opisywania obiektów kultury i dzieł sztuki w swoich kolekcjach. Getty Vocabularies i Library of Congress Controlled Vocabularies cieszą się renomą w środowisku muzealnym i są zalecane przez standardy CCO. Zachęca się muzea do korzystania ze słowników kontrolowanych, które są kontekstowe i istotne dla ich kolekcji oraz zwiększają funkcjonalność ich cyfrowych systemów informacyjnych. Słowniki kontrolowane są korzystne w bazach danych, ponieważ zapewniają wysoki poziom spójności, usprawniając pobieranie zasobów. Struktury metadanych, w tym słowniki kontrolowane, odzwierciedlają ontologie systemów, z których zostały utworzone. Często procesy, za pomocą których obiekty kultury są opisywane i kategoryzowane za pomocą metadanych w muzeach, nie odzwierciedlają perspektyw społeczności twórców.

Muzea i Internet

Metadane odegrały zasadniczą rolę w tworzeniu cyfrowych systemów informacyjnych i archiwów w muzeach oraz ułatwiły muzeom publikowanie treści cyfrowych w Internecie. Umożliwiło to odbiorcom, którzy mogli nie mieć dostępu do dóbr kultury ze względu na bariery geograficzne lub ekonomiczne, dostęp do nich. W 2000 roku, w miarę jak coraz więcej muzeów przyjęło standardy archiwalne i stworzyło skomplikowane bazy danych, pojawiły się dyskusje na temat danych połączonych między muzealnymi bazami danych w środowiskach muzealnych, archiwalnych i bibliotecznych. Systemy zarządzania kolekcjami (CMS) i narzędzia do zarządzania zasobami cyfrowymi mogą być systemami lokalnymi lub współdzielonymi. Naukowcy zajmujący się humanistyką cyfrową zauważają wiele korzyści płynących z interoperacyjności między muzealnymi bazami danych i zbiorami, a także dostrzegają trudności w osiągnięciu takiej interoperacyjności.

Prawo

Stany Zjednoczone

Problemy związane z metadanymi w sporach sądowych w Stanach Zjednoczonych stają się coraz powszechniejsze. Sądy przyjrzały się różnym kwestiom dotyczącym metadanych, w tym możliwości znajdowania metadanych przez strony. Chociaż federalne przepisy postępowania cywilnego określiły jedynie zasady dotyczące dokumentów elektronicznych, późniejsze orzecznictwo rozwinęło wymóg ujawniania metadanych przez strony. W październiku 2009 roku Sąd Najwyższy stanu Arizona orzekł, że rekordy metadanych są rejestrami publicznymi . Metadane dokumentów okazały się szczególnie ważne w środowiskach prawnych, w których postępowanie sądowe wymagało metadanych, które mogą zawierać wrażliwe informacje na szkodę strony w sądzie. Używanie narzędzi do usuwania metadanych do „czyszczenia” lub redagowania dokumentów może zmniejszyć ryzyko nieświadomego wysyłania poufnych danych. Proces ten częściowo (patrz remanencja danych ) chroni firmy prawnicze przed potencjalnie szkodliwym wyciekiem wrażliwych danych w drodze elektronicznego wykrywania .

Badania opinii publicznej wykazały, że 45% Amerykanów „wcale nie jest przekonanych” o tym, że portale społecznościowe zapewniają bezpieczeństwo ich danych osobowych, a 40% twierdzi, że portale społecznościowe nie powinny być w stanie przechowywać żadnych informacji o osobach. 76% Amerykanów twierdzi, że nie ma pewności, czy informacje, które gromadzą na nich agencje reklamowe, są bezpieczne, a 50% twierdzi, że internetowe agencje reklamowe nie powinny w ogóle rejestrować żadnych ich informacji.

Australia

W Australii potrzeba wzmocnienia bezpieczeństwa narodowego zaowocowała wprowadzeniem nowej ustawy o przechowywaniu metadanych. To nowe prawo oznacza, że ​​zarówno agencje bezpieczeństwa, jak i agencje policyjne będą miały dostęp do metadanych osoby przez okres do dwóch lat, w celu ułatwienia powstrzymania ataków terrorystycznych i poważnych przestępstw.

W prawodawstwie

Metadane legislacyjne były przedmiotem dyskusji na forach law.gov, takich jak warsztaty prowadzone przez Instytut Informacji Prawnej w Cornell Law School w dniach 22 i 23 marca 2010 r. Dokumentacja tych forów nosi tytuł „Sugerowane praktyki dotyczące metadanych dla ustawodawstwa i przepisy prawne."

Podczas tych dyskusji nakreślono kilka kluczowych punktów, których nagłówki sekcji są wymienione w następujący sposób:

  • Uwagi ogólne
  • Struktura dokumentu
  • Zawartość dokumentu
  • Metadane (elementy)
  • Warstwy
  • Punkt w czasie a post-hoc

W opiece zdrowotnej

Australijskie badania medyczne zapoczątkowały definicję metadanych do zastosowań w opiece zdrowotnej. Takie podejście stanowi pierwszą uznaną próbę przestrzegania międzynarodowych standardów w naukach medycznych zamiast definiowania zastrzeżonego standardu pod parasolem Światowej Organizacji Zdrowia (WHO). Społeczność medyczna nie zaaprobowała jeszcze potrzeby przestrzegania standardów metadanych pomimo badań, które wspierały te standardy.

W badaniach biomedycznych

Badania naukowe w dziedzinie biomedycyny i biologii molekularnej często dostarczają dużych ilości danych, w tym wyników sekwencjonowania genomu lub metagenomu , danych proteomicznych , a nawet notatek lub planów tworzonych w trakcie samych badań. Każdy typ danych obejmuje własną różnorodność metadanych oraz procesy niezbędne do wytworzenia tych metadanych. Ogólne standardy metadanych, takie jak ISA-Tab, pozwalają naukowcom tworzyć i wymieniać eksperymentalne metadane w spójnych formatach. Konkretne podejścia eksperymentalne często mają własne standardy i systemy metadanych: standardy metadanych dla spektrometrii masowej obejmują mzML i SPLASH, podczas gdy standardy oparte na XML , takie jak PDBML i SRA XML, służą odpowiednio jako standardy dla struktury makromolekularnej i danych sekwencjonowania.

Produkty badań biomedycznych są na ogół realizowane jako recenzowane rękopisy, a publikacje te są kolejnym źródłem danych. Metadane publikacji biomedycznych są często tworzone przez wydawców czasopism i bazy cytowań, takie jak PubMed i Web of Science . Dane zawarte w rękopisach lub towarzyszące im jako materiał uzupełniający rzadziej podlegają tworzeniu metadanych, choć mogą być przekazywane do baz biomedycznych po publikacji. Pierwotni autorzy i kuratorzy baz danych stają się następnie odpowiedzialni za tworzenie metadanych za pomocą zautomatyzowanych procesów. Kompleksowe metadane dla wszystkich danych eksperymentalnych są podstawą Wytycznych FAIR , czyli standardów zapewniających możliwość wyszukiwania , dostępności , interoperacyjności i ponownego wykorzystania danych badawczych .

Magazyn danych

Magazyn danych (DW) jest repozytorium elektronicznie zapisanych danych organizacji. Hurtownie danych są przeznaczone do zarządzania i przechowywania danych. Hurtownie danych różnią się od systemów Business Intelligence (BI), ponieważ systemy BI są zaprojektowane tak, aby wykorzystywać dane do tworzenia raportów i analizowania informacji, aby zapewnić kierownictwo strategiczne. Metadane są ważnym narzędziem w sposobie przechowywania danych w hurtowniach danych. Zadaniem hurtowni danych jest przechowywanie wystandaryzowanych, ustrukturyzowanych, spójnych, zintegrowanych, poprawnych, „wyczyszczonych” i aktualnych danych, wydobytych z różnych systemów operacyjnych w organizacji. Wyodrębnione dane są integrowane ze środowiskiem hurtowni danych, aby zapewnić perspektywę dla całego przedsiębiorstwa. Dane są ustrukturyzowane w sposób umożliwiający spełnienie wymagań sprawozdawczych i analitycznych. Projektowanie wspólności metadanych strukturalnych przy użyciu metody modelowania danych , takiej jak tworzenie diagramów modelu relacji między jednostkami, jest ważne w każdym przedsięwzięciu związanym z tworzeniem hurtowni danych. Wyszczególniają metadane dotyczące każdego elementu danych w hurtowni danych. Niezbędnym elementem hurtowni danych / systemu business intelligence są metadane i narzędzia do zarządzania i pobierania metadanych. Ralph Kimball opisuje metadane jako DNA hurtowni danych, ponieważ metadane definiują elementy hurtowni danych i sposób ich współdziałania.

Kimball i in. odnosi się do trzech głównych kategorii metadanych: metadanych technicznych, metadanych biznesowych i metadanych procesowych. Metadane techniczne mają przede wszystkim charakter definicyjny , podczas gdy metadane biznesowe i metadane procesowe mają przede wszystkim charakter opisowy . Kategorie czasami zachodzą na siebie.

  • Metadane techniczne definiują obiekty i procesy w systemie DW/BI widziane z technicznego punktu widzenia. Metadane techniczne obejmują metadane systemowe, które definiują struktury danych, takie jak tabele, pola, typy danych, indeksy i partycje w silniku relacyjnym, a także bazy danych, wymiary, miary i modele eksploracji danych. Metadane techniczne definiują model danych i sposób ich wyświetlania dla użytkowników, wraz z raportami, harmonogramami, listami dystrybucyjnymi i prawami bezpieczeństwa użytkowników.
  • Metadane biznesowe to zawartość z hurtowni danych opisana w bardziej przyjazny dla użytkownika sposób. Metadane biznesowe informują o tym, jakie dane posiadasz, skąd pochodzą, co oznaczają i jaki jest ich związek z innymi danymi w hurtowni danych. Metadane biznesowe mogą również służyć jako dokumentacja dla systemu DW/BI. Użytkownicy przeglądający hurtownię danych przeglądają przede wszystkim metadane biznesowe.
  • Metadane procesowe służą do opisu wyników różnych operacji w hurtowni danych. W ramach procesu ETL wszystkie kluczowe dane z zadań są rejestrowane podczas wykonywania. Obejmuje to czas rozpoczęcia, czas zakończenia, wykorzystane sekundy procesora, odczyty dysku, zapisy na dysku i przetworzone wiersze. Podczas rozwiązywania problemów z procesem ETL lub zapytaniami tego rodzaju dane stają się cenne. Metadane procesowe to miara faktów podczas budowania i korzystania z systemu DW/BI. Niektóre organizacje utrzymują się z gromadzenia i sprzedaży tego rodzaju danych firmom - w takim przypadku metadane procesu stają się metadanymi biznesowymi dla tabel faktów i wymiarów. Zbieranie metadanych procesowych leży w interesie ludzi biznesu, którzy mogą wykorzystać te dane do identyfikacji użytkowników ich produktów, z jakich produktów korzystają i jaki poziom usług otrzymują.

W Internecie

HTML format używany do określenia stron internetowych pozwala na włączenie różnych typów metadanych opisowych, od podstawowych tekstów, dat i słów kluczowych dla dalszych zaawansowanych schematów metadanych, takich jak Dublin Core , e-GMS i AGLS standardów. Strony mogą być również oznaczone geotagami ze współrzędnymi . Metadane mogą być zawarte w nagłówku strony lub w osobnym pliku. Mikroformaty umożliwiają dodawanie metadanych do danych na stronie w sposób, którego zwykli użytkownicy sieci nie widzą, ale komputery, roboty sieciowe i wyszukiwarki mają łatwy dostęp. Wiele wyszukiwarek ostrożnie korzysta z metadanych w swoich algorytmach rankingowych z powodu wykorzystywania metadanych i praktyki optymalizacji pod kątem wyszukiwarek ( SEO ) w celu poprawy rankingu. Zobacz artykuł o elemencie Meta, aby uzyskać dalsze omówienie. Ta ostrożna postawa może być uzasadniona, ponieważ według Doctorowa ludzie nie dokładają należytej staranności podczas tworzenia własnych metadanych oraz że metadane są częścią konkurencyjnego środowiska, w którym metadane są wykorzystywane do promowania własnych celów twórców metadanych. Badania pokazują, że wyszukiwarki reagują na strony internetowe za pomocą implementacji metadanych, a Google ma w swojej witrynie ogłoszenie pokazujące metatagi, które rozumie wyszukiwarka. Firma Swiftype, startująca w wyszukiwarce korporacyjnej, rozpoznaje metadane jako sygnał trafności, który webmasterzy mogą zaimplementować w swojej wyszukiwarce specyficznej dla witryny, nawet publikując własne rozszerzenie, znane jako Metatagi 2.

W przemyśle nadawczym

W branży nadawczej metadane są powiązane z mediami transmisji audio i wideo w celu:

Te metadane można powiązać z mediami wideo dzięki serwerom wideo . Większość głównych transmitowanych wydarzeń sportowych, takich jak Mistrzostwa Świata w Piłce Nożnej czy Igrzyska Olimpijskie, wykorzystuje te metadane do dystrybucji treści wideo do stacji telewizyjnych za pomocą słów kluczowych . Często to nadawca główny jest odpowiedzialny za organizowanie metadanych za pośrednictwem Międzynarodowego Centrum Transmisji i serwerów wideo. Te metadane są rejestrowane wraz z obrazami i są wprowadzane przez operatorów metadanych ( rejestratory ), którzy kojarzą na żywo metadane dostępne w siatkach metadanych za pomocą oprogramowania (takiego jak Multicam(LSM) lub IPDirector używane podczas Mistrzostw Świata lub Igrzysk Olimpijskich).

Geoprzestrzenny

Metadane opisujące obiekty geograficzne w pamięci lub formacie elektronicznym (takie jak zbiory danych, mapy, obiekty lub dokumenty z komponentem geoprzestrzennym) mają historię sięgającą co najmniej 1994 r. (patrz strona Biblioteki MIT w FGDC Metadata ). Ta klasa metadanych została dokładniej opisana w artykule o metadanych geoprzestrzennych .

Ekologiczny i środowiskowy

Metadane ekologiczne i środowiskowe mają na celu udokumentowanie „kto, co, kiedy, gdzie, dlaczego i jak” zbiera dane dla konkretnego badania. Zazwyczaj oznacza to, która organizacja lub instytucja zebrała dane, jaki rodzaj danych, jaką datę (daty) zebrano, uzasadnienie gromadzenia danych oraz metodologię zastosowaną do gromadzenia danych. Metadane powinny być generowane w formacie powszechnie używanym przez najbardziej odpowiednią społeczność naukową, takim jak Darwin Core , Ecological Metadata Language lub Dublin Core . Istnieją narzędzia do edycji metadanych ułatwiające generowanie metadanych (np. Metavist, Mercury , Morpho). Metadane powinny opisywać pochodzenie danych (miejsce ich powstania, a także wszelkie przekształcenia, jakie przeszły dane) oraz sposób przypisywania (cytowania) produktów danych.

Muzyka cyfrowa

Kiedy po raz pierwszy zostały wydane w 1982 roku, płyty Compact Disc zawierały tylko spis treści (TOC) z liczbą ścieżek na płycie i ich długością w samplach. Czternaście lat później, w 1996 r., w nowelizacji standardu CD Red Book dodano CD-Text do przechowywania dodatkowych metadanych. Ale CD-Text nie został powszechnie przyjęty. Wkrótce potem stało się powszechne, że komputery osobiste pobierały metadane ze źródeł zewnętrznych (np. CDDB , Gracenote ) na podstawie spisu treści.

W 2000 roku cyfrowe formaty audio , takie jak cyfrowe pliki audio, wyparły formaty muzyczne, takie jak kasety magnetofonowe i płyty CD . Cyfrowe pliki audio mogą być oznaczone większą ilością informacji, niż może zawierać sama nazwa pliku. Ta informacja opisowa jest ogólnie nazywana znacznikiem audio lub metadanymi audio. Programy komputerowe specjalizujące się w dodawaniu lub modyfikowaniu tych informacji nazywane są edytorami znaczników . Metadane mogą być używane do nazywania, opisywania, katalogowania i wskazywania własności lub praw autorskich do cyfrowego pliku audio, a ich obecność znacznie ułatwia zlokalizowanie określonego pliku audio w grupie, zazwyczaj za pomocą wyszukiwarki, która uzyskuje dostęp do metadanych. W miarę opracowywania różnych cyfrowych formatów audio podjęto próby standaryzacji określonej lokalizacji w plikach cyfrowych, w której można przechowywać te informacje.

W rezultacie prawie wszystkie cyfrowe formaty audio, w tym mp3 , nadawane pliki wav i AIFF , mają podobne, ustandaryzowane lokalizacje, które można wypełnić metadanymi. Metadane skompresowanej i nieskompresowanej muzyki cyfrowej są często zakodowane w znaczniku ID3 . Popularne edytory, takie jak TagLib, obsługują formaty plików MP3, Ogg Vorbis, FLAC, MPC, Speex, WavPack TrueAudio, WAV, AIFF, MP4 i ASF.

Aplikacje w chmurze

Wraz z dostępnością aplikacji w chmurze, w tym aplikacji do dodawania metadanych do treści, metadane są coraz częściej dostępne w Internecie.

Administracja i zarządzanie

Składowanie

Metadane mogą być przechowywane wewnętrznie , w tym samym pliku lub strukturze co dane (jest to również nazywane osadzonymi metadanymi ) lub zewnętrznie , w oddzielnym pliku lub polu od opisanych danych. Repozytorium danych zazwyczaj przechowuje metadane odłączone od danych, ale można je zaprojektować tak, aby obsługiwały podejścia z osadzonymi metadanymi. Każda opcja ma zalety i wady:

  • Pamięć wewnętrzna oznacza, że ​​metadane zawsze podróżują jako część danych, które opisują; w związku z tym metadane są zawsze dostępne wraz z danymi i można nimi manipulować lokalnie. Ta metoda tworzy nadmiarowość (wyklucza normalizację) i nie pozwala na zarządzanie wszystkimi metadanymi systemu w jednym miejscu. Prawdopodobnie zwiększa to spójność, ponieważ metadane są łatwo zmieniane za każdym razem, gdy zmieniają się dane.
  • Pamięć zewnętrzna umożliwia kolokację metadanych dla całej zawartości, na przykład w bazie danych, w celu bardziej wydajnego wyszukiwania i zarządzania. Nadmiarowości można uniknąć, normalizując organizację metadanych. W tym podejściu metadane mogą być połączone z treścią podczas przesyłania informacji, na przykład w mediach strumieniowych ; lub można się do nich odwoływać (na przykład jako łącze internetowe) z przesyłanej treści. Z drugiej strony, podział metadanych od zawartości danych, zwłaszcza w samodzielnych plikach, które odwołują się do swoich metadanych źródłowych w innym miejscu, zwiększa ryzyko rozbieżności między nimi, ponieważ zmiany w jednym z nich mogą nie być odzwierciedlone w drugim.

Metadane mogą być przechowywane w postaci czytelnej dla człowieka lub w postaci binarnej. Przechowywanie metadanych w formacie czytelnym dla człowieka, takim jak XML, może być przydatne, ponieważ użytkownicy mogą je zrozumieć i edytować bez specjalistycznych narzędzi. Jednak formaty tekstowe rzadko są optymalizowane pod kątem pojemności pamięci, czasu komunikacji lub szybkości przetwarzania. Format metadanych binarnych zapewnia wydajność we wszystkich tych aspektach, ale wymaga specjalnego oprogramowania do konwersji informacji binarnych na treść czytelną dla człowieka.

Zarządzania bazami danych

Każdy system relacyjnych baz danych posiada własne mechanizmy przechowywania metadanych. Przykłady metadanych relacyjnych baz danych obejmują:

  • Tabele wszystkich tabel w bazie danych, ich nazwy, rozmiary i liczba wierszy w każdej tabeli.
  • Tabele kolumn w każdej bazie danych, w jakich tabelach są używane oraz typ danych przechowywanych w każdej kolumnie.

W terminologii baz danych ten zestaw metadanych jest określany jako katalog . Standard SQL określa jednolity sposób dostępu do katalogu, zwany schematem informacyjnym , ale nie wszystkie bazy danych go implementują, nawet jeśli implementują inne aspekty standardu SQL. Aby zapoznać się z przykładem metod dostępu do metadanych specyficznych dla bazy danych, zobacz Metadane Oracle . Programistyczny dostęp do metadanych jest możliwy za pomocą interfejsów API, takich jak JDBC lub SchemaCrawler.

W kulturze popularnej

Jednym z pierwszych satyrycznych badań koncepcji metadanych w dzisiejszym rozumieniu jest opowiadanie Hala Drapera, autora amerykańskiego Science Fiction , MS Fnd in a Lbry (1961). Tutaj wiedza całej ludzkości jest skondensowana w obiekcie wielkości szuflady biurka, jednak ogrom metadanych (np. katalog katalogów…, a także indeksów i historii) ostatecznie prowadzi do tragicznych, ale humorystycznych konsekwencji dla rasa ludzka. Opowieść ta zapowiada współczesne konsekwencje pozwolenia, by metadane stały się ważniejsze niż rzeczywiste dane, których dotyczą, oraz ryzyko nieodłącznie związane z taką ewentualnością jako opowieść ostrzegawcza.

Zobacz też

Bibliografia

Dalsza lektura

  • Gartnera, Richarda. 2016. Metadane: kształtowanie wiedzy od starożytności do sieci semantycznej . Skoczek. ISBN  9783319408910 .
  • Zeng, Marcia i Qin, Jian. 2016. Metadane . Aspekt. ISBN  9781783300525 .

Zewnętrzne linki