Michael Stonebraker - Michael Stonebraker

Michael Stonebraker
Michael Stonebraker P1120062.jpg
Michael Stonebraker wygłasza wykład Turinga 2015
Urodzić się ( 1943.10.11 )11 października 1943 (wiek 78)
Alma Mater Uniwersytet Princeton ,
Uniwersytet Michigan
Znany z Ingres , Postgres , Vertica , Streambase , Illustra , VoltDB , SciDB
Małżonkowie Beth
Nagrody Medal IEEE Johna von Neumanna (2005)
Nagroda ACM Turinga (2014)
Kariera naukowa
Pola Informatyka
Instytucje University of California, Berkeley ,
University of Michigan ,
Massachusetts Institute of Technology
Praca dyplomowa Redukcja wielkoskalowych modeli Markowa dla łańcuchów losowych
Doradca doktorski Łuk Waugh Naylor
Znani studenci Diane Greene
Joseph M. Hellerstein
Clifford A. Lynch
Margo Seltzer
Dale Skeen
Marti Hearst
Strona internetowa csail .mit .edu /użytkownik /1547

Michael Ralph Stonebraker (ur. 11 października 1943) jest informatykiem specjalizującym się w badaniach baz danych. Dzięki serii akademickich prototypów i komercyjnych start-upów badania i produkty Stonebraker mają kluczowe znaczenie dla wielu relacyjnych systemów baz danych . Jest także założycielem wielu firm bazodanowych, w tym Ingres Corporation , Illustra , Paradigm4, StreamBase Systems , Tamr , Vertica i VoltDB , oraz pełnił funkcję dyrektora technicznego firmy Informix . Jest także redaktorem książki Readings in Database Systems .

Karierę Stonebrakera można ogólnie podzielić na dwie fazy: jego czas na Uniwersytecie Kalifornijskim w Berkeley, kiedy koncentrował się na systemach zarządzania relacyjnymi bazami danych, takimi jak Ingres i Postgres , oraz w Massachusetts Institute of Technology (MIT), gdzie opracował bardziej nowatorskie techniki zarządzania danymi, takie jak jako C-Store , H-Store i SciDB . Najważniejsze nagrody to nagroda Turinga z 2014 r. , często określana jako „Nagroda Nobla w dziedzinie informatyki”. Stonebraker jest obecnie emerytowanym profesorem na UC Berkeley i adiunktem w Laboratorium Informatyki i Sztucznej Inteligencji MIT .

Życie

Stonebraker dorastał w Milton, New Hampshire . Uzyskał tytuł BSE w dziedzinie elektrotechniki na Uniwersytecie Princeton w 1965 roku oraz tytuł magistra i doktora. z University of Michigan odpowiednio w 1967 i 1971 roku. Jego nagrody obejmują IEEE John von Neumann Medal oraz pierwszą nagrodę SIGMOD Edgara F. Codda Innovations Award. W 1994 został wprowadzony na stanowisko Fellow of the Association for Computing Machinery . W 1997 roku został wybrany członkiem Narodowej Akademii Inżynierii ds. rozwoju i komercjalizacji relacyjnych i obiektowo-relacyjnych systemów baz danych. W marcu 2015 ogłoszono, że zdobył nagrodę ACM Turing Award 2014 . We wrześniu 2015 roku zdobył nagrodę Commonwealth Award 2015, wybraną przez członków rady MassTLC.

Lata Berkeley (1971-2000)

Stonebraker dołączył do University of California w Berkeley jako adiunkt w 1971 roku i przez dwadzieścia dziewięć lat wykładał na wydziale informatyki. To tam wykonał swoją wczesną pionierską pracę nad relacyjnymi bazami danych.

Ingres

W 1973 roku Stonebraker i jego kolega Eugene Wong rozpoczęli badania nad relacyjnymi systemami baz danych po przeczytaniu serii przełomowych artykułów opublikowanych przez Edgara F. Codda na temat relacyjnego modelu danych .

Ich projekt, znany jako Ingres (Interactive Graphics and Retrieval System), był jednym z pierwszych systemów (obok Systemu R firmy IBM ), który pokazał, że można zbudować praktyczną i wydajną implementację modelu relacyjnego. Szereg kluczowych pomysłów INGRES jest nadal szeroko stosowanych w systemach relacyjnych, w tym wykorzystanie B-drzewa , replikacja kopii pierwotnej, podejście do przepisywania zapytań do widoków i ograniczeń integralności oraz idea reguł/wyzwalaczy do sprawdzania integralności w RDBMS. Ponadto wykonano wiele prac eksperymentalnych, które zapewniły wgląd w to, jak zbudować system blokujący, który mógłby zapewnić satysfakcjonującą wydajność transakcji.

W połowie lat 70. zespół Stonebrakera stworzył, korzystając z rotacyjnego zespołu studentów-programistów, użyteczny system relacyjnej bazy danych. W tamtym czasie Ingres był uważany za „low-end” w porównaniu do IBM System R, ponieważ działał na maszynach Digital Equipment Corporation opartych na systemie Unix , w przeciwieństwie do „ wielkichkomputerów mainframe IBM .

Jednak na początku lat osiemdziesiątych wydajność i możliwości tych maszyn z niższej półki poważnie zagrażały rynkowi komputerów mainframe IBM, a wraz z zagrożeniem pojawiła się zdolność Ingresa do stania się realnym, „prawdziwym” produktem dla dużej liczby aplikacji. Ingres użył odmiany licencji BSD za symboliczną opłatą i wkrótce wiele firm wykorzystało to do stworzenia komercyjnych wersji Ingresa.

Należą do nich Stonebraker, który wraz z innymi profesorami z Berkeley Larrym Rowe i Eugene Wong pomógł założyć Relational Technology, Inc. , później nazwaną Ingres Corporation. Następnie sprzedany Computer Associates , Ingres został ponownie utworzony jako niezależna firma w 2005 roku, a później przemianowany na Actian . Inne startupy oparte na Ingres to Sybase , założony przez Roberta Epsteina, studenta projektu, oraz Britton Lee, Inc. Kod Sybase został później wykorzystany jako podstawa dla Microsoft SQL Server .

Postgres

Po założeniu Relational Technology, Stonebraker i Rowe rozpoczęli starania „post-Ingres”, aby zająć się ograniczeniami modelu relacyjnego. Nowy projekt został nazwany POSTGRES (POST inGRES) i został zaprojektowany w celu dodania obsługi złożonych typów danych do systemów baz danych oraz poprawy kompleksowej wydajności aplikacji intensywnie korzystających z danych. Postgres dostarczył obiektowy model programowania relacyjnego, w którym pola mogą być złożonymi typami danych, a użytkownicy mogą rejestrować nowe typy, a także funkcje skalarne i agregujące dla tych typów. POSTGRES można było rozszerzać na wiele innych sposobów, ułatwiając programistom modyfikowanie lub dodawanie do optymalizatora, języka zapytań, środowiska wykonawczego i struktur indeksowania. Funkcje te poprawiły zarówno programowalność, jak i wydajność bazy danych, a także umożliwiły umieszczanie w bazie danych dużej części wielu aplikacji, w tym systemów informacji geograficznej i przetwarzania szeregów czasowych . Spowodowało to znaczne poszerzenie rynku komercyjnych baz danych.

POSTGRES został również oferowane przy użyciu licencji BSD, a kod stanowi podstawę dzisiejszej wolnego oprogramowania , PostgreSQL . Stonebraker doprowadził również do komercjalizacji kodu, tworząc program Illustra, który został zakupiony przez Informix . PostgreSQL był używany jako podstawa dla wielu innych firm rozpoczynających działalność, w tym Aster Data Systems , EnterpriseDB i Greenplum .

Informix nabył firmę Illustra w 1996 roku, a Stonebraker został dyrektorem technicznym firmy Informix, którą piastował do września 2000 roku. Firma Informix zintegrowała mapowanie O-R i moduły DataBlade firmy Illustra z produktem 7.x OnLine, w wyniku czego powstał Informix Universal Server (IUS) lub bardziej ogólnie, Wersja 9.

Mariposa i Cohera

Po projekcie Postgres, Stonebraker zainicjował projekt Mariposa, który stał się podstawą Cohera Corporation. Mariposa zbudowała sfederowaną bazę danych w oparciu o ekonomiczny model handlu zasobami, w którym dane rozproszone w wielu organizacjach mogą być integrowane i przeszukiwane z jednego relacyjnego interfejsu, zarządzanego przez polityki specyficzne dla lokalizacji, które pobierały opłaty za przetwarzanie i przechowywanie danych. Te polityki ekonomiczne umożliwiły realizację tradycyjnych pomysłów dotyczących optymalizacji zapytań w konkurencyjnych witrynach, a także posłużyły jako podstawa przechowywania, replikacji i przenoszenia danych w ramach federacji.

Początkową misją Cohery była komercjalizacja Mariposa, ale ostatecznie skoncentrowała się na aplikacji do zarządzania katalogami między firmami na głównym sfederowanym silniku integracji danych. Własność intelektualna firmy Cohera została zakupiona przez firmę PeopleSoft w 2001 r. i wykorzystana jako podstawa zarządzania katalogiem przedsiębiorstw firmy PeopleSoft. PeopleSoft został z kolei kupiony przez Oracle Corporation w 2004 roku.

Lata MIT (2001-obecnie)

Stonebraker został adiunktem na MIT w 2001 roku, gdzie rozpoczął kolejną serię projektów badawczych i założył szereg firm.

Aurora i StreamBase

W projekcie Aurora Stonebraker wraz z kolegami z Brandeis University , Brown University i MIT skupił się na zarządzaniu danymi do przesyłania strumieniowego danych przy użyciu nowego modelu danych i języka zapytań. W przeciwieństwie do systemów relacyjnych, które „wyciągają” dane i przetwarzają je po jednym rekordzie, w Aurorze dane są „wypychane”, przychodzące asynchronicznie z zewnętrznych źródeł danych (takich jak notowania giełdowe, kanały informacyjne lub czujniki). strumień wyników (takich jak średnie okienkowe), które są wysyłane do użytkowników.

Firma Stonebraker była współzałożycielem StreamBase Systems w 2003 roku, aby skomercjalizować technologię stojącą za Aurora.

C-Store i Vertica

W projekcie C-Store , rozpoczętym w 2005 roku, Stonebraker wraz z kolegami z Brandeis, Brown, MIT i University of Massachusetts w Bostonie opracowali równoległy, zorientowany na kolumny DBMS zorientowany na współdzielone nici dla hurtowni danych. Dzieląc i przechowując dane w kolumnach, C-Store jest w stanie wykonać mniej operacji we/wy i uzyskać lepsze współczynniki kompresji niż konwencjonalne systemy baz danych, które przechowują dane w wierszach.

Stonebraker wyjaśnił, że dzieje się tak, ponieważ podobne elementy danych są obok siebie: imię i nazwisko, imię i nazwisko, imię i nazwisko, adres, kod pocztowy, numer telefonu. W 2005 roku Stonebraker współzałożył firmę Vertica, aby skomercjalizować technologię stojącą za C-Store.

Morfeusz i Babka

W 2006 roku Stonebraker wraz z naukowcami z University of Florida rozpoczął projekt Morpheus. Morpheus to system integracji danych , który opiera się na zbiorze „transformacji” pośredniczących między źródłami danych. Każda transformacja zapewnia interfejs z możliwością wysyłania zapytań do określonej witryny internetowej lub usługi, a Morpheus umożliwia wyszukiwanie i tworzenie wielu transformacji w celu zapewnienia nowej usługi lub ujednoliconego widoku kilku usług.

W 2009 r. Stonebraker założył Goby, lokalną firmę wyszukiwawczą opartą na pomysłach Morpheusa, aby ludzie mogli odkrywać nowe rzeczy do zrobienia w czasie wolnym.

H-Store i VoltDB

W 2007 roku, wraz z naukowcami z Brown University , MIT i Yale University , Stonebraker rozpoczął projekt H-Store . H-Store to rozproszony system przetwarzania transakcji online (OLTP) w pamięci głównej , zaprojektowany w celu zapewnienia bardzo wysokiej przepustowości przy obciążeniach przetwarzania transakcji.

W 2009 roku Stonebraker był współzałożycielem, a następnie doradcą VoltDB, komercyjnego startupu opartego na pomysłach z projektu H-Store.

SciDB

W 2008 roku wraz z Davidem DeWitt i badaczami z Brown, MIT, Portland State University , SLAC , University of Washington oraz University of Wisconsin-Madison , Stonebraker uruchomił SciDB DBMS o otwartym kodzie źródłowym, specjalnie zaprojektowany do zastosowań naukowych.

Założył Paradigm4 z Marilyn Matz, która została dyrektorem generalnym. Paradigm4 opracował SciDB, używany głównie przez nauki przyrodnicze i rynki finansowe. Novartis , Foundation Medicine i National Institutes of Health to niektórzy z klientów firmy.

NoSQL

W 2010 i 2011 roku Stonebraker skrytykował ruch NoSQL .

Studenci

Stonebraker przeszkolił ponad 30 uczniów, w tym:

  • Daniel Abadi, współzałożyciel Hadapt (przejęty przez Teradata )
  • Michael J. Carey (wydział na UC Irvine, wcześniej w U. Wisconsin Madison, członek NAE i członek ACM)
  • Robert Epstein (założyciel i były wiceprezes inżynierii Sybase )
  • Diane Greene (współzałożycielka i były dyrektor generalny VMWare )
  • Paula Hawthorn (założycielka Britton-Lee, wcześniej wiceprezes ds. inżynierii Informix )
  • Marti Hearst , profesor na Uniwersytecie Kalifornijskim w Berkeley
  • Gerald Held (były wiceprezes ds. inżynierii Oracle )
  • Joseph M. Hellerstein (wydział na UC Berkeley)
  • Anant Jhingran (VP i CTO w dziale zarządzania informacjami IBM )
  • Curt Kolovson (starszy inżynier ds. personelu w VMware )
  • Clifford A. Lynch (dyrektor wykonawczy Koalicji Informacji Sieciowej )
  • John Newton, założyciel Documentum i Alfresco
  • Mike Olson (były CEO Sleepycat Software i założyciel CEO Cloudera )
  • Margo Seltzer (profesor informatyki na Uniwersytecie Kolumbii Brytyjskiej, założyciel i były dyrektor techniczny firmy Sleepycat Software )
  • Dale Skeen , założyciel Tibco , założyciel i dyrektor generalny Vitria
  • Sunita Sarawagi, profesor IIT Bombay
  • Anupam Bhide, założyciel i dyrektor generalny Calsoft

Wybrane prace

  • Józefa M. Hellersteina ; Michael Stonebraker (2015). Odczyty w systemach baz danych (wyd. 5). MIT Naciśnij.
  • Michaela Stonebrakera; Randy Katz , David Patterson , John Ousterhout (1988). „PROJEKT XPRS” (PDF) . VLDB : 318–330 . Źródło 25 marca 2015 .CS1 maint: wiele nazwisk: lista autorów ( link )

Bibliografia

Zewnętrzne linki