Jaka jest różnica między bazą danych a hurtownią danych?


163

Jaka jest różnica między bazą danych a hurtownią danych?

Czy nie są tym samym, a przynajmniej napisanym w tym samym (np. Oracle RDBMS)?

Odpowiedzi:


147

Sprawdź to, aby uzyskać więcej informacji.

Z poprzedniego linku:

Baza danych

  1. Używany do przetwarzania transakcyjnego online ( OLTP ), ale może być używany do innych celów, takich jak hurtownia danych. To rejestruje dane od użytkownika w historii.
  2. Tabele i łączenia są złożone, ponieważ są znormalizowane (dla RDMS ). Ma to na celu zmniejszenie liczby zbędnych danych i zaoszczędzenie miejsca w pamięci.
  3. Encja - techniki modelowania relacyjnego są używane do projektowania baz danych RDMS.
  4. Zoptymalizowany do operacji zapisu.
  5. Wydajność zapytań analitycznych jest niska.

Hurtownia danych

  1. Używany do przetwarzania analitycznego online ( OLAP ). Odczytuje dane historyczne dla użytkowników w celu podjęcia decyzji biznesowych.
  2. Tabele i łączenia są proste, ponieważ zostały zdenormalizowane. Ma to na celu skrócenie czasu odpowiedzi na zapytania analityczne.
  3. Dane - techniki modelowania są używane do projektowania hurtowni danych.
  4. Zoptymalizowany pod kątem operacji odczytu.
  5. Wysoka wydajność w przypadku zapytań analitycznych.
  6. Jest zazwyczaj bazy danych.

Należy również zauważyć, że hurtownie danych mogą pochodzić od zera do wielu baz danych.


3
Modelowanie danych to termin ogólny, który nie dotyczy tylko hurtowni danych. (Być może w drugim # 3 mieli na myśli „modelowanie wymiarowe”, ponieważ z mojego doświadczenia wynika, że ​​jest to najpopularniejszy sposób ich budowania.) Ostatnia linijka nie ma sensu: w jaki sposób hurtownia danych „zawiera” bazę danych? Mogę powiedzieć, że hurtownia danych jest pobierana od 0 do wielu baz danych (OLTP).
Patrick Marchand,

2
@Mark - gdzie jest napisane, że bazy danych są TYLKO dla OLTP? Pokazuje, jak bazy danych odnoszą się do hurtowni danych.
TheCloudlessSky

5
@Nickolay - to odpowiedź sprzed dwóch lat. Edytuj go i napraw, jeśli masz wątpliwości.
TheCloudlessSky

1
@DataMan - oznacz to jako poprawną odpowiedź. to całkiem dobra i uczciwa odpowiedź na twoje pytanie.
sanzy

1
jaka jest różnica między technikami modelowania danych a technikami modelowania encji - relacyjne?
QAIS,

32

Z widoku nietechnicznego: baza danych jest ograniczona do określonej aplikacji lub zestawu aplikacji.

Hurtownia danych to repozytorium danych na poziomie przedsiębiorstwa. Będzie zawierał dane ze wszystkich / wielu segmentów biznesu. Zamierza udostępnić te informacje, aby zapewnić globalny obraz firmy. Kluczowe znaczenie ma również integracja między różnymi segmentami działalności.

Z technicznego punktu widzenia: Słowu „hurtownia danych” nie podano żadnej uznanej definicji. Osobiście definiuję hurtownię danych jako zbiór magazynów danych. Każda zbiorcza baza danych składa się z co najmniej jednej bazy danych, przy czym baza danych jest specyficzna dla określonego zestawu problemów (aplikacji, zestawu danych lub procesu).

Mówiąc najprościej, baza danych jest składnikiem hurtowni danych. Jest wiele miejsc, w których można zgłębić tę koncepcję, ale ponieważ nie ma żadnej „definicji”, każda odpowiedź będzie wyzwaniem.


Datamart jest najlepiej bazą danych OLTP?
CᴴᴀZ

@ CᴴᴀZ po co? Datamart są tworzone dla OLAP, Datamart to w zasadzie mały DWH (dla małej części firmy). jest on tworzony do analizy, więc jeśli potrzebujesz systemu OLTP, Datamart nie jest twoim wyborem, jeśli potrzebujesz modelu danych do analizy (schemat początkowy lub przepływ śniegu), wolałbyś Datamart.
Enrique Benito Casado,

Hej @Enrique, rozumiem: Datamart wnosi wkład w OLAP. Wziąłem stąd wskazówkę, że Datamarts jest OLTP - SQL Server OLTP Datamart .
CᴴᴀZ

Cześć @ CᴴᴀZ, przeczytałem artykuł i byłby to tylko sposób na wykonanie OLTP z Datamart. dobrze . (ale myślę, że powiedzieli to jak wyjątek) Weź pod uwagę, jak mówią, tabele OLTP muszą być znormalizowane, aby nie miały niespójności. normalizacja nie jest tak skomplikowana w schemacie ER, ale jest o wiele bardziej skomplikowana w przypadku schematu gwiezdnego lub przepływu śniegu. Schematy te mają na celu ułatwienie odczytu w bazie danych, a nie operacje transakcyjne. Dlatego używanie Datamart, takiego jak OLTP, nie powinno być dobrym pomysłem, nawet jeśli jest możliwe.
Enrique Benito Casado,

16

Hurtownia danych to TYP bazy danych.

Oprócz tego, co ludzie już powiedzieli, hurtownie danych są zwykle OLAP, z indeksami itp. Dostrojonymi do odczytu, a nie do zapisu, a dane są znormalizowane / przekształcane w formy, które są łatwiejsze do odczytania i analizy.

Niektórzy twierdzą, że „bazy danych” to to samo, co OLTP - to nieprawda. OLTP znowu jest TYPEM bazy danych.

Inne typy „baz danych”: pliki tekstowe, XML, Excel, CSV ..., płaskie pliki :-)


1
Oto poprawna odpowiedź na wszystkie pytania. I trochę na Datamart:It is a logical subset of Data warehouse, generally based upon business functions.
CᴴᴀZ

7

Najprostszym sposobem wyjaśnienia tego byłoby stwierdzenie, że hurtownia danych składa się z czegoś więcej niż tylko bazy danych. Baza danych to zbiór danych zorganizowanych w jakiś sposób, ale hurtownia danych jest zorganizowana specjalnie w celu „ułatwienia raportowania i analizy”. To jednak nie wszystko, ponieważ hurtownie danych obejmują również „środki do pobierania i analizowania danych, do wyodrębniania, przekształcania i ładowania danych, a także do zarządzania słownikiem danych, które są również uważane za podstawowe elementy systemu hurtowni danych”.

Hurtownia danych


4

DataBase : - OLTP (proces transakcji online)

  • Są to aktualne dane, aktualne szczegółowe dane, płaskie relacyjne dane izolowane.
  • Relacja encji jest używana do projektowania bazy danych
  • Wielkość bazy danych 100 MB-GB prosta transakcja lub zapytania

Magazyn danych

  • OLAP (proces analityczny online)
  • Chodzi o dane historyczne Schemat gwiazdy, schemat wygięcia śniegu i galaktykę
  • Schemat służy do projektowania hurtowni danych
  • Rozmiar bazy danych 100 GB-TB Ulepszona podstawa wydajności zapytań dla WIZUALIZACJI DANYCH MINING
  • Umożliwia użytkownikom głębsze zrozumienie i wiedzę na temat różnych aspektów danych korporacyjnych dzięki szybkiemu, spójnemu, interaktywnemu dostępowi do szerokiej gamy możliwych widoków danych

4

Hurtownia danych a baza danych: hurtownia danych jest specjalnie zaprojektowana do analizy danych, która obejmuje odczytywanie dużych ilości danych w celu zrozumienia relacji i trendów w danych. Baza danych służy do przechwytywania i przechowywania danych, takich jak rejestrowanie szczegółów transakcji.

Hurtownia danych: odpowiednie obciążenia - analityka, raportowanie, duże zbiory danych. Źródło danych - dane zebrane i znormalizowane z wielu źródeł. Przechwytywanie danych - operacje zapisu zbiorczego zwykle według wcześniej określonego harmonogramu wsadowego. Normalizacja danych - zdenormalizowane schematy, takie jak schemat gwiaździsty lub schemat płatka śniegu. Przechowywanie danych - zoptymalizowane pod kątem prostoty dostępu i szybkich zapytań. wydajność przy użyciu kolumnowej pamięci masowej. Dostęp do danych - zoptymalizowany pod kątem minimalizacji operacji we / wy i maksymalizacji przepustowości danych.

Baza danych transakcyjnych: Odpowiednie obciążenia - Przetwarzanie transakcji. Źródło danych - dane przechwycone w niezmienionej postaci z jednego źródła, takiego jak system transakcyjny. Przechwytywanie danych - zoptymalizowany pod kątem ciągłych operacji zapisu, ponieważ dostępne są nowe dane, aby zmaksymalizować przepustowość transakcji. Normalizacja danych - wysoce znormalizowane schematy statyczne. Przechowywanie danych - zoptymalizowane pod kątem dużych operacji zapisu w pojedynczym bloku fizycznym zorientowanym na wiersz. Dostęp do danych - duża liczba małych operacji odczytu.


1

Każde miejsce przechowywania danych aplikacji zazwyczaj korzysta z bazy danych. Może to być relacyjna baza danych lub brak baz danych sql, które obecnie zyskują na popularności.

Hurtownia danych to także baza danych. Bazę danych hurtowni możemy nazwać wyspecjalizowanym magazynem danych do celów raportowania analitycznego firmy. Te dane są wykorzystywane do podejmowania kluczowych decyzji biznesowych.

Zorganizowane dane pomagają skutecznie raportować i podejmować decyzje biznesowe.


1

Baza danych:

Używany do przetwarzania transakcyjnego online (OLTP).

  • Zorientowany na transakcje.
  • Zorientowany na aplikacje.
  • Aktualne dane.
  • Szczegółowe dane.
  • Skalowalne dane.
  • Wielu użytkowników, administratorów / operacyjnych.
  • Czas realizacji: krótki.

Hurtownia danych:

Używany do przetwarzania analitycznego online (OLAP).

  • Analiza ukierunkowana.
  • Zorientowany tematycznie.
  • Dane historyczne.
  • Dane zagregowane.
  • Dane statyczne.
  • Niewielu użytkowników, kierowniku.
  • Czas realizacji: długi.

1

Hurtownia danych (DW) to proces gromadzenia danych z różnych źródeł i zarządzania nimi w celu zapewnienia znaczących spostrzeżeń biznesowych. Hurtownia danych jest zwykle używana do łączenia i analizowania danych biznesowych z heterogenicznych źródeł. Hurtownia danych jest rdzeniem systemu BI, który służy do analizy danych i raportowania.


0

Źródłem hurtowni danych może być klaster baz danych, ponieważ bazy danych są wykorzystywane do prowadzenia transakcji online, np. Do przechowywania bieżących rekordów, ale w hurtowni danych przechowuje dane historyczne, które są przeznaczone do procesu analitycznego online.


0

Hurtownia danych to rodzaj struktury danych zwykle umieszczonej w bazie danych. Hurtownia Danych odsyła model danych i rodzaj danych w nim przechowywanych - dane, które są modelowane (model danych) do serwera w celu analitycznym.

Bazę danych można sklasyfikować jako dowolną strukturę, w której znajdują się dane. Tradycyjnie byłby to RDBMS, taki jak Oracle, SQL Server lub MySQL. Jednak baza danych może być również bazą danych NoSQL, taką jak Apache Cassandra, lub kolumnowym MPP, takim jak AWS RedShift.

Widzisz, baza danych to po prostu miejsce do przechowywania danych; Hurtownia danych to specyficzny sposób przechowywania danych i służy określonemu celowi, jakim jest obsługa zapytań analitycznych.

OLTP vs OLAP nie informuje o różnicy między DW a bazą danych, zarówno OLTP, jak i OLAP znajdują się w bazach danych. Po prostu przechowują dane w inny sposób (różne metodologie modeli danych) i służą różnym celom (OLTP - zapis transakcji, zoptymalizowany pod kątem aktualizacji; OLAP - analizuje informacje, zoptymalizowany pod kątem odczytów).


-1

Zobacz w prostych słowach: Dataware -> Ogromne użycie danych do celów analitycznych / przechowywania / kopiowania i analizy. Baza danych -> Operacja CRUD z często używanymi danymi.

Magazyn danych jest rodzajem przechowywania, którego nie używasz na co dzień, a baza danych jest czymś, czym często zajmujesz się.

Na przykład. Jeśli pytamy o wyciąg z banku to daje nam to za ostatnie 3/4/6 / więcej miesięcy bcoz jest w bazie danych. Jeśli chcesz czegoś więcej, to przechowuje w Dataware House.


-1

Przykład: Dom jest wart $100,000i zyskuje na wartości $1000rocznie.

Aby śledzić bieżącą wartość domu, należy użyć bazy danych, ponieważ wartość zmienia się co roku.

Trzy lata później będziesz mógł zobaczyć wartość domu, który jest $103,000.

Aby śledzić historyczną wartość domu, należy użyć hurtowni danych, tak jak powinna to być wartość domu

$100,000 on year 0, 
$101,000 on year 1, 
$102,000 on year 2, 
$103,000 on year 3. 
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.