Odpowiedzi:
Sprawdź to, aby uzyskać więcej informacji.
Z poprzedniego linku:
Baza danych
Hurtownia danych
Należy również zauważyć, że hurtownie danych mogą pochodzić od zera do wielu baz danych.
Z widoku nietechnicznego: baza danych jest ograniczona do określonej aplikacji lub zestawu aplikacji.
Hurtownia danych to repozytorium danych na poziomie przedsiębiorstwa. Będzie zawierał dane ze wszystkich / wielu segmentów biznesu. Zamierza udostępnić te informacje, aby zapewnić globalny obraz firmy. Kluczowe znaczenie ma również integracja między różnymi segmentami działalności.
Z technicznego punktu widzenia: Słowu „hurtownia danych” nie podano żadnej uznanej definicji. Osobiście definiuję hurtownię danych jako zbiór magazynów danych. Każda zbiorcza baza danych składa się z co najmniej jednej bazy danych, przy czym baza danych jest specyficzna dla określonego zestawu problemów (aplikacji, zestawu danych lub procesu).
Mówiąc najprościej, baza danych jest składnikiem hurtowni danych. Jest wiele miejsc, w których można zgłębić tę koncepcję, ale ponieważ nie ma żadnej „definicji”, każda odpowiedź będzie wyzwaniem.
Hurtownia danych to TYP bazy danych.
Oprócz tego, co ludzie już powiedzieli, hurtownie danych są zwykle OLAP, z indeksami itp. Dostrojonymi do odczytu, a nie do zapisu, a dane są znormalizowane / przekształcane w formy, które są łatwiejsze do odczytania i analizy.
Niektórzy twierdzą, że „bazy danych” to to samo, co OLTP - to nieprawda. OLTP znowu jest TYPEM bazy danych.
Inne typy „baz danych”: pliki tekstowe, XML, Excel, CSV ..., płaskie pliki :-)
It is a logical subset of Data warehouse, generally based upon business functions.
Najprostszym sposobem wyjaśnienia tego byłoby stwierdzenie, że hurtownia danych składa się z czegoś więcej niż tylko bazy danych. Baza danych to zbiór danych zorganizowanych w jakiś sposób, ale hurtownia danych jest zorganizowana specjalnie w celu „ułatwienia raportowania i analizy”. To jednak nie wszystko, ponieważ hurtownie danych obejmują również „środki do pobierania i analizowania danych, do wyodrębniania, przekształcania i ładowania danych, a także do zarządzania słownikiem danych, które są również uważane za podstawowe elementy systemu hurtowni danych”.
DataBase : - OLTP (proces transakcji online)
Magazyn danych
Hurtownia danych a baza danych: hurtownia danych jest specjalnie zaprojektowana do analizy danych, która obejmuje odczytywanie dużych ilości danych w celu zrozumienia relacji i trendów w danych. Baza danych służy do przechwytywania i przechowywania danych, takich jak rejestrowanie szczegółów transakcji.
Hurtownia danych: odpowiednie obciążenia - analityka, raportowanie, duże zbiory danych. Źródło danych - dane zebrane i znormalizowane z wielu źródeł. Przechwytywanie danych - operacje zapisu zbiorczego zwykle według wcześniej określonego harmonogramu wsadowego. Normalizacja danych - zdenormalizowane schematy, takie jak schemat gwiaździsty lub schemat płatka śniegu. Przechowywanie danych - zoptymalizowane pod kątem prostoty dostępu i szybkich zapytań. wydajność przy użyciu kolumnowej pamięci masowej. Dostęp do danych - zoptymalizowany pod kątem minimalizacji operacji we / wy i maksymalizacji przepustowości danych.
Baza danych transakcyjnych: Odpowiednie obciążenia - Przetwarzanie transakcji. Źródło danych - dane przechwycone w niezmienionej postaci z jednego źródła, takiego jak system transakcyjny. Przechwytywanie danych - zoptymalizowany pod kątem ciągłych operacji zapisu, ponieważ dostępne są nowe dane, aby zmaksymalizować przepustowość transakcji. Normalizacja danych - wysoce znormalizowane schematy statyczne. Przechowywanie danych - zoptymalizowane pod kątem dużych operacji zapisu w pojedynczym bloku fizycznym zorientowanym na wiersz. Dostęp do danych - duża liczba małych operacji odczytu.
Każde miejsce przechowywania danych aplikacji zazwyczaj korzysta z bazy danych. Może to być relacyjna baza danych lub brak baz danych sql, które obecnie zyskują na popularności.
Hurtownia danych to także baza danych. Bazę danych hurtowni możemy nazwać wyspecjalizowanym magazynem danych do celów raportowania analitycznego firmy. Te dane są wykorzystywane do podejmowania kluczowych decyzji biznesowych.
Zorganizowane dane pomagają skutecznie raportować i podejmować decyzje biznesowe.
Baza danych:
Używany do przetwarzania transakcyjnego online (OLTP).
Hurtownia danych:
Używany do przetwarzania analitycznego online (OLAP).
Hurtownia danych (DW) to proces gromadzenia danych z różnych źródeł i zarządzania nimi w celu zapewnienia znaczących spostrzeżeń biznesowych. Hurtownia danych jest zwykle używana do łączenia i analizowania danych biznesowych z heterogenicznych źródeł. Hurtownia danych jest rdzeniem systemu BI, który służy do analizy danych i raportowania.
Źródłem hurtowni danych może być klaster baz danych, ponieważ bazy danych są wykorzystywane do prowadzenia transakcji online, np. Do przechowywania bieżących rekordów, ale w hurtowni danych przechowuje dane historyczne, które są przeznaczone do procesu analitycznego online.
Hurtownia danych to rodzaj struktury danych zwykle umieszczonej w bazie danych. Hurtownia Danych odsyła model danych i rodzaj danych w nim przechowywanych - dane, które są modelowane (model danych) do serwera w celu analitycznym.
Bazę danych można sklasyfikować jako dowolną strukturę, w której znajdują się dane. Tradycyjnie byłby to RDBMS, taki jak Oracle, SQL Server lub MySQL. Jednak baza danych może być również bazą danych NoSQL, taką jak Apache Cassandra, lub kolumnowym MPP, takim jak AWS RedShift.
Widzisz, baza danych to po prostu miejsce do przechowywania danych; Hurtownia danych to specyficzny sposób przechowywania danych i służy określonemu celowi, jakim jest obsługa zapytań analitycznych.
OLTP vs OLAP nie informuje o różnicy między DW a bazą danych, zarówno OLTP, jak i OLAP znajdują się w bazach danych. Po prostu przechowują dane w inny sposób (różne metodologie modeli danych) i służą różnym celom (OLTP - zapis transakcji, zoptymalizowany pod kątem aktualizacji; OLAP - analizuje informacje, zoptymalizowany pod kątem odczytów).
Zobacz w prostych słowach: Dataware -> Ogromne użycie danych do celów analitycznych / przechowywania / kopiowania i analizy. Baza danych -> Operacja CRUD z często używanymi danymi.
Magazyn danych jest rodzajem przechowywania, którego nie używasz na co dzień, a baza danych jest czymś, czym często zajmujesz się.
Na przykład. Jeśli pytamy o wyciąg z banku to daje nam to za ostatnie 3/4/6 / więcej miesięcy bcoz jest w bazie danych. Jeśli chcesz czegoś więcej, to przechowuje w Dataware House.
Przykład: Dom jest wart $100,000
i zyskuje na wartości $1000
rocznie.
Aby śledzić bieżącą wartość domu, należy użyć bazy danych, ponieważ wartość zmienia się co roku.
Trzy lata później będziesz mógł zobaczyć wartość domu, który jest $103,000.
Aby śledzić historyczną wartość domu, należy użyć hurtowni danych, tak jak powinna to być wartość domu
$100,000 on year 0,
$101,000 on year 1,
$102,000 on year 2,
$103,000 on year 3.