Pytania otagowane jako data-warehouse

System baz danych zoptymalizowany pod kątem raportowania, zwłaszcza zbiorczego. Często, ale nie zawsze, implementowane przy użyciu schematu gwiazdy.



3
Klastry indeksów magazynu kolumn i klucze obce
Strojenie wydajności hurtowni danych za pomocą indeksów. Jestem dość nowy w SQL Server 2014. Microsoft opisuje następujące kwestie: „Uważamy indeks klastrowanego magazynu kolumn za standard do przechowywania tabel faktów hurtowni dużych danych i oczekujemy, że będzie on używany w większości scenariuszy hurtowni danych. Ponieważ indeks klastrowanego magazynu kolumn jest aktualizowalny, …

1
Strategie zapytań przy użyciu tabel czasowych z wersją systemową SQL Server 2016 dla wolno zmieniających się wymiarów
W przypadku korzystania z tabeli czasowej z wersją systemową (nowość w SQL Server 2016), jakie są skutki tworzenia zapytań i wydajności, gdy ta funkcja jest używana do obsługi powolnej zmiany wymiarów w dużej relacyjnej hurtowni danych? Załóżmy na przykład, że mam Customerwymiar 100 000 wierszy z Postal Codekolumną i Salestabelę …


3
Porównaj dwie podobne bazy danych Postgres pod kątem różnic
Od czasu do czasu pobieram publicznie dostępne zestawy danych w postaci dB Postgres. Te zestawy danych są z czasem aktualizowane / modyfikowane / rozszerzane przez host repozytorium. Czy istnieje polecenie lub narzędzie Postgres (najlepiej FOSS), które może pokazywać różnice między STARYM a NOWYM bazą danych Postgres? (Założeniem roboczym jest, że …

2
Alternatywa dla EAV dla pól dynamicznych w hurtowni danych w schemacie gwiazdy
Potrzebuję obsługiwać dynamiczne pola i wartości w dużej przechowalni danych do przechowywania dziennika żądań API, moim przypadkiem użytkownika jest to, że muszę przechowywać wszystkie ciągi zapytań API i móc wykonywać zapytania przeciwko nim w przyszłości (więc nie jest to tylko przechowywanie, więc nie mogę używać dla nich obiektów blob) na …

2
ETL: wyodrębnianie z 200 tabel - przepływ danych SSIS czy niestandardowy T-SQL?
Na podstawie mojej analizy kompletny model wymiarowy dla naszej hurtowni danych będzie wymagał ekstrakcji z ponad 200 tabel źródłowych. Niektóre z tych tabel zostaną wyodrębnione w ramach obciążenia przyrostowego, a inne będą obciążeniem pełnym. Należy zauważyć, że mamy około 225 źródłowych baz danych o tym samym schemacie. Z tego, co …

1
Czy powinienem wyłączyć „statystyki automatycznych aktualizacji” w scenariuszu hurtowni danych?
Mam 200 GB hurtowni danych w SQL Server. Występują naprawdę powolne czasy wykonywania niektórych zapytań; na przykład 12 godzin na proste deletezapytanie z inner join. Po przeprowadzeniu badań z planami wykonania zaktualizowałem statystyki 2 tabel biorących udział w zapytaniu, korzystając z tej WITH FULLSCANopcji. Zapytanie jest teraz wykonywane w mniej …

2
Obsługa stref czasowych w hurtowni danych
Zaczynamy projektować elementy składowe hurtowni danych i musimy być w stanie obsługiwać wszystkie strefy czasowe (nasi klienci pochodzą z całego świata). Po przeczytaniu dyskusji online (i książek) powszechnym rozwiązaniem wydaje się mieć osobny wymiar daty i godziny oraz znacznik czasu w tabelach faktów. Jednak pytanie, na które trudno mi odpowiedzieć, …

2
Czy kompresja danych programu SQL Server jest kategorycznie dobra w przypadku baz danych tylko do odczytu?
Część literatury na temat kompresji danych SQL Server, którą czytam, stwierdza, że ​​koszt zapisu wzrasta około czterokrotnie, co byłoby normalnie wymagane. Wydaje się również sugerować, że jest to główny minus kompresji danych, silnie sugerując, że w przypadku bazy danych archiwum tylko do odczytu wydajność (z kilkoma wyjątkami) poprawi się dzięki …

2
PostgreSQL dla transakcji o dużym wolumenie i hurtowni danych
Jestem całkiem nowy w PostgreSQL, nigdy wcześniej nie przeprowadzałem dużego wdrożenia, używając go. Ale mam duże doświadczenie w rozwiązaniach dla przedsiębiorstw i chcę spróbować zastosować część tego, czego się nauczyłem, korzystając z PostgreSQL. Mam witrynę dostosowaną do obsługi dużej liczby danych i ruchu. Infrastruktura zostanie zbudowana z wykorzystaniem Amazon (AWS) …

1
Ogranicz stopień równoległości (DOP) dostępnej dla dowolnego zapytania
Na Oracle Exadata (11gR2) mamy stosunkowo rozbudowaną bazę danych. cpu_count to 24 równoległe_serwery_instancji to 2 parallel_threads_per_cpu to 2 Zauważyliśmy, obserwując w Oracle Enterprise Manager (OEM), że wydajność była okropna z powodu seryjnego wykonywania zapytań. Aby rozwiązać ten problem, wszystkie tabele, zmaterializowane widoki i indeksy zostały zmienione, aby wykorzystać równoległość. na …

2
Projekt hurtowni danych do raportowania z danymi dla wielu stref czasowych
Staramy się zoptymalizować projekt hurtowni danych, który będzie obsługiwał raportowanie danych w wielu strefach czasowych. Na przykład, możemy mieć raport dotyczący aktywności z miesiąca (miliony wierszy), która musi pokazywać aktywność pogrupowaną według pory dnia. I oczywiście ta godzina dnia musi być godziną „lokalną” dla danej strefy czasowej. Mieliśmy projekt, który …


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.