Administratorzy baz danych data-warehouse

5

Jakie są sposoby wdrożenia relacji wiele do wielu w hurtowni danych?

Dominujące topologie modelowania hurtowni danych (Star, Snowflake) są zaprojektowane z myślą o relacjach jeden do wielu. Czytelność, wydajność i struktura zapytań znacznie się pogarsza w obliczu relacji wiele do wielu w tych schematach modelowania. Jakie są sposoby implementacji relacji wiele do wielu między wymiarami lub między tabelą faktów a wymiarem …

25 database-design data-warehouse

3

Jakie są argumenty przemawiające za wykorzystaniem procesu ELT zamiast ETL?

Uświadomiłem sobie, że moja firma stosuje proces ELT (ekstrakcja-transformacja-ładowanie) zamiast ETL (ekstrakcja-transformacja-ładowanie). Jakie są różnice między tymi dwoma podejściami i w jakich sytuacjach jedno byłoby „lepsze” od drugiego? Byłoby wspaniale, gdybyś mógł podać kilka przykładów.

19 data-warehouse etl business-intelligence

3

Klastry indeksów magazynu kolumn i klucze obce

Strojenie wydajności hurtowni danych za pomocą indeksów. Jestem dość nowy w SQL Server 2014. Microsoft opisuje następujące kwestie: „Uważamy indeks klastrowanego magazynu kolumn za standard do przechowywania tabel faktów hurtowni dużych danych i oczekujemy, że będzie on używany w większości scenariuszy hurtowni danych. Ponieważ indeks klastrowanego magazynu kolumn jest aktualizowalny, …

18 sql-server foreign-key data-warehouse sql-server-2014 columnstore

1

Strategie zapytań przy użyciu tabel czasowych z wersją systemową SQL Server 2016 dla wolno zmieniających się wymiarów

W przypadku korzystania z tabeli czasowej z wersją systemową (nowość w SQL Server 2016), jakie są skutki tworzenia zapytań i wydajności, gdy ta funkcja jest używana do obsługi powolnej zmiany wymiarów w dużej relacyjnej hurtowni danych? Załóżmy na przykład, że mam Customerwymiar 100 000 wierszy z Postal Codekolumną i Salestabelę …

17 sql-server data-warehouse slowly-changing-dimension sql-server-2016 temporal-tables

2

Rozwiązania Business Intelligence / DWH typu open source [zamknięte]

Zamknięte. To pytanie jest nie na temat . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było ono tematem na temat wymiany stosu administratorów bazy danych. Zamknięte 5 lat temu . Zastanawiam się, czy to pytanie jeszcze nie zostało zadane. Google ma dla mnie bardzo niewiele wyników, …

16 tools data-warehouse database-agnostic business-intelligence

3

Porównaj dwie podobne bazy danych Postgres pod kątem różnic

Od czasu do czasu pobieram publicznie dostępne zestawy danych w postaci dB Postgres. Te zestawy danych są z czasem aktualizowane / modyfikowane / rozszerzane przez host repozytorium. Czy istnieje polecenie lub narzędzie Postgres (najlepiej FOSS), które może pokazywać różnice między STARYM a NOWYM bazą danych Postgres? (Założeniem roboczym jest, że …

14 postgresql data-warehouse

2

Alternatywa dla EAV dla pól dynamicznych w hurtowni danych w schemacie gwiazdy

Potrzebuję obsługiwać dynamiczne pola i wartości w dużej przechowalni danych do przechowywania dziennika żądań API, moim przypadkiem użytkownika jest to, że muszę przechowywać wszystkie ciągi zapytań API i móc wykonywać zapytania przeciwko nim w przyszłości (więc nie jest to tylko przechowywanie, więc nie mogę używać dla nich obiektów blob) na …

13 database-design data-warehouse eav star-schema redshift

2

ETL: wyodrębnianie z 200 tabel - przepływ danych SSIS czy niestandardowy T-SQL?

Na podstawie mojej analizy kompletny model wymiarowy dla naszej hurtowni danych będzie wymagał ekstrakcji z ponad 200 tabel źródłowych. Niektóre z tych tabel zostaną wyodrębnione w ramach obciążenia przyrostowego, a inne będą obciążeniem pełnym. Należy zauważyć, że mamy około 225 źródłowych baz danych o tym samym schemacie. Z tego, co …

12 sql-server sql-server-2005 ssis data-warehouse etl

1

Czy powinienem wyłączyć „statystyki automatycznych aktualizacji” w scenariuszu hurtowni danych?

Mam 200 GB hurtowni danych w SQL Server. Występują naprawdę powolne czasy wykonywania niektórych zapytań; na przykład 12 godzin na proste deletezapytanie z inner join. Po przeprowadzeniu badań z planami wykonania zaktualizowałem statystyki 2 tabel biorących udział w zapytaniu, korzystając z tej WITH FULLSCANopcji. Zapytanie jest teraz wykonywane w mniej …

12 sql-server data-warehouse statistics

2

Obsługa stref czasowych w hurtowni danych

Zaczynamy projektować elementy składowe hurtowni danych i musimy być w stanie obsługiwać wszystkie strefy czasowe (nasi klienci pochodzą z całego świata). Po przeczytaniu dyskusji online (i książek) powszechnym rozwiązaniem wydaje się mieć osobny wymiar daty i godziny oraz znacznik czasu w tabelach faktów. Jednak pytanie, na które trudno mi odpowiedzieć, …

12 sql-server-2012 data-warehouse datetime timezone

2

Czy kompresja danych programu SQL Server jest kategorycznie dobra w przypadku baz danych tylko do odczytu?

Część literatury na temat kompresji danych SQL Server, którą czytam, stwierdza, że koszt zapisu wzrasta około czterokrotnie, co byłoby normalnie wymagane. Wydaje się również sugerować, że jest to główny minus kompresji danych, silnie sugerując, że w przypadku bazy danych archiwum tylko do odczytu wydajność (z kilkoma wyjątkami) poprawi się dzięki …

11 sql-server sql-server-2012 data-warehouse compression

2

PostgreSQL dla transakcji o dużym wolumenie i hurtowni danych

Jestem całkiem nowy w PostgreSQL, nigdy wcześniej nie przeprowadzałem dużego wdrożenia, używając go. Ale mam duże doświadczenie w rozwiązaniach dla przedsiębiorstw i chcę spróbować zastosować część tego, czego się nauczyłem, korzystając z PostgreSQL. Mam witrynę dostosowaną do obsługi dużej liczby danych i ruchu. Infrastruktura zostanie zbudowana z wykorzystaniem Amazon (AWS) …

11 postgresql data-warehouse etl

1

Ogranicz stopień równoległości (DOP) dostępnej dla dowolnego zapytania

Na Oracle Exadata (11gR2) mamy stosunkowo rozbudowaną bazę danych. cpu_count to 24 równoległe_serwery_instancji to 2 parallel_threads_per_cpu to 2 Zauważyliśmy, obserwując w Oracle Enterprise Manager (OEM), że wydajność była okropna z powodu seryjnego wykonywania zapytań. Aby rozwiązać ten problem, wszystkie tabele, zmaterializowane widoki i indeksy zostały zmienione, aby wykorzystać równoległość. na …

11 oracle data-warehouse

2

Projekt hurtowni danych do raportowania z danymi dla wielu stref czasowych

Staramy się zoptymalizować projekt hurtowni danych, który będzie obsługiwał raportowanie danych w wielu strefach czasowych. Na przykład, możemy mieć raport dotyczący aktywności z miesiąca (miliony wierszy), która musi pokazywać aktywność pogrupowaną według pory dnia. I oczywiście ta godzina dnia musi być godziną „lokalną” dla danej strefy czasowej. Mieliśmy projekt, który …

10 sql-server database-design data-warehouse reporting timezone

2

Baza danych o pojemności 100 TeraBytes - szacunkowe zasoby i czas

Pracuję nad obliczeniem „tylnej części koperty” dla konfiguracji bazy danych raportowania 100 TB. Szukam tutaj myśli od ekspertów. Proponowane środowisko: Pojemność ~ 100 TB Tabele ~ 200, rozmiary od 1 GB do 5 TB. średni rozmiar może wynosić od 100 GB do 200 GB ETL - zadania mogą wymagać łączenia …

10 oracle database-recommendation data-warehouse

Pytania otagowane jako data-warehouse