Pytania otagowane jako cassandra

Apache Cassandra to rozproszony system zarządzania bazami danych typu open source. Został zaprojektowany do obsługi bardzo dużych ilości danych rozproszonych na wielu zwykłych serwerach, zapewniając jednocześnie wysoką dostępność usługi bez pojedynczego punktu awarii. Jest to rozwiązanie NoSQL.

5
Która baza danych mogłaby obsłużyć przechowywanie miliardów / trylionów rekordów?
Chcemy opracować narzędzie do przechwytywania i analizy danych przepływu netto, z których zbieramy ogromne ilości. Każdego dnia rejestrujemy około ~ 1,4 miliarda rekordów przepływu, które wyglądałyby tak w formacie json: { "tcp_flags": "0", "src_as": "54321", "nexthop": "1.2.3.4", "unix_secs": "1352234521", "src_mask": "23", "tos": "0", "prot": "6", "input": "105", "doctets": "186", "engine_type": …

5
Infrastruktura dla wysoce współbieżnego, wysokiego zapisu DB
Moje wymagania to: 3000 połączeń 70–85% Zapis a odczyt Obecnie maksymalizujemy bardzo dużą, bardzo dużą instancję przy 700 połączeniach. Wszystkie 8 rdzeni są maksymalne. Uważamy, że jest to liczba równoczesnych połączeń, ponieważ pamięć jest w porządku. Sam zapis jest bardzo prosty (sprawdzanie poprawności spowalnia rzeczy). Aby skalować do 3000, musimy …


1
Konfiguracja multidatacenter Cassandra z 1 zewnętrznym IP
Próbuję skonfigurować klaster Cassandra z wieloma centrami danych. Problem polega na tym, że moje centra danych mają tylko 1 zewnętrzny adres IP (wan IP), mogę skonfigurować przekierowanie portów na przełącznikach centrów danych, aby uzyskać dostęp do każdego węzła ze świata zewnętrznego za pomocą innego portu, ale nie wiem, jak skonfigurować …
13 cassandra 


2
Jaki jest dobry sposób na skopiowanie danych z jednej Cassandra ColumnFamily do drugiej w tej samej przestrzeni kluczy (jak SQL INSERT INTO)?
Próbuję znaleźć sposób na łatwe przeniesienie wszystkich wierszy z Cassandra ColumnFamily / Table do drugiego. COPYPoleceń, jak rozumiem, jest rozwiązaniem dobrym. Jednak, gdy zrzuca wszystkie dane .csvna dysk, a następnie ładuje je z powrotem, nie mogę przestać się zastanawiać, czy jest lepszy sposób, aby to zrobić w silniku. Konkretnym przykładem …


1
Jakie są praktyczne ograniczenia dotyczące rodziny kolumn w Cassandrze?
W Cassandrze nie zaleca się posiadania więcej niż kilku tysięcy rodzin kolumn , na przykład 2000 dla argumentu. W przypadkach, w których trzeba utrwalić ponad 2000 rodzajów danych, jednym podejściem byłoby podzielenie wielu niepowiązanych typów danych na każdą rodzinę kolumn. Na przykład pojedynczy CF może zawierać Zamówienia, Faktury i Klientów, …

2
Dlaczego Cassandra odradza tworzenie indeksu na kolumnach o wysokiej liczności?
Dokumentacja Cassandra stwierdza, Nie używaj indeksu w następujących sytuacjach: W kolumnach o wysokiej liczności, ponieważ następnie przeszukujesz ogromną liczbę rekordów w celu uzyskania niewielkiej liczby wyników. Zobacz problemy przy użyciu indeksu kolumny o wysokiej liczności poniżej. To idzie, Jeśli utworzysz indeks w kolumnie o wysokiej liczności, która ma wiele różnych …
10 index  cassandra 

2
NoSQL: Co to są dane nieustrukturyzowane?
obecnie działamy na granicy zasobów dzięki naszemu rozwiązaniu opartemu na serwerze mssql. Mamy teraz wiele tradycyjnych opcji dotyczących następnego ruchu, aby poradzić sobie z obciążeniem: kupuj szybsze procesory i IO podzielić niektórych klientów na oddzielny serwer przenieś db do klastra Wszystkie są albo drogie pod względem licencjonowania i sprzętu, albo …

2
Cassandra: utrzymanie
Nie mam doświadczenia z Cassandrą, ale mam pewne doświadczenie z relacyjnymi bazami danych opartymi na SQL. Nie udało mi się znaleźć informacji o najlepszych praktykach dotyczących sposobu utrzymania Cassandry po wdrożeniu. Czy konieczne jest VACUUM bazy danych? Powinienem pomyśleć, że ładowanie odczytu / zapisu powoduje fragmentację pamięci. Lub bardziej ogólnie: …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.