Problem optymalizacji: złożone klucze klastrowe, warunki flagi i scalanie indeksu


11

Trzy stoły:

product: z kolumnami: ( a, g, ...a_lot_more... )

a: PK, clustered
g: bit-column

main: z kolumnami: ( c, f, a, b, ...a_lot_more... )

c: PK, clustered
f: bit-column
(a, b): UQ 

lookup z kolumnami: ( a, b, c, i )

(a, b): PK, clustered
a: FK to product(a)
c: UQ, FK to main(c)
i: bit-column

Nie mogę znaleźć dobrych indeksów dla złączenia:

FROM  
    product
  JOIN 
    lookup
      ON  lookup.a = product.a  
  JOIN
    main
      ON  main.c = lookup.c 
WHERE 
      product.g = 1
  AND
      main.f = 1
  AND 
      lookup.i = 1
  AND lookup.b = 17

Wypróbowałem indeks pokrycia product (g, a, ...)i jest on używany, ale nie ze spektakularnymi wynikami.

Niektóre kombinacje indeksów w lookuptabeli tworzą plany wykonania ze scalaniem indeksów, z niewielkim wzrostem wydajności w porównaniu z poprzednim planem.

Czy brakuje mi oczywistej kombinacji?

Czy ponowne zaprojektowanie konstrukcji może pomóc?

DBMS to MySQL 5.5, a wszystkie tabele używają InnoDB.


Rozmiary stołu:

product: 67K   ,  g applied:    64K 

main:   420K   ,  f applied:   190K

lookup:  12M   ,  b,i applied:  67K 

Spróbuj przenieść predykaty filtra do złączeń i sprawdź, czy optymalizator robi z tym coś sensownego. Wcześniej widziałem, że optymalizator SQL Server nie działa.
ConcernedOfTunbridgeWells

Wygląda jak produkt kartezjański, ponieważ nic nie ŁĄCZY się z tabeli produktów. A może coś przeoczyłem ???
RolandoMySQLDBA,

@RolandoMySQLDBA: Masz rację. Poprawię zapytanie.
ypercubeᵀᴹ

Odpowiedzi:


3

To mnie boli ...

Wcześniej musiałem używać tabel tymczasowych z InnoDB. Załaduj je z filtrami, utwórz indeks, dołącz do tabeli temp.

Problem, jak sądzę, polega na tym, że InnoDB ma tylko algorytm Nested Join: dorosłe optymalizatory zapytań RDBMS mają więcej do wykorzystania. Jest to oparte na próbie uruchomienia ładowań typu Data Warehouse na InnoDB.

Tabele temp zmniejszają ogólną złożoność w dół poziomu optymalizatora zapytań MySQL ...


Dzięki, spróbuję tego. Liczba lub wiersze (po zastosowaniu kryteriów nie są tak duże, odpowiednio 64 K, 67 K, 190 K). Może powinienem spróbować pozbyć się jednej z trzech tabel ( main) poprzez denormalizację danych lookup?
ypercubeᵀᴹ

1
@ypercube: denormalising uczyni rzędy szersza, niższa gęstość page = inne problemy
gbn

3

Wygląda jak produkt kartezjański. Powtórz kryteria DOŁĄCZ

FROM  
    product
  JOIN 
    lookup
      ON  product.a = lookup.a  
  JOIN
    main
      ON  main.c = lookup.c 
WHERE 
      product.g = 1
  AND
      main.f = 1
  AND 
      lookup.i = 1
  AND lookup.b = 17

SUGESTIA ALTERNATYWNA

Może się to wydawać niekonwencjonalne i prawdopodobnie pachnie jak SQL Anitpattern, ale oto idzie ...

FROM  
    product
JOIN 
    (
        SELECT * FROM lookup
        WHERE i=1 AND b=17
    ) lookup ON product.a = lookup.a  
JOIN
   main ON main.c = lookup.c 
WHERE 
    product.g = 1 AND main.f = 1

Nie przesunąłem product.g = 1i main.f = 1do podkwerend, ponieważ są to pola bitowe i po prostu wykonam skanowanie tabeli w tym momencie. Nawet gdyby pola bitowe były indeksami, Optymalizator zapytań po prostu zignorowałby taki indeks.

Oczywiście możesz zmienić SELECT * FROM lookupna, SELECT a FROM lookupjeśli twój SELECT nie potrzebuje niczegolookup

Być może włącz a, b do JOIN między wyszukiwaniem a głównym, jeśli ma to sens

FROM  
    product
  JOIN 
    lookup
      ON  product.a = lookup.a  
  JOIN
    main
      ON  main.a = lookup.a AND main.b = lookup.b
WHERE 
      product.g = 1
  AND
      main.f = 1
  AND 
      lookup.i = 1
  AND lookup.b = 17

lub odłóż c i połącz trzy kolumny (Indeks trzech kolumn w maini lookup)

FROM  
    product
  JOIN 
    lookup
      ON  product.a = lookup.a  
  JOIN
    main
      ON main.a = lookup.a
      AND main.b = lookup.b
      AND main.c = lookup.c
WHERE 
      product.g = 1
  AND
      main.f = 1
  AND 
      lookup.i = 1
  AND lookup.b = 17

Dziękuję Inny plan EXPLAIN, ale podobna wydajność.
ypercubeᵀᴹ

Jaka jest liczność main.fi product.g??? Jeśli liczebność main.fi product.gdla wartości wynosi 1 jest mniejsza niż 5% wierszy tabeli, indeks na main.fi product.gmoże być uzasadniony.
RolandoMySQLDBA,

Nieważne, są już indeksowane. Jeśli liczebność main.fi product.gwynosi 2, możesz porzucić te indeksy.
RolandoMySQLDBA,

Edytowałem pytanie przy użyciu rozmiarów tabel i użytych wierszy (po zastosowaniu warunków).
ypercubeᵀᴹ

Zaktualizowałem swoje pytanie, sugerując ŁĄCZENIE na a, b zamiast c. Sprawdź, czy to tworzy inny plan WYJAŚNIJ
RolandoMySQLDBA,
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.