Profiling – ciąg dalszy - MySQL – optymalizacja i wydajność

Profiling – ciąg dalszy

Kwi 21

Kolejnym mechanizmem udostępnianym przez MySQL, a który można wykorzystać do przeanalizowania zapytania pod kątem wydajności i zrozumienia co się w czasie jego wykonywania faktycznie dzieje, jest mechanizm statystyk, które dostępne są dzięki zapytaniu:

SHOW STATUS;

Wynikiem tego zapytania jest długa lista zmiennych obrazujących stan serwera MySQL w ramach danej sesji – ilość wykonanych zapytań różnych typów, ilość utworzonych tablic tymczasowych, jakiego rodzaju JOIN’y były wykonywane, ile danych zostało przesłanych i tak dalej. Pełna lista tych parametrów wraz z opisem znajduje się w dokumentacji MySQL – http://dev.mysql.com/doc/refman/5.1/en/server-status-variables.html

Jak możemy wykorzystać te dane? Czyścimy wszystkie liczniki:

FLUSH STATUS;

Wykonujemy zapytanie, a następnie sprawdzamy ponownie

SHOW STATUS;

To, co się na liście zmieniło, jest wynikiem działania naszego zapytania. Dla jasności – przykład:

Jak widać, okazuje się, że wykonanie tego konkretnego zapytania wiąże się między innymi z utworzeniem tablicy tymczasowej.
Nie da się ukryć, że tego typu testowanie jest dosyć czasochłonne – trzeba wyczyścić statystyki, wykonać zapytanie, przeanalizować statystyki. Istnieje rozwiązanie ułatwiające życie – program mk-query-profiler wchodzący w skład znakomitego zestawu narzędzi Maatkit – www.maatkit.org.

Zapisujemy nasze zapytanie do pliku:

echo "SELECT SQL_NO_CACHE first_name, last_name, title FROM film LEFT OUTER JOIN film_actor USING (film_id) LEFT OUTER JOIN actor1 USING (actor_id) WHERE first_name='PENELOPE' AND last_name='GUINESS' ORDER BY title DESC;" > zapytanie.sql

Uruchamiamy mk-query-profiler:

cat zapytanie.sql | mk-query-profiler -D sakila --verbose

+----------------------------------------------------------+
|                      1 (0.0004 sec)                      |
+----------------------------------------------------------+

__ Overall stats _______________________ Value _____________
Total elapsed time                        0.000
Questions                                 1
COMMIT                                  0
DELETE                                  0
DELETE MULTI                            0
INSERT                                  0
INSERT SELECT                           0
REPLACE                                 0
REPLACE SELECT                          0
SELECT                                  1
UPDATE                                  0
UPDATE MULTI                            0
Data into server                        218
Data out of server                      911
Optimizer cost                           30.611

__ Table and index accesses ____________ Value _____________
Table locks acquired                      3
Table scans                               0
Join                                    0
Index range scans                         0
Join without check                      0
Join with check                         0
Rows sorted                              19
Range sorts                             0
Merge passes                            0
Table scans                             1
Potential filesorts                     1

__ Row operations ____________________ Handler ______ InnoDB
Reads                                    83            39
Fixed pos (might be sort)              19
Next row (table scan)                  20
Bookmark lookup                        24
First in index (full scan?)             0
Next in index                          20
Prev in index                           0
Writes
Delete                                  0             0
Update                                  0             0
Insert                                 19             0
Commit                                  1

W ten sposób uzyskujemy dokładne informacje o tym, co się dzieje w trakcie wykonywania zapytania. Wykonywany jest jeden SELECT, nakładane są trzy locki na tabele, posortowano 19 rekordów, wykonano jeden skan tabeli itd. Mamy także podane statystyki na poziomie silnika – ilość odczytów, ilość odczytów sekwencyjnych, ilość odczytów z indeksów, ilość rekordów zmodyfikowanych, utworzonych, skasowanych i tak dalej. Stosunkowo istotnym parametrem jest Optimizer cost – jest to szacowany przez optimizer koszt wykonania zapytania. Jednostką jest odczyt 4 kilobajtowej strony z danymi – im mniej odczytów, tym lepiej. Nie jest to do końca idealne rozwiązanie – nie uwzględnia na przykład faktu, że część danych jest cacheowanych – wszystkie odczyty są traktowane jako odczyty z dysku. Obliczenie kosztu bazuje na statystykach dotyczących indeksów i rekordów – statystyki te mogą nie być aktualne, lub być tylko szacunkowe.

Tego typu dane są niezbędnie konieczne, aby zrozumieć co się dzieje na serwerze bazodanowym. Zrozumienie tego jest z kolei istotne, aby świadomie podejmować pewne decyzje dotyczące pisania zapytań czy też modyfikowania struktury bazy danych.

analiza, MySQL, profiling

P	W	Ś	C	P	S	N
				Maj »
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

MySQL – optymalizacja i wydajność