przerywany MySQL ulega awarii z błędem „Błąd krytyczny: nie można przydzielić pamięci dla puli buforów”


40

Dodano podczas edycji, 2013-05-29: Ponieważ jest to długie pytanie i dyskusja, oto krótkie streszczenie pytania i rozwiązania. Miałem problemy z uruchomieniem MySQL i Apache na małym serwerze Linux (1 GB pamięci). Apache wciąż domagał się więcej pamięci, a co za tym idzie, system operacyjny zawsze zabijał MySQL, aby odzyskać pamięć. Rozwiązaniem było zastąpienie Apache Lighttpd. Po wykonaniu tej czynności użycie pamięci na serwerze było całkowicie stabilne od kilku miesięcy i nie miałem żadnych awarii. koniec edycji

Jestem początkującym administratorem systemu dla małego wirtualnego serwera. Główną funkcją serwera jest uruchamianie oprogramowania do zarządzania kursami Moodle typu open source , napisanego w języku PHP. Opiera się na bazie danych, w tym przypadku MySQL, i serwerze WWW, w tym przypadku Apache.

Na serwerze działa 64-bitowa wersja CentOS 5.8 (wersja ostateczna) z 1 GB pamięci i 200 GB dysku, wersja jądra 2.6.18-308.8.2.el5xen. Wersja MySQL to wersja 14.14 Distrib 5.5.25 dla systemu Linux (x86_64) korzystająca z readline 5.1.

Nie sądzę, że oprogramowanie Moodle jest tak dużym użytkownikiem MySQL. Obecnie tylko około dziesięciu nauczycieli ma do niego dostęp, a kiedy zrzucam i kompresuję za pomocą bzip2 całą bazę danych, rozmiar powstałego zrzutu jest mniejszy niż 1 MB.

Ustawiłem system kilka miesięcy temu. Serwer Apache przez cały czas był stabilny, ale MySQL kilkakrotnie ulegał awarii. Próbowałem dowiedzieć się o optymalnej konfiguracji z Internetu, a kiedy ostatnio zmieniłem /etc/my.cnfplik, użyłem /usr/share/doc/mysql55-server-5.5.25/my-large.cnfjako przykładu pliku dostarczonego z MySQL. Plik mówi, że jest przeznaczony dla systemów z 512 MB pamięci, więc pomyślałem, że użycie parametrów konfiguracyjnych związanych z pamięcią byłoby bezpieczne dla tego systemu. (Wcześniej skonfigurowałem parametry związane z pamięcią MySQL ze znacznie mniejszymi liczbami i pomyślałem, że mogło to doprowadzić do awarii. Chociaż awarie nadal występują, system jest co najmniej szybszy.) Oto obecna zawartość /etc/my.cnf:

# /etc/my.cfg

# The main and only MySQL configuration file on [WEBSITE ADDRESS REDACTED].
# Last updated 2012-09-23 by Teemu Leisti.

# Most of the memory settings are set to be the same as the example setting file
# /usr/share/doc/mysql55-server-5.5.25/my-large.cnf, which is meant for systems
# with 512M of memory.  This server currently has twice that, i.e. 1G of memory,
# which should make these settings safe.


[client]
default_character_set           = utf8
port                            = 3306
socket                          = /var/lib/mysql/mysql.sock

[mysqld]
character_set_filesystem        = utf8
character_set_server            = utf8
datadir                         = /var/lib/mysql
innodb_additional_mem_pool_size = 20M
innodb_buffer_pool_size         = 256M # You can set .._buffer_pool_size up to
                                       # 50..80% of RAM, but beware of setting
                                       # memory usage too high
innodb_data_file_path           = ibdata1:10M:autoextend
innodb_data_home_dir            = /var/lib/mysql
innodb_flush_log_at_trx_commit  = 1
innodb_lock_wait_timeout        = 50
innodb_log_buffer_size          = 8M
innodb_log_file_size            = 64M # Set .._log_file_size to 25% of buffer
                                      # pool size
innodb_log_group_home_dir       = /var/lib/mysql
interactive_timeout             = 60
key_buffer_size                 = 256M
long_query_time                 = 10
max_allowed_packet              = 1M
max_connections                 = 30
port                            = 3306
query_cache_limit               = 2M # see http://emergent.urbanpug.com/?p=61
query_cache_size                = 16M
read_buffer_size                = 1M
read_rnd_buffer_size            = 4M
skip_networking                 # Only local processes need to use MySQL
skip_symbolic_links             # Disabling symbolic_links is recommended to
                                # prevent assorted security risks
slow_query_log_file             = /var/log/mysql-slow-queries.log
socket                          = /var/lib/mysql/mysql.sock
sort_buffer_size                = 1M
table_open_cache                = 256
thread_cache_size               = 8
thread_concurrency              = 2 #    = number of CPUs * 2
user                            = mysql
wait_timeout                    = 10

[mysqld_safe]
log_error                       = /var/log/mysqld.log
open_files_limit                = 4096
pid_file                        = /var/run/mysqld/mysqld.pid

[mysqldump]
quick
max_allowed_packet              = 16M

[mysql]
no-auto-rehash
# Remove the next comment character if you are not familiar with SQL
safe-updates

[myisamchk]
key_buffer_size                 = 128M
sort_buffer_size                = 128M
read_buffer                     = 2M
write_buffer                    = 2M

[mysqlhotcopy]
interactive-timeout

Jak widać w konfiguracji, instalator korzysta z silnika InnoDB i obsługuje tylko żądania z hosta lokalnego. Oprócz administratora systemu (mnie), Moodle jest jedynym użytkownikiem MySQL.

Kiedy MySQL ulega awarii, do pliku dziennika niezmiennie zapisywane są następujące elementy /var/log/mysqld.log(oczywiście poza znacznikami czasu):

120926 08:00:51 mysqld_safe Number of processes running now: 0
120926 08:00:51 mysqld_safe mysqld restarted
120926  8:00:53 [Note] Plugin 'FEDERATED' is disabled.
120926  8:00:53 InnoDB: The InnoDB memory heap is disabled
120926  8:00:53 InnoDB: Mutexes and rw_locks use GCC atomic builtins
120926  8:00:53 InnoDB: Compressed tables use zlib 1.2.3
120926  8:00:53 InnoDB: Using Linux native AIO
120926  8:00:53 InnoDB: Initializing buffer pool, size = 256.0M
InnoDB: mmap(274726912 bytes) failed; errno 12
120926  8:00:53 InnoDB: Completed initialization of buffer pool
120926  8:00:53 InnoDB: Fatal error: cannot allocate memory for the buffer pool
120926  8:00:53 [ERROR] Plugin 'InnoDB' init function returned error.
120926  8:00:53 [ERROR] Plugin 'InnoDB' registration as a STORAGE ENGINE failed.
120926  8:00:53 [ERROR] Unknown/unsupported storage engine: InnoDB
120926  8:00:53 [ERROR] Aborting

120926  8:00:53 [Note] /usr/libexec/mysqld: Shutdown complete

120926 08:00:53 mysqld_safe mysqld from pid file /var/run/mysqld/mysqld.pid ended

Czasami mogę zrestartować MySQL przez komendanta service mysqld restart, ale czasami, że komenda nie powiedzie się z tego wyjścia: mysqld dead but subsys locked. W takich przypadkach jedyną rzeczą, jaką mogłem wymyślić, aby odzyskać sytuację, jest zrestartowanie serwera, po czym można zrestartować MySQL. W takich przypadkach dane wyjściowe wyglądają następująco:

120926 11:43:48 mysqld_safe Starting mysqld daemon with databases from /var/lib/mysql
120926 11:43:48 [Note] Plugin 'FEDERATED' is disabled.
120926 11:43:48 InnoDB: The InnoDB memory heap is disabled
120926 11:43:48 InnoDB: Mutexes and rw_locks use GCC atomic builtins
120926 11:43:48 InnoDB: Compressed tables use zlib 1.2.3
120926 11:43:48 InnoDB: Using Linux native AIO
120926 11:43:48 InnoDB: Initializing buffer pool, size = 256.0M
120926 11:43:48 InnoDB: Completed initialization of buffer pool
120926 11:43:48 InnoDB: highest supported file format is Barracuda.
InnoDB: The log sequence number in ibdata files does not match
InnoDB: the log sequence number in the ib_logfiles!
120926 11:43:48  InnoDB: Database was not shut down normally!
InnoDB: Starting crash recovery.
InnoDB: Reading tablespace information from the .ibd files...
InnoDB: Restoring possible half-written data pages from the doublewrite
InnoDB: buffer...
120926 11:43:51  InnoDB: Waiting for the background threads to start
120926 11:43:52 InnoDB: 1.1.8 started; log sequence number 466807107
120926 11:43:52 [Note] Event Scheduler: Loaded 0 events
120926 11:43:52 [Note] /usr/libexec/mysqld: ready for connections.
Version: '5.5.25'  socket: '/var/lib/mysql/mysql.sock'  port: 0  MySQL Community Server (GPL)

Oto, co free -maktualnie wypisuje polecenie :

# free -m
             total       used       free     shared    buffers     cached
Mem:          1024        869        154          0         70        153
-/+ buffers/cache:        644        379
Swap:            0          0          0

Zwykle kolumna „wolna” ma wielkość od 50 do 100 MB.

Dane wyjściowe polecenia ulimit -a:

# ulimit -a
core file size          (blocks, -c) 0
data seg size           (kbytes, -d) unlimited
scheduling priority             (-e) 0
file size               (blocks, -f) unlimited
pending signals                 (-i) 8192
max locked memory       (kbytes, -l) 32
max memory size         (kbytes, -m) unlimited
open files                      (-n) 1024
pipe size            (512 bytes, -p) 8
POSIX message queues     (bytes, -q) 819200
real-time priority              (-r) 0
stack size              (kbytes, -s) 10240
cpu time               (seconds, -t) unlimited
max user processes              (-u) 8192
virtual memory          (kbytes, -v) unlimited
file locks                      (-x) unlimited

Nie zmieniłem żadnego pliku ustawień lub kodu Moodle, z wyjątkiem tego /var/www/html/moodle/config.php, który wygląda tak (linie komentarza zostały usunięte, aby zaoszczędzić miejsce):

<?php
unset($CFG);  // Ignore this line
global $CFG;  // This is necessary here for PHPUnit execution
$CFG = new stdClass();
$CFG->dbtype    = 'mysqli';           // 'pgsql', 'mysqli', 'mssql', 'sqlsrv' or 'oci'
$CFG->dblibrary = 'native';           // 'native' only at the moment
$CFG->dbhost    = 'localhost';        // eg 'localhost' or 'db.isp.com' or IP
$CFG->dbname    = 'moodle';           // database name, eg moodle
$CFG->dbuser    = 'moodleuser';       // your database username
$CFG->dbpass    = '[REDACTED]';       // your database password
$CFG->prefix    = 'moodle_';          // prefix to use for all table names
$CFG->dboptions = array(
    'dbpersist' => false,       // should persistent database connections be
                                //  used? set to 'false' for the most stable
                                //  setting, 'true' can improve performance
                                //  sometimes
    'dbsocket'  => true,        // should connection via UNIX socket be used?
                                //  if you set it to 'true' or custom path
                                //  here set dbhost to 'localhost',
                                //  (please note mysql is always using socket
                                //  if dbhost is 'localhost' - if you need
                                //  local port connection use '127.0.0.1')
    'dbport'    => '',          // the TCP port number to use when connecting
                                //  to the server. keep empty string for the
                                //  default port
);
$CFG->passwordsaltmain = '[REDACTED]';
$CFG->wwwroot   = 'http://[REDACTED]';
$CFG->dataroot  = '/var/moodledata';
$CFG->directorypermissions = 02777;
$CFG->admin = 'admin';
date_default_timezone_set('Europe/Helsinki');
$CFG->disableupdatenotifications = true;
require_once(dirname(__FILE__) . '/lib/setup.php'); // Do not edit

(Jednak zainstalowałem dwie wtyczki Moodle, moduł Attendance i blok , ale nie wiem, w jaki sposób mogą być zaangażowane w ten problem).

Nawet po tym, /etc/my.cnfjak tydzień temu zaktualizowałem swój obecny stan, MySQL kilkakrotnie zawiesił się z objawami podanymi powyżej. Będąc początkującym w administrowaniu bazami danych i po zrobieniu wielu pytań na temat tego problemu, nie wiem, co robić dalej. Jakieś sugestie? Czy powinienem publikować więcej danych konfiguracyjnych?

Dodanie do edycji:

Zawartość pliku /var/log/messages.1to:

Sep 23 04:02:18 [machine name] syslogd 1.4.1: restart.
Sep 26 08:00:51 [machine name] kernel: mysqld invoked oom-killer: gfp_mask=0x201d2, order=0, oomkilladj=0
Sep 26 08:00:51 [machine name] kernel:
Sep 26 08:00:51 [machine name] kernel: Call Trace:
Sep 26 08:00:51 [machine name] kernel:  [<ffffffff802c1bd5>] out_of_memory+0x8b/0x203
Sep 26 08:00:51 [machine name] kernel:  [<ffffffff8020fa49>] __alloc_pages+0x27f/0x308
Sep 26 08:00:51 [machine name] kernel:  [<ffffffff802139c9>] __do_page_cache_readahead+0xc8/0x1af
Sep 26 08:00:51 [machine name] kernel:  [<ffffffff8021423a>] filemap_nopage+0x14c/0x360
Sep 26 08:00:51 [machine name] kernel:  [<ffffffff80208e9d>] __handle_mm_fault+0x444/0x144f
Sep 26 08:00:51 [machine name] kernel:  [<ffffffff80263929>] _spin_lock_irqsave+0x9/0x14
Sep 26 08:00:51 [machine name] kernel:  [<ffffffff8023f468>] lock_timer_base+0x1b/0x3c
Sep 26 08:00:51 [machine name] kernel:  [<ffffffff80266d94>] do_page_fault+0xf72/0x131b
Sep 26 08:00:51 [machine name] kernel:  [<ffffffff802e5f4f>] sys_io_getevents+0x311/0x359
Sep 26 08:00:51 [machine name] kernel:  [<ffffffff802e4e56>] timeout_func+0x0/0x10
Sep 26 08:00:51 [machine name] kernel:  [<ffffffff8025f82b>] error_exit+0x0/0x6e
Sep 26 08:00:51 [machine name] kernel:
Sep 26 08:00:51 [machine name] kernel: Mem-info:
Sep 26 08:00:51 [machine name] kernel: DMA per-cpu:
Sep 26 08:00:51 [machine name] kernel: cpu 0 hot: high 0, batch 1 used:0
Sep 26 08:00:51 [machine name] kernel: cpu 0 cold: high 0, batch 1 used:0
Sep 26 08:00:51 [machine name] kernel: DMA32 per-cpu:
Sep 26 08:00:51 [machine name] kernel: cpu 0 hot: high 186, batch 31 used:117
Sep 26 08:00:51 [machine name] kernel: cpu 0 cold: high 62, batch 15 used:53
Sep 26 08:00:51 [machine name] kernel: Normal per-cpu: empty
Sep 26 08:00:51 [machine name] kernel: HighMem per-cpu: empty
Sep 26 08:00:51 [machine name] kernel: Free pages:        7256kB (0kB HighMem)
Sep 26 08:00:51 [machine name] kernel: Active:241649 inactive:0 dirty:0 writeback:0 unstable:0 free:1814 slab:4104 mapped-file:1153 mapped-anon:240592 pagetables:3298
Sep 26 08:00:51 [machine name] kernel: DMA free:3268kB min:32kB low:40kB high:48kB active:0kB inactive:0kB present:9068kB pages_scanned:0 all_unreclaimable? yes
Sep 26 08:00:51 [machine name] kernel: lowmem_reserve[]: 0 994 994 994
Sep 26 08:00:51 [machine name] kernel: DMA32 free:3988kB min:4016kB low:5020kB high:6024kB active:966596kB inactive:0kB present:1018080kB pages_scanned:6327262 all_unreclaimable? yes
Sep 26 08:00:52 [machine name] kernel: lowmem_reserve[]: 0 0 0 0
Sep 26 08:00:52 [machine name] kernel: Normal free:0kB min:0kB low:0kB high:0kB active:0kB inactive:0kB present:0kB pages_scanned:0 all_unreclaimable? no
Sep 26 08:00:52 [machine name] kernel: lowmem_reserve[]: 0 0 0 0
Sep 26 08:00:52 [machine name] kernel: HighMem free:0kB min:128kB low:128kB high:128kB active:0kB inactive:0kB present:0kB pages_scanned:0 all_unreclaimable? no
Sep 26 08:00:52 [machine name] kernel: lowmem_reserve[]: 0 0 0 0
Sep 26 08:00:52 [machine name] kernel: DMA: 1*4kB 2*8kB 1*16kB 1*32kB 2*64kB 2*128kB 1*256kB 1*512kB 2*1024kB 0*2048kB 0*4096kB = 3268kB
Sep 26 08:00:52 [machine name] kernel: DMA32: 17*4kB 2*8kB 2*16kB 1*32kB 0*64kB 0*128kB 1*256kB 1*512kB 1*1024kB 1*2048kB 0*4096kB = 3988kB
Sep 26 08:00:52 [machine name] kernel: Normal: empty
Sep 26 08:00:52 [machine name] kernel: HighMem: empty
Sep 26 08:00:52 [machine name] kernel: 1214 pagecache pages
Sep 26 08:00:52 [machine name] kernel: Swap cache: add 0, delete 0, find 0/0, race 0+0
Sep 26 08:00:52 [machine name] kernel: Free swap  = 0kB
Sep 26 08:00:52 [machine name] kernel: Total swap = 0kB
Sep 26 08:00:52 [machine name] kernel: Free swap:            0kB
Sep 26 08:00:52 [machine name] kernel: 262144 pages of RAM
Sep 26 08:00:52 [machine name] kernel: 8320 reserved pages
Sep 26 08:00:52 [machine name] kernel: 22510 pages shared
Sep 26 08:00:52 [machine name] kernel: 0 pages swap cached
Sep 26 08:00:52 [machine name] kernel: Out of memory: Killed process 1371, UID 27, (mysqld).

a następnie wiersze związane z ponownym uruchomieniem o 11:42.

Dodanie do edycji nr 2:

Próbowałem skomentować odpowiedź Michaela, ale wyczerpał mi się limit znaków w komentarzach, więc odpowiadam tutaj.

Dziękuję za odpowiedź, Michael. Właśnie edytowałem moje pytanie, aby uwzględnić zawartość dziennika systemowego maszyny w momencie awarii. (Wydaje się, że CentOS nazywa swój dziennik systemowy /var/log/messages.)

Tak, zarówno MySQL, jak i dzienniki systemowe wydają się prawie identyczne z tymi w pytaniu, z którym się łączysz. A teraz, kiedy o tym wspominasz, to oczywiste, że mysql restartedkomunikat oznacza, że ​​MySQL już się zawiesił. Dziennik systemu wskazuje, że to oom_killerwłaśnie dostał proces. W swojej wcześniejszej odpowiedzi piszesz: „Najpierw zgadnij: procesy potomne apache działają amok”. Wydaje mi się, że Apache też jest tutaj oczywistym podejrzanym.

Wcześniej znalazłem artykuł Optymalizowanie MySQL i Apache pod kątem niskiego zużycia pamięci, część 1 . Aby skonfigurować Apache, autor zaleca: „Po pierwsze, Apache. Moje pierwsze stwierdzenie brzmi: jeśli możesz tego uniknąć, spróbuj. Lighttpd i thttpd są bardzo dobre, bez zbędnych dodatków, i możesz uruchomić lighttpd z PHP. Nawet jeśli „prowadzisz witrynę o dużej objętości, możesz poważnie zwiększyć wydajność, przekazując zawartość statyczną (zwykle obrazy i pliki javascript) na lekki, superszybki serwer HTTPd, taki jak Lighttpd”.

Zastanawiam się nad skorzystaniem z porady autora i uzgodniłem z moim klientem, że w następny weekend zastąpię Apache na Lighttpd na serwerze. Mam nadzieję, że to rozwiąże problemy. Korzystanie z dwóch serwerów wirtualnych jest najprawdopodobniej niemożliwe.

Nie sądziłem, że użycie dwóch stabilnych, dojrzałych serwerów typu open source, takich jak MySQL i Apache na tym samym komputerze, z rozsądną ilością pamięci, byłoby tak kłopotliwe.

Odpowiedzi:


36

Przejrzyj moją odpowiedź na to ostatnie pytanie . Uważam, że okoliczności są identyczne.

Nie zmieniaj konfiguracji MySQL w tym momencie, ponieważ MySQL nie jest problemem - to tylko symptom problemu ... polega na tym, że masz system z małą ilością pamięci i zerową przestrzenią wymiany.

Twój serwer nie upaść „ponieważ” Pamięć nie może być przypisana do puli bufora. Twój serwer ulega awarii ... a następnie nie może się ponownie uruchomić z powodu niedostępności pamięci systemowej. Cała pamięć skonfigurowana dla puli buforów InnoDB jest pobierana z systemu podczas uruchamiania mysql.

Gdy zobaczysz ten komunikat w dzienniku ...

120926 08:00:51 mysqld_safe Number of processes running now: 0

... twój serwer już zmarł. Jeśli wcześniej niczego nie logował, nie będzie nic logował o pierwszej awarii. Kolejne dzienniki pochodzą z automatycznej próby ponownego uruchomienia.

Sprawdź swój syslog i powinieneś znaleźć wiadomości, w których jądro poszło szukać procesów do zabicia ze względu na skrajny brak pamięci.

Krok 1 prawdopodobnie polegałby na dodaniu przestrzeni wymiany i / lub przydzieleniu pamięci RAM, jeśli to w ogóle możliwe.

Jeśli nie jest to możliwe, możesz rozważyć zmniejszenie wielkości puli buforów innodb w swojej konfiguracji. (Nigdy nie myślałem, że tak naprawdę to słyszę). Tak długo, jak baza danych jest niewielka, a ruch jest niewielki, może nie być potrzebna tak duża pula buforów ... a ponieważ pamięć puli buforów InnoDB jest przydzielana przy uruchamianiu, niezależnie od tego, czy jest potrzebna, czy nie, zwolni to część pamięć systemu na wszystko, czego tego wymaga. (Zalecenie od 75% do 80% całkowitej pamięci RAM dla zmiany wielkości puli buforów jest prawdziwe tylko wtedy, gdy cały serwer jest poświęcony MySQL.)

Krok 2 polega na przejrzeniu modelu rozwidlania Apache i tego, co możesz zrobić inaczej w konfiguracji, aby nie przytłoczył twojego serwera. Jest całkiem prawdopodobne, że niekontrolowany wzrost wymagań ilościowych lub pamięciowych procesów potomnych Apache rozpoczyna kaskadę zdarzeń, w wyniku której jądro zabija MySQL, aby uniknąć całkowitej awarii całego serwera.

W zależności od tego, ile masz elastyczności, możesz nawet rozważyć dwie osobne maszyny wirtualne dla Apache i MySQL.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.