有時(shí),運(yùn)作 Nginx、PHP-CGI(php-fpm) Web服務(wù)的 Linux 網(wǎng)絡(luò)服務(wù)器,忽然系統(tǒng)軟件負(fù)荷升高,應(yīng)用 top 指令查詢,許多 php-cgi 過程 CPU 利用率貼近100%。之后,我根據(jù)追蹤發(fā)覺,這類狀況的出現(xiàn),跟 PHP 的 file_get_contents() 涵數(shù)擁有緊密的關(guān)聯(lián)。(
北京市網(wǎng)站建設(shè))
大、中小型網(wǎng)址中,根據(jù) HTTP 協(xié)議書的 API 插口啟用,是家常飯。PHP 程序猿們喜愛應(yīng)用簡易方便快捷的 file_get_contents("http://example.com/") 涵數(shù),來獲得一個(gè) URL 的回到內(nèi)容,可是,假如 http://example.com/ 這一網(wǎng)址回應(yīng)遲緩,file_get_contents() 便會(huì)一直卡在那里,不容易請(qǐng)求超時(shí)。
我們知道,在 php.ini 中,有一個(gè)主要參數(shù) max_execution_time 能夠設(shè)定 PHP 腳本制作的較大實(shí)行時(shí)間,可是,在 php-cgi(php-fpm) 中,該主要參數(shù)不容易見效。真實(shí)可以操縱 PHP 腳本制作較大實(shí)行時(shí)間的是 php-fpm.conf 環(huán)境變量中的下列主要參數(shù):
- The timeout (in seconds) for serving a single request after which the worker process will be terminated
- Should be used when 'max_execution_time' ini option does not stop script execution for some reason
- '0s' means 'off'
- <value name="request_terminate_timeout">0s</value>
初始值為 0 秒,換句話說,PHP 腳本制作會(huì)一直實(shí)行下來。那樣,當(dāng)全部的 php-cgi 過程都卡在 file_get_contents() 涵數(shù)時(shí),這臺(tái) Nginx PHP 的 WebServer 早已沒法再解決新的 PHP 要求了,Nginx 將給客戶回到“502 Bad Gateway”。改動(dòng)該主要參數(shù),設(shè)定一個(gè) PHP 腳本制作較大實(shí)行時(shí)間必需的,可是,不能根除。比如改為 30s,假如產(chǎn)生 file_get_contents() 獲得網(wǎng)頁頁面比較慢的狀況,這就代表著 150 個(gè) php-cgi 過程,每秒只有解決 5 個(gè)要求,WebServer 一樣難以防止“502 Bad Gateway”。
要保證徹底消除,只有讓 PHP 程序猿們改正立即應(yīng)用 file_get_contents("http://example.com/") 的習(xí)慣性,只是略微改動(dòng)一下,加個(gè)請(qǐng)求超時(shí)時(shí)間,用下列方法來完成 HTTP GET 要求。如果感覺不便,能夠自主將下列編碼封裝成一個(gè)涵數(shù)。
- <?php
- $ctx = stream_context_create(array(
- 'http' => array(
- 'timeout' => 1 //設(shè)定一個(gè)請(qǐng)求超時(shí)時(shí)間,企業(yè)為秒
- )
- )
- );
- file_get_contents("http://example.com/", 0, $ctx);
- ?>
自然,造成 php-cgi 過程 CPU 100% 的緣故不僅有這一種,那麼,如何明確是 file_get_contents() 涵數(shù)造成的呢?
最先,應(yīng)用 top 指令查詢 CPU 利用率較高的 php-cgi 過程。
- top - 10:34:18 up 724 days, 21:01, 3 users, load average: 17.86, 11.16, 7.69
- Tasks: 561 total, 15 running, 546 sleeping, 0 stopped, 0 zombie
- Cpu(s): 5.9%us, 4.2%sy, 0.0%ni, 89.4%id, 0.2%wa, 0.0%hi, 0.2%si, 0.0%st
- Mem: 8100996k total, 4320108k used, 3780889k free, 772572k buffers
- Swap: 8193108k total, 50778k used, 8142332m free, 412088k cached
- PID USER PR NI VIRT RES SHR S %CPU %MEM TIME COMMAND
- 10747 www 18 0 360m 22m 12m R 100.6 0.3 0:02.60 php-cgi
- 10709 www 16 0 358m 28m 17m R 96.8 0.4 0:11.34 php-cgi
- 10745 www 18 0 360m 24m 14m R 94.8 0.3 0:39.51 php-cgi
- 10707 www 18 0 360m 25m 14m S 77.4 0.3 0:33.48 php-cgi
- 10782 www 20 0 360m 26m 15m R 75.5 0.3 0:10.93 php-cgi
- 10708 www 25 0 360m
22m 12m R 69.7 0.3 0:45.16 php-cgi
- 10683 www 25 0 361m 28m 15m R 54.2 0.4 0:32.65 php-cgi
- 10711 www 25 0 360m 25m 15m R 52.2 0.3 0:44.25 php-cgi
- 10688 www 25 0 358m 25m 15m R 38.7 0.3 0:10.44 php-cgi
- 10719 www 25 0 360m 26m 16m R 7.7 0.3 0:40.59 php-cgi
找在其中一個(gè) CPU 100% 的 php-cgi 過程的 PID,用下列指令追蹤一下:
- strace -p 10747
假如屏幕上顯示:
- select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0})
- poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)
- select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0})
- poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)
- select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0})
- poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)
- select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0})
- poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)
- select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0})
- poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)
- select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0})
- poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)
- select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0})
- poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)
- select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0})
- poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)
- select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0})
- poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)
- select(7, [6], [6], [], {15, 0}) = 1 (out [6], left {15, 0})
- poll([{fd=6, events=POLLIN}], 1, 0) = 0 (Timeout)
那麼,就可以明確是 file_get_contents() 造成的
難題了。