應對惡劣網路環境,為php-curl設定超時限制,防止伺服器卡死

NO IMAGE
1 Star2 Stars3 Stars4 Stars5 Stars 給文章打分!
Loading...

挖洋貨這專案,因為沒有公司的名頭,也就無法備案,所以前端機放在阿里雲香港ECS,另配一臺阿里雲杭州ECS來跑crontab——執行爬蟲、儲存圖片到阿里雲OSS等。最近覺得杭州ECS有點多餘了(原本還有個杭州RDS的,統一搬到香港RDS了),打算撤掉,就把杭州ECS上的crontab全部搬回香港ECS來跑,這下就引發不少問題了。
引發什麼問題了呢?最核心的問題是香港ECS處在國際網路環境,訪問大陸伺服器時經常會出現網路抖動的現象,非常無解。具體一點來說,比如香港ECS向阿里雲杭州open searchopen search沒有香港節點呀親 ╥﹏╥…)查詢的時候,經常報錯;又比如香港ECS抓到圖片後上傳杭州OSS(OSS是有香港節點,問題是沒有圖片處理的服務啊,你們說這不是坑死人嗎),慢是其次,經常卡住一段時間後才報錯,這使得上傳的效率極其低下(我會告訴你就因為這個原因,積壓了好幾千爬回來的商品等著上傳圖片才能上架嗎)。

open search的問題還是很好解決的,SDK有提供超時的配置,我把超時限制設大了一點(5秒),基本上就不會報錯了。
而OSS的SDK根本沒有提供這方面的配置,為了解決這個問題,我決定深入到這SDK來修改原始碼。
OSS的SDK是通過php-curl來請求api的,經調查後,我發現此SDK有個名為requestcore.class.php的檔案中定義了一個RequestCore類,很明顯,這個類就是負責傳送請求的。其中,prep_request()負責配置curl,send_request($parse = false)則負責執行curl(即真正傳送請求)。
首先來看看prep_request(),其中包含兩個php-curl的兩個超時配置:CURLOPT_TIMEOUT以及CURLOPT_CONNECTTIMEOUT

curl_setopt($curl_handle, CURLOPT_TIMEOUT, 5184000);
curl_setopt($curl_handle, CURLOPT_CONNECTTIMEOUT, 120);

CURLOPT_TIMEOUT好理解,就是整個curl請求過程(http request & response)的超時限制,以秒為單位,設定為0則無限制。
CURLOPT_CONNECTTIMEOUT比較難理解,目前確認的是,這是curl請求過程中的一小部分,因此必須要設得比CURLOPT_TIMEOUT小,不然CURLOPT_TIMEOUT無意義。網上的資料是這麼說的:

CURLOPT_CONNECTTIMEOUT 在發起連線前等待的時間,如果設定為0,則無限等待。

這個發起連線前等待的時間比較模糊,我傾向於這指的是完成TCP三次握手過程前所耗費的時間,或者換句話說,TCP三次握手的整個過程必須要在CURLOPT_CONNECTTIMEOUT內完成,否則就超時。TCP三次握手無法在指定時間內完成表示伺服器正處在繁忙/奔潰的狀態或網路異常,這正符合本文所提到的場景。
基於這一猜想下,我把CURLOPT_CONNECTTIMEOUT設成3秒:

curl_setopt($curl_handle, CURLOPT_CONNECTTIMEOUT, 3);

如此,就不需要在網路抖動的時候等待2分鐘(SDK設定的CURLOPT_CONNECTTIMEOUT是120秒)才報錯了。

PS:如果想要設定超時時間少於1秒,需要用到CURLOPT_TIMEOUT_MS,但此配置據鳥哥說有bug,未測試,留個心眼:《Curl的毫秒超時的一個”Bug”

相關文章

伺服器 最新文章