http協(xié)議
http協(xié)議大家都很熟悉了,開始本文之前,首先簡單回顧一下http協(xié)議。
http協(xié)議是建立在tcp協(xié)議上的應(yīng)用層協(xié)議,協(xié)議的本質(zhì)是請求----應(yīng)答:
即對(duì)于http協(xié)議來說,服務(wù)端給一次響應(yīng)后整個(gè)請求就結(jié)束了,這是http請求最大的特點(diǎn),也是由于這個(gè)特點(diǎn),http請求無法做到的是服務(wù)端向客戶端主動(dòng)推送數(shù)據(jù)。
但由于http協(xié)議的廣泛應(yīng)用,很多時(shí)候確實(shí)又想使用http協(xié)議去實(shí)現(xiàn)實(shí)時(shí)的數(shù)據(jù)獲取,這種時(shí)候應(yīng)當(dāng)怎么辦呢?下面首先介紹幾種基于http協(xié)議的實(shí)時(shí)數(shù)據(jù)獲取方法。
短輪詢
輪詢是最普遍的基于http協(xié)議獲取實(shí)時(shí)數(shù)據(jù)的方式,輪詢又分為短輪詢和長輪詢。短輪詢非常簡單,用一張圖表示一下:
客戶端向服務(wù)端請求數(shù)據(jù),服務(wù)端立即將數(shù)據(jù)返回給客戶端,客戶端沒有拿到想要的數(shù)據(jù)(比如返回結(jié)果告訴客戶端,數(shù)據(jù)處理中),客戶端繼續(xù)發(fā)請求,服務(wù)端繼續(xù)立即響應(yīng),周而復(fù)始。
這種實(shí)時(shí)數(shù)據(jù)獲取的方式比較粗暴,優(yōu)點(diǎn)在于編程簡單,客戶端發(fā)請求,服務(wù)端實(shí)時(shí)回響應(yīng)即可。缺點(diǎn)主要有兩個(gè):
- 無效請求多,每一次無效請求都在浪費(fèi)帶寬和服務(wù)器的計(jì)算資源
- 對(duì)服務(wù)器壓力大,定時(shí)發(fā)請求,并發(fā)一高,可能服務(wù)端瞬間會(huì)收到成千上萬個(gè)請求,很容易拖垮服務(wù)器甚至導(dǎo)致宕機(jī)
那么短輪詢適合哪種使用場景呢,按照我的理解如果數(shù)據(jù)變化比較頻繁或者能預(yù)期到數(shù)據(jù)在短時(shí)間內(nèi)會(huì)發(fā)生一次變化的場景可以使用短輪詢,比如:
用戶在pc端買了一個(gè)東西喚起網(wǎng)頁端,由于pc端和網(wǎng)頁端是不通的,我們預(yù)期到用戶應(yīng)該很快會(huì)完成付款,這種時(shí)候?yàn)榱碎_發(fā)簡單短輪詢是一種可以使用的方式,直接服務(wù)端提供一個(gè)接口告訴客戶端訂單狀態(tài),客戶端每5秒請求一次即可,拿到結(jié)果就可以不用請求了。
使用短輪詢注意要做好請求次數(shù)上限的控制,比如請求100次還沒檢測到用戶付款,可以彈窗"請完成付款后去我的訂單頁面查詢"就可以不用請求了。
長輪詢
長輪詢是另一種實(shí)時(shí)獲取數(shù)據(jù)的方式,看一下流程:
本質(zhì)上沒有改變,依然是客戶端在沒有收到自己想要數(shù)據(jù)的情況下不斷發(fā)送請求給服務(wù)端,差別在于服務(wù)端收到請求不再直接給響應(yīng),而是將請求掛起,自己去定時(shí)判斷數(shù)據(jù)的變化,有變化就立馬返回給客戶端,沒有就等到超時(shí)為止。
可以很明顯的看到,長輪詢的優(yōu)點(diǎn)就是客戶端的請求少了很多避免了無謂的客戶端請求,缺點(diǎn)則是服務(wù)端會(huì)掛起大量請求增加資源消耗且服務(wù)器對(duì)http請求并發(fā)數(shù)量是有限制的。
微信網(wǎng)頁版的登陸是一個(gè)典型的長輪詢的例子:
從圖上看,客戶端不斷發(fā)送請求到服務(wù)器,服務(wù)器第一時(shí)間并沒有給出回應(yīng),于是客戶端等待,在超時(shí)的情況下繼續(xù)發(fā)送請求。
總的來說我理解一般使用長輪詢會(huì)更多一點(diǎn),短輪詢更加看重的是編程簡單,適合小型應(yīng)用。像微信網(wǎng)頁端登錄這種,成千上萬個(gè)用戶同時(shí)登陸,隔一段時(shí)間服務(wù)端收成千上個(gè)請求去處理哪里受得了,堆機(jī)器分?jǐn)偯颗_(tái)服務(wù)器上處理請求的數(shù)量終究不是解決問題的辦法。
websocket
上面介紹了兩種輪詢方式,但是兩種綜合起來都有比較明顯的缺點(diǎn),總結(jié)起來有以下幾個(gè):
- 偽實(shí)時(shí),即上述兩種方式都不是真正的實(shí)時(shí),無論短輪詢的客戶端輪詢時(shí)間多短,還是長輪詢的服務(wù)端輪詢時(shí)間多短,都存在一定程度的延時(shí)
- 所有的輪詢只要沒有需要的數(shù)據(jù)返回,都是對(duì)計(jì)算資源的一種浪費(fèi)
- http協(xié)議本身是一個(gè)重的協(xié)議,每一次都必須帶有http首部+http頭部,實(shí)際上對(duì)我們來說需要的只是http body而已,多余的數(shù)據(jù)都是對(duì)帶寬的一種浪費(fèi)
因此,最好我們可以做到的事情是:客戶端和服務(wù)端之間有一條通路,當(dāng)服務(wù)端數(shù)據(jù)有變化的時(shí)候,服務(wù)端可以主動(dòng)推送到客戶端。websocket就是html5之后為了做到這一點(diǎn)而誕生的一種協(xié)議,雖然這是一種新的協(xié)議,但也是基于http協(xié)議的。
看一下websocket的原理,很簡單:
websocket客戶端首先通過http協(xié)議發(fā)送幾個(gè)特別的header到服務(wù)端,告訴服務(wù)端現(xiàn)在我發(fā)起的是http請求,但我要升級(jí)到websocket了:
- upgrade:websocket
- connection:upgrade
- sec-websocket-key: xxx
- sec-websocket-protocol: chat, superchat
- sec-websocket-version: xx
只要服務(wù)器支持websocket協(xié)議(tomcat7、jetty7之后都是支持websocket的),那么服務(wù)端收到請求且建立連接成功后會(huì)返回sec-websocket-accept、sec-websocket-protocol這兩個(gè)header給客戶端,且http status為101表示協(xié)議切換成功,這樣客戶端和服務(wù)端只要任意一方?jīng)]有斷開連接,就可以基于這一條通路進(jìn)行通訊了。
再談一下之前提的websocket相比長短輪詢對(duì)于帶寬資源的節(jié)省。有一個(gè)測試,假設(shè)http header是871字節(jié),websocket由于數(shù)據(jù)傳輸是基于幀的,幀傳輸更加高效,對(duì)比長短輪詢,2個(gè)字節(jié)即可代替871個(gè)字節(jié)的header,測試結(jié)果為:
相同的每秒客戶端輪詢的次數(shù),當(dāng)次數(shù)高達(dá)10w/s的高頻率次數(shù)的時(shí)候,輪詢需要消耗665mbps,而websocket僅僅只花費(fèi)了1.526mbps,將近435倍。
websocket做到了真正的實(shí)時(shí)且大量節(jié)省帶寬資源,但是我理解也有自己的問題,就是開發(fā)成本比較高,這里的開發(fā)成本倒不是說自己去實(shí)現(xiàn)websocket,這個(gè)在java語言層面上直接使用netty-socketio即可,api很簡單,提供了對(duì)websocket完整的實(shí)現(xiàn),真正的開發(fā)成本在于分布式環(huán)境下的數(shù)據(jù)同步問題。
舉個(gè)例子,有一個(gè)在線聊天系統(tǒng)10w人同時(shí)在線,此時(shí)有一個(gè)用戶發(fā)了一條1k的語音消息,單機(jī)保持10w的連接倒是可以(這里不是http請求,因此不受連接池?cái)?shù)影響),問題在于帶寬。單機(jī)同時(shí)向10w用戶推送1k語音消息,需要的帶寬至少10m,這還只是純粹推送數(shù)據(jù)出去,沒有考慮到數(shù)據(jù)進(jìn)來的場景,實(shí)際運(yùn)行過程中需要的帶寬會(huì)更多,對(duì)于企業(yè)來說這是一筆非常大的成本。
因此,大量連接的場景下都會(huì)做集群(實(shí)際就算沒有大量連接,為了高可用性,也會(huì)做集群),10w并發(fā)分出5臺(tái)機(jī)器,平均每臺(tái)機(jī)器有2w連接,考慮集群下會(huì)出現(xiàn)的問題:
客戶端1把數(shù)據(jù)發(fā)送到服務(wù)器1,服務(wù)器1連接的所有客戶端都可以推送該條語音,但是問題在于:
- 服務(wù)器2~服務(wù)器5連的所有客戶端如何拿到數(shù)據(jù)?簡單的一種方式是使用消息隊(duì)列,將數(shù)據(jù)通過消息隊(duì)列發(fā)送到所有訂閱的服務(wù)器上
- 那如果傳輸?shù)氖且粡?m的圖片,數(shù)據(jù)太大不適合使用消息隊(duì)列怎么辦,可以先將數(shù)據(jù)存儲(chǔ)下來,消息隊(duì)列只發(fā)送id,收到消息的服務(wù)器再根據(jù)id去取真正的數(shù)據(jù)并推送
- 如果依賴消息隊(duì)列,那么不僅僅需要對(duì)應(yīng)用進(jìn)行代碼開發(fā),還需要對(duì)消息服務(wù)器做分布式集群、做壓力測試,保證高可用
- 2w連接正常預(yù)計(jì)發(fā)送1k的消息是沒問題的,但是萬一用戶發(fā)送了1m圖片導(dǎo)致遠(yuǎn)超預(yù)估帶寬怎么辦,是業(yè)務(wù)上取舍不能發(fā)送超過xxx的數(shù)據(jù)還是技術(shù)上處理
其他太多需要考慮的問題沒有列出來,總而言之,用websocket在大量請求、高并發(fā)的場景下,代碼開發(fā)成本是非常高的。但是由于websocket可以做到真正的實(shí)時(shí)服務(wù)端對(duì)客戶端的數(shù)據(jù)推送且對(duì)帶寬資源有大量的節(jié)省,因此很多im、音視頻、彈幕等應(yīng)用都會(huì)使用websocket。
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,如果有疑問大家可以留言交流,謝謝大家對(duì)服務(wù)器之家的支持。
原文鏈接:https://www.cnblogs.com/xrq730/p/9280404.html