web 容器的設計
開發(fā)一個web容器涉及很多不同方面不同層面的技術,例如通信層的知識,程序語言層面的知識等等,且一個可用的web容器是一個比較龐大的系統(tǒng),要說清楚需要很長的篇幅,本文旨在介紹如何設計一個web容器,只探討實現(xiàn)的思路,并不涉及過多的具體實現(xiàn)。把它分解劃分成若干模塊和組件,每個組件模塊負責不同的功能,下圖列出一些基本的組件,并將對每個組件進行介紹。
連接接收器
主要的職責就是監(jiān)聽是否有客戶端套接字連接并接收socket,再將socket交由任務執(zhí)行器(線程池)執(zhí)行。不斷從系統(tǒng)底層讀取socket,做盡可能少的處理,再扔進線程池。為什么強調要做盡可能少的處理?這里關系到系統(tǒng)性能問題,過多的處理會嚴重影響吞吐量。因為一般只有一個接收器(一條線程負責套接字接收工作),所以它對每次接收處理的時間長短將很可能對整體性能產生影響。于是接收器所干的活都是非常少且簡單的,僅僅維護了幾個狀態(tài)變量、流量控制閘門的累加操作、serversocket的接收操作、設置接收到的socket的一些屬性、將接收到的socket放入線程池以及一些異常處理。其他需要較長時間處理的邏輯就交給了線程池,例如對socket底層數(shù)據(jù)的讀取,對http協(xié)議報文的解析及響應客戶端的一些操作等等。
連接數(shù)控制器
對于一臺機器而言,訪問請求的總流量有高峰期且服務器有物理極限,為了保證web服務器不被沖垮我們需要采取一些措施進行保護預防,需要稍微說明的此處的流量更多的是指套接字的連接數(shù),通過控制套接字連接個數(shù)來控制流量。其中一種有效的方法就是采取流量控制,它就像在流量的入口增加了一道閘門,閘門的大小決定了流量的大小,一旦達到最大流量將關閉閘門停止接收直到有空閑通道。計數(shù)器可用jdk的aqs框架實現(xiàn)。
套接字工廠
不同的使用場合可能需要不同的安全級別,例如在支付相關的交易就必須對信息加密后再發(fā)送,這其中還涉及到密鑰協(xié)商的過程,而在另外一些普通場合則無需對報文加密。反應到應用層則是使用http與https的問題。
簡單講tls\ssl協(xié)議給每次通信①提供認證服務,認證本次會話實體身份的合法性。②提供加密服務,強加密機制能保證通信過程中的消息不會被破譯。③提供防篡改服務,利用hash算法對消息進行簽名,通過驗證簽名保證通信內容不被篡改。
http協(xié)議對應socket,而https則對應sslsocket。如何生成socket及sslsocket則交由套接字工廠。
任務定義器——task
定義需要執(zhí)行的任務,告訴線程池要執(zhí)行什么樣的任務。任務主要分為三點:處理socket并響應客戶端、連接數(shù)計數(shù)器減一、關閉socket。其中對socket的處理是最重要也是最復雜的,它包括對底層socket字節(jié)流的讀取、http協(xié)議請求報文的解析(請求行、請求頭、請求體等信息的解析)、根據(jù)請求行解析得到路徑去尋找相應主機上web項目的資源、根據(jù)處理的結果組裝好http協(xié)議響應報文輸出到客戶端。
任務執(zhí)行器
一個擁有最大最小線程數(shù)限制的線程池,之所以稱之為“任務執(zhí)行器”是因為線程池可以看做是啟動了若干線程不斷檢測某個任務隊列,一旦發(fā)現(xiàn)有需要執(zhí)行的任務則執(zhí)行。最大最小線程數(shù)限制、多余線程回收時間限制、超出最大線程數(shù)時線程池做出的拒絕動作等等。
報文讀取
用于向操作系統(tǒng)底層讀取來自客戶端的報文并提供緩沖機制。報文復制到desbuf。
報文輸出
用于向操作系統(tǒng)底層寫入由web容器處理后的報文并提供緩沖機制。將報文outputbuf通過緩沖區(qū)寫入到操作系統(tǒng)。
輸入過濾器
在這個讀取的過程中希望做一些額外的處理,并且這些額外處理可能是根據(jù)不同條件做不同的處理,考慮到程序解耦與擴展,于是引入過濾器。通過一層層的過濾器完成過濾操作后才能到desbuf,這個過程就像被加入了一道道處理關卡,經(jīng)過關卡都會被執(zhí)行相應操作,最終完成源數(shù)據(jù)到目的數(shù)據(jù)的操作。
輸出過濾器
與輸入過濾器功能類似,用于在報文輸出的時候。
報文解析器
提供解析http協(xié)議各個部分的能力。
請求生成器
按照面向對象的思想,把每個請求過程中與請求相關的屬性及協(xié)議字段等抽象成一個request對象。包括請求行、請求頭、請求體三部分信息,在處理過程中需要什么值可直接從request對象中獲取。為實現(xiàn)servlet標準提供方便。
響應生成器
與請求相對應,需要一個響應對象生成器。包括響應行、響應頭、響應體三部分信息,在處理結果相關值可直接設置到response對象中。為實現(xiàn)servlet標準提供方便。
地址映射器
地址映射器是請求與各個web項目、各個資源的路由器。一個請求的訪問根據(jù)路徑被映射找到響應的資源輸出給請求客戶端。
生命周期
為了進一步模塊化,整個容器擁有很多組件,這些組件可能在不同的時刻需要做不同的事件,需要一個生命周期統(tǒng)一把所有組件管理起來。例如所有組件的啟動、停止、關閉等操作都抽離由生命周期統(tǒng)一管理,就可以方便管理這些組件的生命周期。希望在某某狀態(tài)事情發(fā)生之前之后做點什么?添加一個生命周期監(jiān)聽器即可優(yōu)雅實現(xiàn)。
jmx管理器
系統(tǒng)運行狀態(tài)的監(jiān)控及管理,服務器性能、服務器相關參數(shù)的收集、jvm負載、web連接數(shù)、線程池、數(shù)據(jù)庫連接池、緩存管理、配置文件重新加載等方面。可提供一些遠程可視化管理,實時性高。同時也為分布式系統(tǒng)的管理提供了一個解決方案。
web載入器
webloader用于加載web應用項目,一個web容器可能包含了若干個web應用。為了達到lib及servlet的隔離,對于每個web應用要使用不同的類加載器classloader,且這些類加載器不是父子關系,以此達到class隔離效果,即一個web應用的lib不會被其他web應用使用。
會話管理器
會話管理器主要對session進行管理,包括:①生成sessionid,一般cookies或url未帶jsessionid值則認為不存在會話,需要重新生成sessionid用作會話id。②很多客戶端的會話都保存在服務器中,對于超時的會話要定期清理以確保服務器內存不會浪費。③對于一些重要的會話可以持久化到磁盤,需要時可重新加載到內存中使用。
運行日志
對運行時一些警告、異常、錯誤進行記錄。
訪問日志
訪問日志一般會記錄客戶端的訪問相關信息,包括客戶端ip、請求時間、請求協(xié)議、請求方法、請求字節(jié)數(shù)、響應碼、會話id、處理時間等等。訪問日志可以統(tǒng)計訪問用戶的數(shù)量、訪問時間分布等規(guī)律及個人愛好等等,這些數(shù)據(jù)可以幫助公司在運營策略上做出抉擇。
安全管理器
web項目運行在web容器平臺上,這就好比將一個應用嵌入到一個平臺上面運行,要使嵌入的程序能正常運行,首先平臺要能安全正常運行。并且要最大程度做到平臺不受嵌入的應用程序影響,兩者在一定程度上達到隔離的效果。啟動時通過-djava.security.manager -djava.security.policy==web.policy指定policy文件,此文件定義了各種權限。
運行監(jiān)控&遠程管理
提供一個可以實時監(jiān)控web容器運行狀態(tài)的平臺,并且能進行遠程管理。
集群
集群一般有兩種:①負載均衡集群,一般是通過一定的分發(fā)算法把訪問流量均勻分布到集群里面的各個機器上進行處理。②高可用集群,集群通信把若干機器連接起來,這種集群更偏重的是當集群中某個機器發(fā)生故障后能通過自動切換或流量轉移等措施來保證整個集群對外的可用性。
web一般請求都是無狀態(tài),可以直接做集群,但涉及session則屬于有狀態(tài),需要使用集群通信技術進行session拷貝。相關技術包括組播、單播。
servlet引擎
servlet引擎利用反射把web應用中的servlet及jsp生成對象并放入servlet對象池中,并根據(jù)實際調用相應的方法。web應用將業(yè)務邏輯處理都放在dopost或doget方法中,web容器處理請求時就會按照這里定義好的處理邏輯進行處理,處理完響應客戶端。
jsp編譯器
按照規(guī)范jsp最終都是被編譯成servlet執(zhí)行,所以要按照規(guī)范對jsp文件進行編譯。jsp編譯器其實就是對jsp語法進行翻譯,根據(jù)jsp語法處理。
一個web容器基本包含以上介紹的組件的功能,根據(jù)各個組件模塊進行實現(xiàn)即可搭建起一個可以讓你的web運行起來的web容器。
感謝閱讀,希望能幫助到大家,謝謝大家對服務器之家的支持!
原文鏈接:http://blog.csdn.net/wangyangzhizhou/article/details/50662125