《圖解HTTP》學習筆記(三):HTTP報文內(nèi)的HTTP信息

HTTP報文

  • 用于HTTP協(xié)議交互的信息被稱作為HTTP報文。請求端和服務端分別被叫做請求報文和響應報文。HTTP報文由報文首部和報文主體組成,首部和主體之間由【CR+LF】換行分割,一個HTTP報文不一定需要報文主體。

  • 請求報文首部:請求行、請求首部字段、通用首部字段、實體首部字段、其他。

  • 響應報文首部:狀態(tài)行、響應首部字段、通用首部字段、實體首部字段、其他。

  • 請求報文:

    GET / HTTP/1.1  --請求行
    Host:www.baidu.com
    User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36
    Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8
    Accept-Language:zh-CN,zh;q=0.8,en;q=0.6
    Accept-Encoding:gzip, deflate, br
    Upgrade-Insecure-Requests:1
    Cache-Control:max-age=0
    Connection:keep-alive                --各種首部字段
    (CR-LF) --空行
    
  • 響應報文:

    HTTP/1.1 200 OK -- 狀態(tài)行
    Bdpagetype:2
    Bdqid:0xb377d200000097b1
    Bduserid:1270621848
    Cache-Control:private
    Connection:Keep-Alive
    Content-Encoding:gzip
    Content-Type:text/html;charset=utf-8
    Date:Wed, 18 Oct 2017 05:57:28 GMT
    Expires:Wed, 18 Oct 2017 05:57:28 GMT
    Server:BWS/1.1
    Set-Cookie:BDSVRTM=187; path=/
    Set-Cookie:BD_HOME=1; path=/
    Set-Cookie:H_PS_PSSID=1450_21119_20929; path=/; domain=.baidu.com
    Strict-Transport-Security:max-age=172800
    Transfer-Encoding:chunked
    X-Ua-Compatible:IE=Edge,chrome=1    -- 各種首部字段
    (CR-LF) -- 空行
    <!Doctype html>
    <html xmlns=http://www.w3.org/1999/xhtml>
    <head>
    ...                                 -- 響應主體
    
  • 請求報文和響應報文的首部內(nèi)容由以下數(shù)據(jù)組成:

    • 請求行: 包含用于請求的方法,請求的URI和HTTP版本
    • 狀態(tài)行: 包含表面闡述響應結果的狀態(tài)碼,原因短語和HTTP版本
    • 首部字段:包含表示請求和響應結果的各種條件和屬性的各類首部。一般有4中首部,分別是:通用首部、請求首部、響應首部、實體首部。
    • 其他: 可能包含HTTP的RFC里沒有定義的首部(Cookie等)。
  • 編碼提升傳輸效率

    通過在傳輸時編碼,能有效地處理大量的訪問請求。但是,編碼的操作需要計算機來完成,因此會消耗更多的CPU等資源。

    • 報文主體和實體主體的差異

      • 報文

        是HTTP通信中的基本你單位,由8位字節(jié)流組成,通過HTTP通信傳輸。

      • 實體

        作為請求或響應的有效載荷數(shù)據(jù)被傳輸,其內(nèi)容由實體首部和實體主體組成。

      HTTP報文的主體用于傳輸請求或響應的實體主體。

      通常,報文主體等于實體主體,只有在傳輸中進行編碼操作,實體主體的內(nèi)容會發(fā)生變化,才導致它和報文主體產(chǎn)生差異。

  • 壓縮傳輸?shù)膬?nèi)容編碼

    HTTP協(xié)議中有一種被稱為內(nèi)容編碼的功能也能進行類型的操作,內(nèi)容編碼指明應用在實體內(nèi)容上的編碼格式,并保持實體信息原樣壓縮。內(nèi)容編碼后的實體由客戶端接收并負責解碼。

    • 壓縮并解碼.png

常用的內(nèi)容編碼有以下幾種

  • gzip(GNU zip)

  • compress (UNIX 系統(tǒng)的標準壓縮)

  • deflate (zlib)

  • identity (不進行編碼)

  • 分割發(fā)送的分塊傳輸編碼

    • 分塊編碼傳輸.png

在HTTP通信過程中,請求的編碼實體在沒有全部傳輸完成之前,瀏覽器是無法顯示請求頁面的。所以在傳輸大量數(shù)據(jù)時,通常會把數(shù)據(jù)分割成多塊。將這種技術稱為 分塊傳輸編碼。

使用分塊傳輸編碼的實體主體會由接收的客戶端負責解碼,恢復到編碼前的實體主體。

  • 發(fā)送多種數(shù)據(jù)的多部分對象集合

    發(fā)送郵件時,我們可以在郵件里寫入文字并添加多發(fā)附件。這是因為采用了MIME(Multipurpose Internet Mail Extensions,多用途因特網(wǎng)郵件擴展)機制,它允許郵件處理文本、圖片、視頻等多個不同類型的數(shù)據(jù)。

    HTTP協(xié)議中也采納了多部分對象集合,發(fā)送的一份報文主體內(nèi)可含多類型實體。通常是在圖片或文本文件等上傳時使用。

    多部分對象集合包含的對象如下:

    • multipart/form-data

      在Web表單文件上傳使用

    • multipart/byteranges

      狀態(tài)碼206響應報文包含了多個范圍的內(nèi)容時使用。

    • multipart/form-data

      Content-Type: multipart/form-data; boundary=AaB03x
      --AaB03x
      Content-Disposition: form-data; name="field1"
      Joe Blow
      --AaB03x
      Content-Disposition: form-data; name="pics"; filename="file1.txt"
      Content-Type: text/plain
      ...(file1.txt的數(shù)據(jù))...
      --AaB03x--
      
    • multipart/byteranges

      HTTP/1.1 206 Partial Content
      Date: Fri, 13 Jul 2012 02:45:26 GMT
      Last-Modified: Fri, 31 Aug 2007 02:02:20 GMT
      Content-Type: multipart/byteranges; boundary=THIS_STRING_SEPARATES
      --THIS_STRING_SEPARATES
      Content-Type: application/pdf
      Content-Range: bytes 500-999/8000
      ...(范圍指定的數(shù)據(jù))...
      --THIS_STRING_SEPARATES
      Content-Type: application/pdf
      Content-Range: bytes 7000-7999/8000
      ...(范圍指定的數(shù)據(jù))...
      --THIS_STRING_SEPARATES--
      
  • 獲取部分內(nèi)容的范圍請求

    以前的用戶帶寬不夠,下載一個尺寸稍大的圖片或者文件就會很吃力。如果下載過程中遇到網(wǎng)絡問題中斷了下載,那么就需要從頭開始。為了解決上述問題,就產(chǎn)生了一種叫范圍請求的功能。

    對于一份10000字節(jié)大小的資源,如果使用范圍請求,可以只請求5001~10000字節(jié)內(nèi)的資源。

    • 范圍請求.png

執(zhí)行范圍請求時,會用到首部字段Range來指定資源的byte范圍:

Range: bytes=5001-10000 // 5001-10000字節(jié)之間
Range: bytes=5001- // 從5001字節(jié)之后全部
Range: bytes=1-3000,5000-10000 // 多范圍指定

針對范圍請求,響應會返回206狀態(tài)碼。對于多重范圍請求,響應會在首部字段Content-Type表明multipart/byteranges后返回響應報文

如果服務端無法響應范圍請求,則會返回狀態(tài)碼200 OK然后返回完整的實體內(nèi)容。

github 歡迎Star,歡迎討論

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容