一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

腳本之家,腳本語言編程技術及教程分享平臺!
分類導航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服務器之家 - 腳本之家 - Python - Python爬蟲數據的分類及json數據使用小結

Python爬蟲數據的分類及json數據使用小結

2021-09-29 00:07初來碼農 Python

這篇文章主要介紹了Python爬蟲數據的分類及json數據使用小結,幫助大家更好的理解和學習使用python,感興趣的朋友可以了解下

數據的結構化分類

       一般來講對我們而言,需要抓取的是某個網站或者某個應用的內容,提取有用的價值。內容一般分為三部分,結構化的數據、半結構化的數據和非機構化數據。
1.結構化數據:
       可以用統一的結構加以表示的數據。可以使用關系型數據庫表示和存儲,表現為二維形式的數據,一般特點是:數據以行為單位,一行數據表示一個實體的信息,每一行的數據的屬性是相同的。
2.半結構化數據:
       結構化數據的一種形式,并不符合關系型數據庫或其他數據表的形式關聯起來的數據模型結構,但包含相關標記,用來分隔語義元素以及對記錄和字段進行分層。因此他也被成為自描述的結構。常見的半結構數據有:html,xml和json等、實際上是以樹或者圖的結構來存儲的。
       對于半結構化數據,節點中屬性的順序是不重要的,不同的半結構化數據的屬性的個數是不一樣的。這樣的數據格式,可以自由的表達很多有用的信息,包含自描述信息。所以半結構化數據的擴展性很好,特別適合于在互聯網中大規模傳播。
3.非結構化數據
       就是沒有固定的結構。各種文檔,圖片,視頻或者音頻都屬于非結構化數據。對于這類數據,我們一般直接整體進行存儲,而且一般存儲為二進制形式。

json數據

       json(javascript object notation,js對象標記)是一種輕量級的數據交換格式。他基于ecmascript(w3c制定的js規范)的一個子集,采用完全獨立于編程語言的文本格式來存儲和表示數據。簡介和清晰的層次結構使得json成為理想的數據交換語言。
       特點:易于閱讀、易于機器生成、有效提升網絡速度。
       json語法規則:在js語言中,一切都是對象。因此,任何支持的類型都可以通過json來表示。例如字符串、數字,對象,數組。
js中對象和數組是比較特殊并且常用的兩種類型:
       1.對象表示為鍵值對{name:'zhangsan',age:'7'}
       2.數據有逗號分隔[1,2,3,4,5]
       3.花括號保存對象
       4.方括號保存數組。
js的對象就相當于python中的字典
js的數組就相當于python中的列表
       因為json用來存儲js的對象或者數組,所以在python中我們可以將json轉化為list或者dict。

解析json的包json:

       json.dumps(python的list或者dict)---->(返回值)---->json字符串。
       json.loads(json字符串)------>(返回值)----->python的list或者dict.

       json.dump(list/dict,fp)—>list,或者字典保存到json文件中。
       json.load(fp)—>list/dict:從json文件中讀出json數據。

       json鍵值對是用來保存js對象的一種方式,和js對象的寫法頁大同小異,比如:
{“firstname”:“json”,“class”:“aid1111”}等價于下面這條js語句:{firstname:“json”,class:“aid1111”}。
       很多人搞不清楚json和js對象的關系,甚至誰是誰都不清楚。其實可以這么理解:【json是js對象的字符串表達式,他使用文本形式表示一個js對象的信息,本質是一個字符串。】
       如var obj = {a:“hello”,b:“world”}這是一個js對象。注意,鍵名也是可以用引號包裹的var json = ' {“a”:“hello”,“b”:“world”}'這是一個json字符串,本質上是一個字符串。
       json作為數據包格式傳輸的時候具有更高的效率,這是因為json不想xml那樣具有嚴格的閉合標簽,這就讓有效數據量與總數據包比大大提升,從而減少同等數據流量的情況下,網絡的傳輸的壓力大大減低。

以上就是python爬蟲數據的分類及json數據使用小結的詳細內容,更多關于python爬蟲數據的分類及json數據使用的資料請關注服務器之家其它相關文章!

原文鏈接:https://blog.csdn.net/weixin_44540951/article/details/102806739

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 午夜亚洲 | 91大神第九部红酒气质女 | 青草视频在线观看免费网站 | 国产成人8x视频一区二区 | 欧美成人手机 | 国产卡一卡二卡三乱码手机 | 波多野结衣178部中文字幕 | 4455四色永久免费 | 男人天堂网在线 | 欧美日韩一区二区三区免费 | 涩涩屋在线播放 | 九九精品国产兔费观看久久 | 波多野结衣久久国产精品 | 欧美视频精品一区二区三区 | 国产经典一区 | 久久久无码精品亚洲欧美 | 北条麻妃黑人正在播放 | 九九热在线视频观看这里只有精品 | 2021年国内自拍 | 午夜一个人在线观看完整版 | 国产123区| 7788理论片在线观看 | 日本人黄色| 国产亚洲精品激情一区二区三区 | 国产精品高清视亚洲一区二区 | www.俺去啦| 亚洲天堂男人 | 欧美色阁 | 青青色综合 | 农夫69小说小雨与农村老太 | 四虎免费影院在线播放 | 久热人人综合人人九九精品视频 | 小sao货水好多真紧h的视频 | 青草国产 | 亚洲欧美日韩综合在线播放 | 99国产精品免费视频 | 色综合综合色 | 四虎影院在线免费播放 | 欧美大陆日韩一区二区三区 | 九九九九在线精品免费视频 | 国产精品久久久久久影视 |