色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

<table id="go48y"><tbody id="go48y"></tbody></table>

<table id="go48y"><small id="go48y"></small></table>

<table id="go48y"></table>

<center id="go48y"></center>

登錄注冊寫文章

python爬取王者榮耀英雄的背景故事

python愛好者Anny

python爬取王者榮耀英雄的背景故事

文章目錄

前言

目標數據源分析

代碼實現過程

1、代碼框架

2、獲取英雄編號及名稱數據

3、獲取英雄故事數據

完整代碼

我只用了四個函數，《王者榮耀》就把每個英雄的背景故事遞給了我

前言

學習爬蟲，以下內容要學習：

成功安裝了Python環(huán)境，這里我使用的是python 3.9

能夠熟練掌握一種IDE，這里我使用的是Pycharm

能夠熟練地安裝第三方庫，如requests庫，但不限于此

能夠掌握一些python的基礎語法知識

能夠養(yǎng)成遇到問題，多思考、多百度的習慣

目標數據源分析

目標地址：

目標地址1：https://pvp.qq.com/web201605/herolist.shtml

目標網址2：https://pvp.qq.com/web201605/herodetail/{英雄編號}.shtml

爬取目標：

全部王者英雄的英雄故事！

用到的基礎庫：

import os

import re?

import bs4

import requests

import chardet? # 可選，可不選

import logging? # 可選，可不選

代碼實現過程

1、代碼框架

先看一下代碼的整體結構：

這里我定義了三個全局變量，如果放到主函數里，可以使框架更清晰。

2、獲取英雄編號及名稱數據

首先，進入王者榮耀官網：https://pvp.qq.com/

按照以下步驟打開一個新的頁面，得到第一個目標網址。

接著，進行第一個內容的爬取，英雄的名稱和編號：

那我首先要知道，這個東西在哪，對不對？

如圖所示（本來錄的GIF，結果放不出來）：

再點擊一下，便可以得到想要的URL

此處代碼需要掌握的知識有：

requests庫，re模塊，正則表達式

import re

import requests

headers = {

'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/'

? ? ? ? ? ? ? '537.36 (KHTML, like Gecko) Chrome/91.0.4472.164 Safari/537.36'

}

#? 獲取英雄名稱及對應編號

def get_hero_num(url):

? ? response = requests.get(url=url, headers=headers).text

? ? hero_list = re.findall('"ename": (.+?),', response, re.S)? # 得到英雄的編號列表

? ? hero_name = re.findall('"cname": "(.+?)"', response, re.S)? # 得到英雄的名字列表

? ? return hero_name, hero_list

def main():

? ? url = 'https://pvp.qq.com/web201605/js/herolist.json'

? ? hero_name, hero_list = get_hero_num(url)

? ? print('英雄名稱為：\n', hero_name)

? ? print('英雄編號為：\n', hero_list)

是可以成功獲取的。

3、獲取英雄故事數據

將英雄的編號，填入目標網址2對應的英雄編號處：

https://pvp.qq.com/web201605/herodetail/{英雄編號}.shtml

然后就訪問這個頁面咯（先用新英雄云纓試一下，對應編號為538）

此處代碼需要掌握的知識有：

requests庫，bs4庫，chardet庫（可選，但建議學一下）

? ? url = 'https://pvp.qq.com/web201605/herodetail/538.shtml'# 進入英雄詳細頁面的鏈接

? ? res = requests.get(url=url, headers=headers)

? ? res.encoding = chardet.detect(res.content)['encoding']? # 統(tǒng)一字符編碼，解決亂碼問題

? ? res = res.text

? ? print(res)

你看，這不就得到了嗎

下面就是對這部分的數據進行清洗。

也很簡單，利用“美麗的湯”–BeautifulSoup庫，在上述代碼加上這三句：

? ? soup = bs4.BeautifulSoup(res, 'html.parser')

? ? story = soup.select('.pop-bd')[0].text

? ? print(story)

蕪湖，這樣就可以得到了

故事的展現有點問題，但影響不大，一會再優(yōu)化。

完整代碼

我對上面代碼加了一點點，改動，并沒有一次性爬取所有的英雄的故事，而是根據用戶的輸入進行指定爬取。

貼上結果先，嘻嘻~

代碼如下：

# -*- coding: UTF-8 -*-

# @Time: 2021/7/18 18:08

# @Author: 遠方的星

# @CSDN: https://blog.csdn.net/qq_44921056

import os

import re

import bs4

import requests

import chardet

import logging

# 日志輸出的基本配置

logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s: %(message)s')

# 創(chuàng)建一個文件夾

path = './王者故事'

if not os.path.exists(path):

? ? os.mkdir(path)

headers = {

'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/'

? ? ? ? ? ? ? '537.36 (KHTML, like Gecko) Chrome/91.0.4472.164 Safari/537.36'

}

#? 獲取英雄名稱及對應編號

def get_hero_num(url, hero_dream):

? ? response = requests.get(url=url, headers=headers).text

? ? # print(response)

? ? hero_list = re.findall('"ename": (.+?),', response, re.S)? # 得到英雄的編號列表

? ? hero_name = re.findall('"cname": "(.+?)"', response, re.S)? # 得到英雄的名字列表

? ? hero_num = hero_name.index(hero_dream)

? ? num = hero_list[hero_num]? # 得到英雄序號

? ? return num

#? 根據編號獲取英雄背景故事

def get_story(num):

? ? url = 'https://pvp.qq.com/web201605/herodetail/{}.shtml'.format(num)? # 進入英雄詳細頁面的鏈接

? ? res = requests.get(url=url, headers=headers)

? ? res.encoding = chardet.detect(res.content)['encoding']? # 統(tǒng)一字符編碼，解決亂碼問題

? ? res = res.text

? ? soup = bs4.BeautifulSoup(res, 'html.parser')

? ? story = soup.select('.pop-bd')[0].text? # 虛擬故事段

? ? story = story.replace(' ', '\n').replace('”', '\n').replace(' ', '')

? ? story = story.encode(encoding='utf-8')

? ? return story

#? 下載故事

def download(hero_dream, story):? # 下載函數

? ? file_name = hero_dream+'.txt'

? ? file_path = path + '/' + file_name

? ? with open(file_path, 'wb') as f:

? ? ? ? f.write(story)

? ? ? ? logging.info('{}的故事已經下載完成啦！感謝您的使用~')

? ? ? ? f.close()

def main():

? ? hero_dream = input("請輸入你想查看的英雄故事：")

? ? url = 'https://pvp.qq.com/web201605/js/herolist.json'

? ? num = get_hero_num(url, hero_dream)

? ? story = get_story(num)

? ? download(hero_dream, story)

if __name__ == '__main__':

? ? main()

希望能對你有所幫助~~~

?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成，瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發(fā)布，文章內容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務。

相關閱讀更多精彩內容

Python下載王者榮耀英雄背景圖片
我玩了三年的王者榮耀，打了三千多場，依然沒有上過王者，究其因，還是因為太菜,可以說菜到了極致，所以大叔也就變得佛系...
上班只為摸魚閱讀 478評論 0贊 0
20行Python代碼爬取王者榮耀全英雄皮膚
引言王者榮耀大家都玩過吧，沒玩過的也應該聽說過，作為時下最火的手機MOBA游戲，咳咳，好像跑題了。我們今天的重點...
wangweijun閱讀 624評論 0贊 1

送你一個晚安故事
我是黑夜里大雨紛飛的人啊 1 “又到一年六月，有人笑有人哭，有人歡樂有人憂愁，有人驚喜有人失落，有的覺得收獲滿滿有...
陌忘宇閱讀 8,898評論 28贊 54
信任重要性
信任包括信任自己和信任他人很多時候，很多事情，失敗、遺憾、錯過，源于不自信，不信任他人覺得自己做不成，別人做不...
吳氵晃閱讀 6,392評論 4贊 8
學習HM微博項目第8天
步驟：發(fā)微博01-導航欄內容 -> 發(fā)微博02-自定義TextView -> 發(fā)微博03-完善TextView和...
dibadalu閱讀 3,430評論 1贊 3

友情鏈接更多精彩內容

1贊2贊

贊賞

手機看全文

望奎县| 铜梁县| 藁城市| 方山县| 修水县| 通化市| 花莲县| 宾阳县| 哈巴河县| 吉木乃县| 云阳县| 余干县| 阿拉善右旗| 苏尼特右旗| 富宁县| 定襄县| 增城市| 锡林浩特市| 岳阳县| 太白县| 洛浦县| 梨树县| 西吉县| 林芝县| 咸丰县| 马鞍山市| 济南市| 札达县| 南丰县| 田林县| 香河县| 湖北省| 玛沁县| 兴化市| 盐津县| 佛坪县| 峨眉山市| 江达县| 济源市| 安陆市| 分宜县|

<acronym id="wqc4m"></acronym>

<samp id="wqc4m"></samp>