爬蟲(chóng)交流:base64解碼查看(UVEyODkxNTkwNTc4)小紅書(shū)爬蟲(chóng)評(píng)論爬蟲(chóng)app爬蟲(chóng)數(shù)據(jù)爬取
數(shù)據(jù)抓取
該產(chǎn)品搜索沒(méi)有web端口子,只能抓取APP或小程序,作者抓取了微信小程序的前五十頁(yè)點(diǎn)贊最高的【軟糖】筆記作為數(shù)據(jù)分析數(shù)據(jù),共抓取2208條筆記數(shù)據(jù);
數(shù)據(jù)展示:

圖片.png
數(shù)據(jù)分析
通過(guò)自然語(yǔ)言處理從筆記中抽取了使用場(chǎng)景、使用人群、地域分布、成分包含、營(yíng)養(yǎng)成分、最好不包含成分等數(shù)據(jù)維度。
def draw_bar(keys, values, titile, subtitle='共2208條筆記'):
bar1=(
Bar(init_opts=opts.InitOpts(
))
.add_xaxis(keys)
.add_yaxis('數(shù)量'##系列的名稱(chēng)
,values,
) ##系列的數(shù)值
.set_global_opts(title_opts=opts.TitleOpts(
title=titile,
subtitle=subtitle
,item_gap=10#主副標(biāo)題之間的距離
,title_textstyle_opts=opts.TextStyleOpts(
font_size=20
,font_weight='bold'
)
,subtitle_textstyle_opts=opts.TextStyleOpts(
font_style='normal'
,font_weight='normal'
,font_family= 'monospace'
,font_size=15
,background_color='grey'
,border_color='black'
)
),
xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=40))
)
)
return bar1
def pie_base() -> Pie:
c = (
Pie()
.add("", [list(z) for z in zip(list(data.keys())[:-4], list(data.values())[:-4])], center=['50%','60%'],radius=["45%", "80%"])
.set_global_opts(title_opts=opts.TitleOpts(title="營(yíng)養(yǎng)成分-某紅書(shū)", subtitle='共2208條筆記'),
legend_opts=opts.LegendOpts(pos_left='right', orient='vertical',))
.set_series_opts(label_opts=opts.LabelOpts(formatter=":u0z1t8os%"))
)
return c
pie_base().render_notebook()

圖片.png

圖片.png

圖片.png

圖片.png

圖片.png

圖片.png
市場(chǎng)分析
目前來(lái)看,我國(guó)功能性軟糖市場(chǎng)仍處于發(fā)展階段,消費(fèi)者還是對(duì)酸、甜口味的軟糖情有獨(dú)鐘;
不希望在軟糖中添加脂肪、香精等成分;
維生素、鐵、益生菌等成分是消費(fèi)者比較關(guān)注的消費(fèi)點(diǎn);