因為參考案例中,作者用的可視化工具是Tableau,所以我就迫不及待地想要嘗試一下。參考案例鏈接:https://blog.csdn.net/lbship/article/details/79452459
在官網下載了Tableau,試用期14天,找了好久的破解版,無果,后來發(fā)現有免費版的Table Public可以用,等試用期過了就用免費版的。先拿我剛抓到的數據試試手。

image.png
北京,50-150人規(guī)模的公司招聘條數非常多,看看具體是什么類型的公司。

image.png
從圖里發(fā)現一個不和諧的數據,外企代表處是什么鬼?看看原始數據是什么

image.png
崗位幾乎都是一個公司發(fā)出來的,點個url看看。

image.png
哇,這公司太不靠譜了,就是騙人的嘛!要把這個公司的所有招聘數據刪掉再進行后續(xù)分析。

看了一下公司對應的招聘信息,排名第一的是北京中輝,看看具體數據

image.png
這工資和這要求明顯不符,肯定又是不靠譜的,刪!
招聘量排前三的都是這種套路,有點常識的應該不會去應聘吧!
百度了幾家公司的天眼信息,沒看出什么問題,后來搜全網,找到貼吧的信息

image.png
估計幾家公司都是以面試為由騙錢的??傮w來看,這種騙子公司北京最多,廣州其次,上面這個北京萬向已經把魔爪伸向大連和南京了。
最后根據統(tǒng)計公司名稱出現的次數,發(fā)現除了阿里巴巴、騰訊和字節(jié)跳動這些大公司的招聘數量在前,其他公司招聘數量多的幾乎都是騙子公司,崗位名稱中也經常出現“高薪”、“急聘”等字眼。大概刪除了3000條左右的無效數據,剩余7800條。

image.png

image.png
從排名變化可以看出北京、廣州、合肥的無效數據較多,北京和廣州的問題相同,無效數據主要是上述的套路招聘信息,而合肥的無效數據都是一些銀行客服的招聘信息。

合肥地區(qū)崗位名稱