我的第一個數據分析項目——51job“數據分析”崗位分析(數據清洗篇一)

因為參考案例中,作者用的可視化工具是Tableau,所以我就迫不及待地想要嘗試一下。參考案例鏈接:https://blog.csdn.net/lbship/article/details/79452459

在官網下載了Tableau,試用期14天,找了好久的破解版,無果,后來發(fā)現有免費版的Table Public可以用,等試用期過了就用免費版的。先拿我剛抓到的數據試試手。

image.png

北京,50-150人規(guī)模的公司招聘條數非常多,看看具體是什么類型的公司。


image.png

從圖里發(fā)現一個不和諧的數據,外企代表處是什么鬼?看看原始數據是什么


image.png

崗位幾乎都是一個公司發(fā)出來的,點個url看看。
image.png

哇,這公司太不靠譜了,就是騙人的嘛!要把這個公司的所有招聘數據刪掉再進行后續(xù)分析。

看了一下公司對應的招聘信息,排名第一的是北京中輝,看看具體數據


image.png

這工資和這要求明顯不符,肯定又是不靠譜的,刪!
招聘量排前三的都是這種套路,有點常識的應該不會去應聘吧!

百度了幾家公司的天眼信息,沒看出什么問題,后來搜全網,找到貼吧的信息


image.png

估計幾家公司都是以面試為由騙錢的??傮w來看,這種騙子公司北京最多,廣州其次,上面這個北京萬向已經把魔爪伸向大連和南京了。

最后根據統(tǒng)計公司名稱出現的次數,發(fā)現除了阿里巴巴、騰訊和字節(jié)跳動這些大公司的招聘數量在前,其他公司招聘數量多的幾乎都是騙子公司,崗位名稱中也經常出現“高薪”、“急聘”等字眼。大概刪除了3000條左右的無效數據,剩余7800條。

image.png
image.png

從排名變化可以看出北京、廣州、合肥的無效數據較多,北京和廣州的問題相同,無效數據主要是上述的套路招聘信息,而合肥的無效數據都是一些銀行客服的招聘信息。


合肥地區(qū)崗位名稱
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

  • 我以前是一個經常因為一點事就會負面情緒爆棚的人,而且我經常亂發(fā)脾氣,這幾年我一直在改這些壞毛病,我學著控制自己的情...
    Gzw丶南山閱讀 206評論 0 0
  • 平凡日子每個人都承擔壓力與責任,但總希望女人能夠再細心淡定一點,打理好自己的日常,養(yǎng)好自己的胃,有一張明媚的臉和快...
    風吹過的歲月閱讀 293評論 0 2
  • 一一加入市北作協記 送走了遠方的客人,參加完周末的活動,終于有時間去回憶加入市北作協的...
    玫瑰花王子閱讀 560評論 0 3
  • 紅場幾多狂 西門慶拋棄七姨太 找麻婆娘 為了人間那份真愛 救潘金蓮水深火熱于床 藩金蓮那恨 太沒情商 ...
    淘猴侯孫行閱讀 157評論 0 2
  • 版本問題導致出錯 更換版本,設置變量 設置服務 新建daemon文件夾,從amd64拷貝prunsrv.exe
    tommyhxh閱讀 483評論 0 1

友情鏈接更多精彩內容