首頁 > Python教程 > Python應用 > 我用Python紀念了那些被爛片收割的智商稅!

我用Python紀念了那些被爛片收割的智商稅!

時間:2019-10-26    作者:徐麟   來源:數據森麟公眾號

前言 

隨著電影行業的蓬勃發展,越來越多的電影出現在了觀眾的視野中,豐富了大家的生活,好的電影也能讓大家在放松自我的同時收獲一些對人生的思考。

然而,也有那么一些“爛片”,讓大家在看過之后“添堵”,后悔為這種“爛片”貢獻票房,白白被收割了“智商稅”,今天,我們就用Python來幾年那些被爛片收割走的智商稅。

數據獲取 

這次的數據源也是大家的老朋友,被親切地稱之為“馬蜂窩”的豆瓣網,現在有很多平臺會對電影進行打分,包括了貓眼和淘票票,但是相較之下,豆瓣的評分更加全面,一些冷門的“爛片”只能在豆瓣中被大家挖掘出來。

誠然,豆瓣的評分會存在一些“文藝濾鏡”,對文藝片比較寬容,對此我們認為,“豆瓣評分高的不一定是真的高,但是被豆瓣打了低分的是真的低”。此次選擇的影片范圍是 2010 年至今的國產影片:

最終獲取到了 3000 多部電影的數據,代碼如下:

image.png

整體數據 

首先要做的事情就是看一下豆瓣對國產電影的整體打分情況,以此確定之后對“爛片”的劃分依據,首先看一下整體評分的柱形圖:

可以看到豆瓣用戶對國產片還是比較嚴格,大多數電影都是在 6 分一下, 8 分以上的電影可以說是“鳳毛麟角”,因此后續對爛片的標準也要相應放低,下面看一下各個將分數向下取整后的統計數量:

2010 年之后獲得 9 分的國產電影只有一部,可以說是非常的不易,大家可以猜一下是哪部電影,看看是不是你心中的 9 分電影

下面為大家揭開謎底:

唯一一部獲得 9 分的就是 18 年上映的《我不是藥神》,未來也希望能有更多這樣的優秀影片,而且這種期望也是有依據的,我們看一下每一年爛片和非爛片的占比:

可以看到從爛片和超級爛片占比在 16 年達到頂峰之后,從 17 年開始爛片占比在逐漸下降,相信未來爛片的占比也會逐漸下降

人氣榜 

有了整體的綜述后,我們確定了爛片和超級爛片的劃分依據,將 4 分之下的影片劃分為爛片, 3 分以下的影片劃分為超級爛片,下面就分別來看看各自的人氣榜:

可以看到在所有的影片中,人氣TOP10 的影片評分都還是不錯,流浪地球,藥神和哪吒也都在票房中有非常不錯的表現,顯然,這不是我們需要,我們下面就來看下爛片和超級爛片中的人氣榜:

熱烈恭喜《上海堡壘》憑借2. 9 分的評分和 217110 的評價數喜提兩項人氣榜的冠軍,《愛情公寓》因為“大忽悠”式的營銷也躋身榜單,不知道即將上映的《愛情公寓5》能否為這一系列挽回一些口碑

票房榜 

同樣,我們來分別看下所有影片、爛片和超級爛片的票房排行,看看究竟是哪些“爛片”在瘋狂收割著大家的智商稅,首先看一下左右影片的票房榜:

排名第 10 的西虹市首富票房都已經到了 25 億,可見票房市場發展之迅速,今年國慶檔的兩部影片《我和我的祖國》以及《中國機長》分列八九名,相信未來這份榜單會不斷的發生變化。

《西虹市首富》同樣以6. 5 分的評分在榜單中評分最低,看來《西虹市首富》已經成為了一個標桿,6. 5 分也是一部票房賣座影片的底線,下面進入重點了,看一下那些瘋狂收割大家智商稅的爛片和超級爛片:

爛片票房榜中的TOP10 都超過了2. 6 億,大鬧天竺和愛情公寓更是分別收獲了7. 5 億和5. 5 億的票房,瘋狂收割著大家的智商稅,相信未來隨著大家對影片要求的提高,瘋狂收割智商稅的現象會逐漸減少

令人意想不到的是,就連超級爛片的TOP10 都可以收割 5000 萬以上的票房,更是有四部票房過億,在此提醒大家“觀影有風險,選片需謹慎”

演員榜

一部爛片的誕生想必也離不開“演員”的努力,下面就來分別看看所出演電影平均分最高和最低的演員:

評分高的演員就無須贅述了,都是經過了市場和觀眾的挑戰,但是目前還沒有一位演員在主演影片數量超過 5 部之后,分數可以上7,誠然有一部分是因為豆瓣對國產的嚴格要求,但另一方面也在敦促電影人不斷進步

下面看一下評分排在倒數的演員,首先看下BOTTOM10:

看到這份榜單,有種恍惚的感覺,確認這不是主持人或者相聲、小品演員的榜單,我們不禁要問:大家有事嗎?快樂家族更是“霸榜”,杜海濤憑借精湛的演技和出眾的外形在榜單中獨占鰲頭,相信他未來會給大家帶來更為“驚艷”的作品,吳亦凡也代表說唱歌手在榜單中出現,填補了榜單中歌手的空白。

由于過多的“跨界”演員出現在了榜單BOTTOM10 中,導致很多大家心目中的演員沒有上榜,于是我們繼續看BOTTOM11-20,這份榜單似乎正常了一點,但是好多更加應該在電視劇中出現的名字也位列其中。

看來電影和電視劇還是有所區別,在電視劇中能夠大放異彩的演員未必能在電影中有同樣精彩的表現,考慮到電視劇演員們的加入,繼續把榜單范圍放大到BOTTOM21-30:

這份榜單終于正常了很多,很多大家心目中的“種子選手”都不負眾望地出現在了榜單中,特別是黃曉明和Angelababy這對模范夫妻的上榜,進一步提高了榜單的公信力,未來也希望他們能夠繼續聯袂為大家帶來精彩作品,很多人可能會表示懷疑,對此我們的回復很簡單:我不要你相信,我要我相信!

相關推薦
用Python爬取B站5000 條視頻,揭秘為何千萬人為它流淚!
Python教程:如何用xlrd和xlwt庫讀和寫Excel表格?
Python安裝MySQL-python:EnvironmentError的解決辦法
分享:Python2和Python3有那些差異?
Python正在吞噬世界:它為何會贏又將走向何方?
Python 的內置對象都藏了哪些小秘密?
實戰干貨!用案例讓你一文搞懂python網絡爬蟲
Python教程:圖像處理模塊ndimage用法實例分析
Python教程:代理IP爬蟲的使用方法
Python教程:如何使用scipy模塊實現一維卷積運算示例?
Python:關于內存分配時的那些小秘密分享
python技巧:global關鍵字的用法詳解
Python教程:深入了解python在HDA中的應用
python技巧:SSLerror的requests證書問題解決方法
PyCharm教程:搭建Spark開發環境的幾個步驟
分享:Django Admin中增加導出CSV功能過程詳解
Python開發技巧:openpyxl讀取單元格字體顏色過程解析
Python教程:面向對象之Web靜態服務器
Python教程:如何為終端提供持久性歷史記錄
Python技巧分享:自動登錄淘寶并保存登錄信息的方法
Python數據分析:利用Flask動態展示 Pyecharts 圖表數據方法
python3教程:如何搭建微型的web服務器?
python技巧:xlwt如何設置單元格的自定義背景顏色
Python開發:Django中間件攔截未登錄url實例詳解
如何解決Python字符串和正則表達式中的反斜杠('\')問題?
Python開發技巧:編寫一個簡單登錄功能過程解析
Python編程:postman傳遞當前時間戳實例詳解
Python爬蟲教程:使用beautifulSoup4爬取名言網案例代碼分享
python開發:動態遷移solr數據過程分享
python數據分析:用線性回歸預測股票價格的代碼分析
Python教程:數據分析模塊pandas用法詳解
Python3教程:pandas.merge用法詳解
Python爬蟲案例:如何爬取豆瓣電影信息?附代碼實例
python開發:如何編寫簡單端口掃描器?
Django框架教程:Pagination分頁實現代碼實例
python爬蟲實例:貓眼電影和電影天堂數據csv和mysql存儲過程

精彩推薦

熱門教程

重庆时时开奖直播app 山西快乐十分开奖号码查询 体彩p5跨度走势图带连线图表 二分彩计划专家 福彩3d和值走势图近500 正规棋牌平台排行榜 大神娱乐官方网站 竟彩比分直播竟彩网 黑龙江p62开奖号码今天 澳门博导航83413 比特币靠拉人赚钱 现在只想让自己忙起来赚钱 开魔域私服现在赚钱么 快手红包赚钱软件 七星彩走势图软件 南通棋牌公众号游戏中心 gta5赚钱了吗