今年的春節檔可謂異常火爆,多不大片競相角逐,成龍大哥、星爺也參與其中!最終卻被第一部的國產科幻大片《流浪地球》搶了風頭,成為領跑春節檔票房的最大黑馬,廣受業界好評,更是成為第一部收藏到中國科技館的電影。
上映18天流浪地球在內地總票房已高居第二超過了紅海行動。
(截止2019年2月25號8:00票房數據)
當然今年的好票房有一部分源于高票價,那么看過這么影片的小伙伴到底如何評價呢,好票房是否有好口碑呢?且看小編的科學分析(主要是貓眼和豆瓣用戶的影評數據)
技術小哥哥一共爬取到了12萬余條影評信息,下面跟著小編一起來看看吧
這部電影更對男同胞的胃口:
(觀影人員性別及情感分布)
影片關注度在2月10號到達頂峰,每天晚間檔是觀影高峰期:

(隨日期變化評論數量趨勢)

(各時段評論數量)
大部分用戶還是打出了9分以上的評價:

(影評評分分布)
大家的主要評論關注“科幻”、“中國”:

(評論關鍵詞詞云圖)
科幻、特效是大家評論的焦點:

(評論主旨分布)

(以上均為截止2019年2月22號17:00影評的數據分析)
這就是一個文科數據分析小白的分析了,還清各位客官指正哦!
很多人會好奇,一個不懂數據分析、不會Python、R編程的人,如何完成這樣的“影評(文本)數據分析”呢?
其實除去數據爬取,整個分析小編只用了一個下午就完成了,是不是很膩害!!
那是因為小編有神器——Tempo大數據分析平臺(從BI到AI的一體化數據分析與應用工具)的支撐,且看小編的表演:
基于TempoAI的文本分析模塊中的分詞、主旨話題分析和觀點情感分析節點,進行簡單的參數設置實現影評的話題和情感分析。“主旨話題”節點獲可以直接獲取評論中都討論那些內容(如劇情、特效等),“情感分析”則可以識別用戶評論的情感傾向(正面評價、負面評價,中立)。
而分詞、關鍵詞抽取和詞頻統計節點則實現影評焦點分析。“關鍵詞抽取”獲取影評的討論焦點,“詞頻統計”則可以統計每個焦點的關注度,詞云圖就是評論熱點的展示。
是不是全程都不用編寫代碼呢,Tempo平臺智建模易應用的設計理念,讓您在簡單的拖拉拽中完成復雜的數據挖掘,是不是666啊。分析結果還可以直接輸入并進行可視化展示!一樣的不用編碼,拖拖拽拽就搞定!!
平臺“人人都是數據分析師”的理念,讓不懂技術的小白比如身為文科生的小編通過簡短的培訓即可輕松完成復雜的數據分析挖掘工作。在實際應用中有很多場景都可以復用我們上述的操作,比如電商行業的用戶評論分析、網絡輿情分析、問卷調查分析、股票趨勢分析、證券行業投資情報獲取等場景,如果您有相關方面的需求可與我們取得聯系~
您要是還對其他數據分析感興趣的話可以私信wuli技術小哥哥,不過我是不會告訴你小哥哥的電話是4006082558滴~~