新用戶登錄后自動創(chuàng)建賬號
登錄假日辦撤了,“黃金周長假”到底意味著什么?官方數(shù)據(jù)可能太宏大,不妨借用新興社交媒體的大數(shù)據(jù),觀察和記錄2014年“十一”黃金周??纯从慰蛷哪睦飦?,又到哪里去,哪些地方最具吸引力。可以為大家在2015的“十一”黃金周出行提供具有價值的參考。
2014年的“十一黃金周”,人們都去哪兒了?官方數(shù)據(jù)顯示,2014年“十一”黃金周期間全國共接待游客4.75億人次,實現(xiàn)旅游收入2453億元,分別比2013年增長了10.9%和15.7%。而納入國家旅游局直報的124個旅游景區(qū)(點)在國慶節(jié)期間共接待3169萬人次,門票收入超過16億元。
但這背后,是頻現(xiàn)媒體頭條的“看不起”、“擠怕了”等關(guān)鍵詞。在快速增長的公眾假期旅游市場中,“提升品質(zhì)”似乎成了最具共鳴卻也最難實現(xiàn)的呼聲。
簡單依據(jù)官方格式化的通報和統(tǒng)計數(shù)字,難以探察越發(fā)成熟、訴求愈發(fā)多樣的旅游群體。擁有海量用戶的社交媒體也許為我們提供了一條考察途徑。
微博是國內(nèi)最大的社交網(wǎng)絡(luò)平臺之一。隨著移動客戶端普及,游客所發(fā)的位置微博(基于LBS)比例相應(yīng)提升。用戶在景區(qū)一次次拍照、簽到、發(fā)微博等行為,目的性異常明確,由此產(chǎn)生的位置微博可被認(rèn)為是一種范圍與規(guī)模更大、也更精細(xì)的記錄手段,成為探察游客旅游行為的新脈絡(luò)。
那么,從微博的大數(shù)據(jù)來看,游客都去哪兒了?他們的感受如何?
數(shù)據(jù)概覽
通過新浪微博提供的開放平臺和應(yīng)用程序編程接口(Application Programming Interface,API),我們基于全國地理信息網(wǎng)格,采集了“十一”黃金周及前一周(2014年9月24日至10月8日)共計14天公開的位置微博數(shù)據(jù),空間范圍覆蓋整個大陸及港澳臺。
“十一”黃金周位置微博分布熱點
發(fā)微博和黃金周有啥關(guān)系?微博用戶對假期旅行經(jīng)歷的分享,顯著推動了微博數(shù)量增長。從總數(shù)看,“十一”黃金周期間,全國位置微博約667萬條,最高日約102萬條,最低日約86萬條。相比節(jié)前一周的566萬條,總量增長約18%,尤其是照片數(shù)量增長明顯。在黃金周末期,微博數(shù)量逐步回落到節(jié)前水平。
那么,在哪里發(fā)微博的人最多?從分布看,全國尺度上微博數(shù)量與人口總量的分布非常相似,以愛輝-騰沖線為界,東部地區(qū)微博數(shù)量遠(yuǎn)高于西部。其中北上廣、各省省會等一、二線城市普遍具有較強的聚集能力,假日期間顯著吸引了周邊乃至全國的移動人口。
但這一數(shù)據(jù)或許還不能完全說明旅游地的受歡迎程度。在進(jìn)一步與當(dāng)?shù)爻W∪丝冢眨┘肮?jié)前日常水平進(jìn)行對比后,以人均微博密度為指標(biāo),我們發(fā)現(xiàn),額濟納、稻城、麗江等非一線地區(qū)作為旅游熱點,在縣域尺度同樣表現(xiàn)出非同一般的吸引力。其中,四川省表現(xiàn)尤為突出,在前十位的熱點縣區(qū)中獨占五席。這與官方統(tǒng)計結(jié)論相吻合,國家旅游局通報顯示, 2014年“十一”黃金周四川省旅游總收入超過200億元,較前一年增長達(dá)到29.1%,是全國旅游收入增長最快的省份。
在微博中,我們還能探知哪里的景區(qū)可能更有趣。相關(guān)的考察角度,是每帖照片數(shù):因拍照是游客分享旅行經(jīng)歷中最重要的形式之一,每帖照片數(shù)從側(cè)面可體現(xiàn)游覽景區(qū)能在多大程度上激發(fā)用戶的拍照和分享,可將其視為當(dāng)?shù)芈糜胃腥玖娙醯木C合反映。
從整體統(tǒng)計的意義看,可認(rèn)為每帖照片數(shù)較多的地區(qū),其景觀資源品質(zhì)也相對較高。
從結(jié)果看,西部地區(qū)社交網(wǎng)絡(luò)用戶數(shù)量雖少,但照片比例遠(yuǎn)高于東部,與前述微博總量“東高西低”格局呈現(xiàn)出有趣的對稱現(xiàn)象。早有學(xué)者指出,西部地區(qū)是我國旅游資源最豐富的地區(qū),自然景觀和人文景觀占了全國“半壁江山”,西部十省市也都無一例外地把旅游業(yè)當(dāng)作支柱產(chǎn)業(yè)來培育和發(fā)展。從游客角度出發(fā),拍照意愿的強弱程度也進(jìn)一步佐證了這一結(jié)論。
從哪里來,到哪里去?
游客究竟從哪里來?哪些城市更具備全國的吸引力?通過分析每位用戶在假期前后不同的發(fā)帖位置,并參考其填寫的所在地等信息,我們定義了用戶在“十一”黃金周期間移動的起止點,在地級市尺度對用戶的活動規(guī)律進(jìn)行統(tǒng)計分析,對用戶的達(dá)到、離開、城市間流量等情況在規(guī)模、比例和比值幾個維度上進(jìn)行了研究。
到達(dá)量方面,北京、廣州、深圳、成都、上??偭烤忧拔逦?,五地微博用戶到達(dá)量占全國總量13%,這與當(dāng)?shù)匾苿踊ヂ?lián)網(wǎng)用戶基數(shù)較大有一定關(guān)系。我們將到達(dá)量與官方“十一”黃金周重點旅游城市排行比較,可發(fā)現(xiàn),靠前的幾個城市排序相似性較高,但人口較少的城市(青島、煙臺)相似性偏弱,表明現(xiàn)階段微博數(shù)據(jù)與官方統(tǒng)計口徑之間依然存在一定差異。
官方統(tǒng)計與微博數(shù)據(jù)比較。
因此,我們進(jìn)一步引入節(jié)前各地的用戶數(shù)為基數(shù),分析到達(dá)量占基數(shù)的比重,以減少數(shù)據(jù)口徑偏差的影響。調(diào)整后發(fā)現(xiàn),神農(nóng)架、阿拉善、海南(青海)等地的排序靠前且均超過100%,對官方統(tǒng)計數(shù)據(jù)形成較好的補充。
到達(dá)量比重排序。
那么,“十一”黃金周期間的旅游者,又是從哪里來的?我們在離開量方面,主要考察從某地離開與到達(dá)該地的比值。該比值越大,當(dāng)?shù)赜脩敉獬龅膬A向就越高。比值排行靠前的城市有烏魯木齊、蘭州、合肥、北京、澳門等地。將到達(dá)量與離開量繪制在一張圖上,平均值線上下兩部分的城市,可分別被劃分為長假人口“外出型”和“涌入型”的地區(qū)。
長假外出型城市和長假涌入型城市。
游客從哪里來,又到哪里去,哪些起訖點之間,游客流量最大?是短途游,還是長途游?
在城市間流量方面,將用戶離開與達(dá)到的單次數(shù)據(jù)通過空間分析進(jìn)行聚合并分級統(tǒng)計,我們得到“十一”黃金周期間全國微博用戶流動的網(wǎng)絡(luò)圖。流量處于第一層級的城市對,包括北京-天津、成都-重慶、廣州-深圳等。第二層級前幾對的城市則包括廈門-漳州、南充-成都、渭南-西安等。這兩個層級的城市間流量合計占了全國總流量的16.6%。
圖上還能直觀看到一個由北京、上海、廣州、成都所構(gòu)成的菱形結(jié)構(gòu),若再加上武漢、西安、山東半島及福建沿海城市帶(廈門-福州-漳州)的話,黃金周期間,微博用戶流動所刻畫出來的這個菱形,實質(zhì)上與中國城市化水平最高的地區(qū)高度重合。
在第一和第二層級的城市對當(dāng)中,除北京與上海、成都、廣州、西安之外,其余城市間的相互間距離均未超過300~400公里,用戶流動規(guī)模與移動距離呈明顯負(fù)相關(guān)關(guān)系。而北京則表現(xiàn)出了首都所具有的國家尺度吸引力水平。
在主要城市之外,我們還挑選了部分知名景區(qū),研究其外地游客的主要來源。在這些景區(qū)中,烏鎮(zhèn)、青海湖和鼓浪嶼的主要外地客源,均來自自身所處的地域,而黃山、鳳凰和九寨溝的外地客源則具有更大的多樣性,景區(qū)影響力也更大。
部分景區(qū)客源分布。
游客在哪里會更多地談?wù)摗皭邸焙汀懊馈?/p>
社交媒體最具價值的部分,依然是微博消息內(nèi)容本身。
以烏鎮(zhèn)和九寨溝為例,在自然語言處理工具(Natural Language Processing,NLP)的幫助下,我們進(jìn)一步對游客在黃金周第一天所發(fā)微博的內(nèi)容進(jìn)行了語義分析(Sentiment Analysis)。對比兩地的高頻詞后發(fā)現(xiàn),在以周邊游為主的烏鎮(zhèn)景區(qū)內(nèi),游客留言相對具體,多次談及時間(“國慶”、“一天”)、事物(“水鄉(xiāng)”、“江南”、“旅游”)等,而九寨溝游客的留言則明顯趨向于情感化,以“愛”、“美”、“快樂”等詞語為主。
豐富的數(shù)據(jù)使我們可以回答諸如“某景區(qū)不同來源、不同類型游客在不同時間里都在贊美或吐槽什么”這樣的問題。
結(jié)語
2015年的“十一”黃金周,恰逢我國首部《旅游法》頒布實施兩周年?!堵糜畏ā窂娬{(diào)了以人為本的出發(fā)點,更注重保護(hù)旅游者的權(quán)力。其中明文規(guī)定,各地主管部門應(yīng)建立旅游公共信息和咨詢平臺向旅游者提供必要信息和咨詢服務(wù)。
旅游作為典型的口碑經(jīng)濟和體驗經(jīng)濟,對行業(yè)和游客輿論應(yīng)予關(guān)注。從購物到安全、從票價到擁擠,網(wǎng)絡(luò)輿情中各類關(guān)于景區(qū)的報道會對游客的消費決策產(chǎn)生明顯影響,公眾可以“用腳投票”選擇目的地。社交媒體上的公開數(shù)據(jù)進(jìn)一步完善后,完全可以采集不同時間段、不同來源的游客反饋,進(jìn)行提煉與分析,做出更有針對性的改善措施,這對旅游業(yè)的監(jiān)管、運營及游客自身都意義重大。
目前全國納入旅游局直報系統(tǒng)的城市和景區(qū)僅有125處,而我國僅4A、5A級景區(qū)就有近千家,官方統(tǒng)計存在明顯不足。對整個旅游行業(yè)來說,社交媒體等網(wǎng)絡(luò)輿情信息經(jīng)過挖掘能對官方數(shù)據(jù)形成補充,具有極大的科研、管理和商業(yè)價值,也是監(jiān)管者、運營者與游客之間重要的即時互動橋梁。
故而,在傳統(tǒng)旅游公共信息平臺基礎(chǔ)上,各地還可以建立起一套囊括官方統(tǒng)計、新興媒體、物聯(lián)網(wǎng)監(jiān)控等各類來源的旅游行業(yè)數(shù)據(jù)開放與治理體系,完善旅游開放數(shù)據(jù)的應(yīng)用生態(tài)圈,集社會合力共同提升整個旅游行業(yè)的發(fā)展水平。