新用戶登錄后自動(dòng)創(chuàng)建賬號(hào)
登錄近期, 途牛旅游網(wǎng)與SequoiaDB巨杉數(shù)據(jù)庫(kù)在大數(shù)據(jù)應(yīng)用方面展開了深度的技術(shù)合作,并且取得了顯著的成效。為此,我們也專門采訪了途牛旅游網(wǎng)研發(fā)總監(jiān)李曉煒先生, 讓他談一談在線旅游行業(yè)的大數(shù)據(jù)應(yīng)用及SequoiaDB的實(shí)踐情況。
CSDN:介紹下您自己,也介紹一下途牛?能否也談?wù)勀壳霸诰€旅游行業(yè)的主要情況?
李曉煒:你好,我是途牛旅游網(wǎng)的李曉煒,負(fù)責(zé)途牛后臺(tái)系統(tǒng)的開發(fā)工作。
途牛想必大家都聽過(guò),途牛旅游網(wǎng)是目前國(guó)內(nèi)最大的在線旅游平臺(tái)之一,提供全國(guó)75個(gè)城市的旅游度假預(yù)訂服務(wù),包括跟團(tuán)、自助、自駕、酒店、景區(qū)門票、郵輪以及公司旅游預(yù)訂等。
目前,在線旅游平臺(tái)發(fā)展也漸漸成熟,之前有看過(guò)一份旅游行業(yè)的統(tǒng)計(jì)報(bào)告,2014年中國(guó)的在線旅游市場(chǎng)交易規(guī)模達(dá)到了3077.9億元,同比增長(zhǎng)了38.9%,預(yù)計(jì)2015全年,這一規(guī)模將達(dá)到3500~4000億元,增長(zhǎng)規(guī)模保持在30%以上。而截至2014年12月,國(guó)內(nèi)在線旅游的用戶已經(jīng)達(dá)到了近1.5億人,用戶的年增長(zhǎng)接近195%。
CSDN:在線旅游的發(fā)展方向是什么呢?
李曉煒:我認(rèn)為目前在線旅游正在從向定制化、多樣化、個(gè)性化和智能化的方向在發(fā)展。
從前可能大家都滿足于通過(guò)線上訂票、訂酒店,現(xiàn)在用戶更希望平臺(tái)能代替他們做更多的事情,也就是我只要有旅游的想法,最好就能直接的幫我全程安排好,只需要付錢就行了。
而同時(shí),用戶也希望有更多的旅游項(xiàng)目的選擇,滿足個(gè)性化的需求。比如從前到一個(gè)地方,只安排幾個(gè)固定的餐廳給游客們?nèi)ィF(xiàn)在用戶可能會(huì)想要找更地道或者是一些有特色的小店來(lái)品嘗,這就要求我們能有更多的餐廳供他們選擇,餐飲是目的地服務(wù)的一種,途牛也從今年開始在目的地服務(wù)方向發(fā)力,希望能徹底改變過(guò)去那種上車睡覺,下車拍照的旅游方式,希望大家都能全方位的深度感受當(dāng)?shù)氐母鞣N特色。
CSDN:作為一個(gè)資深的架構(gòu)師、工程師,能否談?wù)勗诰€旅游這一塊目前對(duì)于大數(shù)據(jù)的需求主要有什么呢?
李曉煒:剛剛也提到了未來(lái)在線旅游的一個(gè)大概發(fā)展情況,針對(duì)這些個(gè)性化、智慧化的需求,需要從用戶的瀏覽,訂購(gòu)等行為中進(jìn)行分析,行程主動(dòng)的推薦,如何從互聯(lián)網(wǎng)的海量數(shù)據(jù)中提煉出這些需求就需要大數(shù)據(jù)技術(shù)來(lái)支撐了。對(duì)于多樣化的選擇,更多的項(xiàng)目選擇需要更大的存儲(chǔ),同時(shí)也需要能快速的存取、查詢所需要的數(shù)據(jù)。對(duì)于智慧化方面,一個(gè)完整的旅游方案提供平臺(tái),需要快速的分析和數(shù)據(jù)處理。用戶提出了需求,系統(tǒng)就會(huì)快速的分析,在龐大的數(shù)據(jù)量中分析出最適合用戶需求的方案。
簡(jiǎn)單說(shuō),就是大數(shù)據(jù)的存儲(chǔ)和大數(shù)據(jù)的分析。
CSDN:在線旅游的大數(shù)據(jù)現(xiàn)狀是什么呢?主要的應(yīng)用有哪些?
李曉煒:在旅游有幾大特點(diǎn),交易量大,會(huì)員量大,產(chǎn)品量大,訂單量大等,不管是哪種數(shù)據(jù)類型都稱的上是海量?;ヂ?lián)網(wǎng)擁有長(zhǎng)尾的特點(diǎn),覆蓋的客戶群廣,靠傳統(tǒng)的數(shù)據(jù)庫(kù)幾乎無(wú)法分析動(dòng)輒以TB計(jì)的數(shù)據(jù)。舉個(gè)例子,我們需要從用戶行為中分析用戶的興趣和消費(fèi)趨向來(lái)反向決定我們推出什么樣的產(chǎn)品,這個(gè)看似簡(jiǎn)單實(shí)則非常的復(fù)雜,我們需要對(duì)于不同的用戶,根據(jù)他的年齡,性別,瀏覽歷史,下單歷史,所在地區(qū)等很多個(gè)維度去進(jìn)行分析,進(jìn)而指導(dǎo)我們?cè)诓煌貐^(qū)針對(duì)不同類型的人群主推不同的產(chǎn)品;另一個(gè)例子,一個(gè)用戶有了出游意向,比如預(yù)算,意向目的地等信息之后,系統(tǒng)需要能智能的去給他推薦相應(yīng)的產(chǎn)品套餐,簡(jiǎn)化客人的選擇過(guò)程,幫他打包好所有的服務(wù),這些也需要我們能在很短的時(shí)間內(nèi)通過(guò)多維度的數(shù)據(jù)整合來(lái)給出建議,既要精確又要快,這就離不開對(duì)于大數(shù)據(jù)技術(shù)的運(yùn)用了。當(dāng)然除此之外還有很多的場(chǎng)景,在此就不一一給出了
CSDN:此次SequoiaDB巨杉數(shù)據(jù)庫(kù)與途牛的合作,主要是在哪些方面?
李曉煒:“價(jià)格中心”,是途牛旅游業(yè)務(wù)的核心模塊之一,負(fù)責(zé)記錄所有的服務(wù)、商品等等的價(jià)格,并在用戶需要時(shí)對(duì)其進(jìn)行計(jì)算和組合。我們的系統(tǒng)每天計(jì)算的團(tuán)期數(shù)量達(dá)百億次之多,每次計(jì)算都會(huì)對(duì)數(shù)據(jù)庫(kù)發(fā)生多次查詢,且會(huì)跨多個(gè)庫(kù)進(jìn)行查詢,而這些壓力往往是在很短的時(shí)間內(nèi)集中爆發(fā),如我們的供應(yīng)商進(jìn)行大批量調(diào)價(jià)時(shí),價(jià)格是對(duì)用戶最敏感的信息,需要我們的系統(tǒng)能夠在極大規(guī)模數(shù)據(jù)量和并發(fā)的情況下能夠以極快的速度給出響應(yīng),了解大規(guī)模網(wǎng)站的都知道,基于RESTFUL的設(shè)計(jì)計(jì)算能力可以很容易的實(shí)現(xiàn)水平擴(kuò)展,而數(shù)據(jù)存取的高可用卻是皇冠上的明珠,想使用傳統(tǒng)的關(guān)系性數(shù)據(jù)庫(kù)實(shí)現(xiàn)上面的場(chǎng)景,維護(hù)和開發(fā)的成本非常高昂,有些時(shí)候甚至根本無(wú)法實(shí)現(xiàn)。考慮到我們的應(yīng)用場(chǎng)景基本是以讀為主,所以非常適合去使用巨杉的NoSQL數(shù)據(jù)庫(kù)去提升性能。
另外,“資源系統(tǒng)”則是途牛的另一個(gè)核心業(yè)務(wù)模塊。其負(fù)責(zé)存儲(chǔ)和記錄所有的旅游方案相關(guān)的資源信息,包括酒店,機(jī)票,門票,火車票,汽車票,地接,當(dāng)?shù)胤?wù)等,和價(jià)格中心相同,我們的資源也呈海量存儲(chǔ)的特點(diǎn),同樣在對(duì)于靜態(tài)資源的讀取上,通過(guò)和巨杉的合作也大幅提升了系統(tǒng)的響應(yīng)能力。
CSDN:能否大概介紹一下“價(jià)格中心”“資源中心”中巨杉數(shù)據(jù)庫(kù)的應(yīng)用情況?
李曉煒:途牛價(jià)格中心從架構(gòu)上來(lái)分大致分為計(jì)算和存取兩層,前面用應(yīng)用服務(wù)器大量架設(shè)實(shí)例進(jìn)行集群運(yùn)算,中間使用MQ的方式接受來(lái)自資源,產(chǎn)品等系統(tǒng)的價(jià)格變動(dòng),庫(kù)存變動(dòng),上下架等實(shí)時(shí)消息來(lái)觸發(fā)計(jì)算,底層采用SequoiaDB巨杉數(shù)據(jù)庫(kù)存儲(chǔ)諸如成本價(jià),采購(gòu)方式,報(bào)價(jià)方式,庫(kù)存等信息,在一次計(jì)算當(dāng)中需要進(jìn)行多次的高速查詢。
CSDN:通過(guò)使用巨杉數(shù)據(jù)庫(kù),業(yè)務(wù)上有了多大的提升呢?
李曉煒:我們?nèi)ツ晖诘囊惶斓挠?jì)算量大概是一個(gè)億,今年在沒有增加太多硬件資源的情況下達(dá)到了一百億團(tuán)期/天的計(jì)算量,在這個(gè)過(guò)程中SequoiaDB巨杉數(shù)據(jù)庫(kù)在讀取效率方面的巨大優(yōu)勢(shì)給了我們很強(qiáng)的支撐,使得總體的效率提高了近一倍。
CSDN:為什么選擇SequoiaDB巨杉數(shù)據(jù)庫(kù)
李曉煒:我們的團(tuán)隊(duì)在對(duì)比選型的過(guò)程中,看到了CSDN上發(fā)表的《bankmark NoSQL性能對(duì)比測(cè)試》一文,其中看到SequoiaDB巨杉數(shù)據(jù)庫(kù)的性能與國(guó)際領(lǐng)先的NoSQL產(chǎn)品不分伯仲,部分性能甚至超越硅谷同類產(chǎn)品。驚訝于國(guó)內(nèi)也出現(xiàn)了這樣一款優(yōu)秀的基礎(chǔ)軟件之余,巨杉數(shù)據(jù)庫(kù)也進(jìn)入了我們的考察視野。
對(duì)于途牛的實(shí)際應(yīng)用場(chǎng)景,選擇SequoiaDB巨杉數(shù)據(jù)庫(kù)主要有4個(gè)方面。
水平擴(kuò)展性:新型分布式數(shù)據(jù)庫(kù)的擴(kuò)展性幫助在線旅游平臺(tái)的數(shù)據(jù)容量能夠輕松的擴(kuò)展,不僅擴(kuò)展非常輕松,成本也比傳統(tǒng)的存儲(chǔ)方案便宜許多。這樣就能更好更省的應(yīng)對(duì)未來(lái)繼續(xù)擴(kuò)大的用戶量。
靈活數(shù)據(jù)模型:靈活的數(shù)據(jù)模型,幫助存儲(chǔ)復(fù)雜多樣化的數(shù)據(jù)。文檔型的模型,可以存儲(chǔ)任何類型的數(shù)據(jù)無(wú)需重新設(shè)計(jì)數(shù)據(jù)模式,調(diào)用時(shí)也無(wú)需做更多的處理。對(duì)于處理多種復(fù)雜的數(shù)據(jù)類型十分有效。
更高的數(shù)據(jù)處理性能:相比于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù),NoSQL的性能更為優(yōu)秀,對(duì)大數(shù)據(jù)量的應(yīng)用場(chǎng)景更適合。
國(guó)產(chǎn)化:國(guó)內(nèi)完全自主研發(fā)的數(shù)據(jù)庫(kù)產(chǎn)品,不僅使用更適合國(guó)內(nèi)開發(fā)者,很多的設(shè)計(jì)上也更考慮了國(guó)人的使用習(xí)慣。
后來(lái),在與巨杉數(shù)據(jù)庫(kù)的技術(shù)團(tuán)隊(duì)有了深入的溝通后,我們的研發(fā)團(tuán)隊(duì)確實(shí)對(duì)巨杉數(shù)據(jù)庫(kù)有了更深的認(rèn)識(shí),也給了我們更多選擇巨杉的信心。
CSDN:對(duì)于在線旅游和大數(shù)據(jù)的結(jié)合的一些看法和建議
李曉煒:在不遠(yuǎn)的將來(lái),線上旅游會(huì)徹底顛覆傳統(tǒng)的線下旅游,隨著計(jì)算能力和存儲(chǔ)能力的飛速提升,我們將有能力實(shí)時(shí)的從全世界的景點(diǎn)信息中幫助用戶篩選出最最合理的出行方案。當(dāng)你輸入目的地和預(yù)算時(shí)就會(huì)自動(dòng)的根據(jù)目的地的熱度,不同等級(jí)資源的價(jià)格等因素綜合計(jì)算出最適合你的方案,甚至可以自動(dòng)的幫游客規(guī)劃好路線,實(shí)現(xiàn)自動(dòng)的錯(cuò)峰出行。系統(tǒng)會(huì)越來(lái)越了解你,甚至可以自動(dòng)推薦你最喜歡的酒店,航空公司,你最喜愛的餐館以及你最喜愛的休閑活動(dòng),你要做的就是下載一個(gè)APP就像是有了一個(gè)如影隨形的私人導(dǎo)游和管家。
找回密碼
注冊(cè)賬號(hào)