欧美一级视-欧美一级视频高清片-欧美一级视频免费-欧美一级视频免费观看-午夜激情视频在线播放-午夜激情视频在线观看

什么是實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)?實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)搭建需要用到哪些技術(shù)
  • 更新時(shí)間:2025-09-28 17:09:18
  • 數(shù)倉(cāng)開(kāi)發(fā)
  • 發(fā)布時(shí)間:1年前
  • 771

去年,實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)的概念突然變得非常流行。可能是因?yàn)閭鹘y(tǒng)的離線數(shù)據(jù)倉(cāng)庫(kù)已經(jīng)發(fā)展了多年,技術(shù)相對(duì)成熟,所以大家開(kāi)始將注意力放在更具挑戰(zhàn)性的實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)上;也可能是隨著存量市場(chǎng)競(jìng)爭(zhēng)的到來(lái),對(duì)于數(shù)據(jù)獲取速度的要求越來(lái)越高,T+1的數(shù)據(jù)獲取無(wú)法滿足需求,因此實(shí)時(shí)構(gòu)建數(shù)據(jù)的需求也應(yīng)運(yùn)而生。



實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)的技術(shù)要求:

  1. 高并發(fā)性:未來(lái)實(shí)時(shí)數(shù)據(jù)不僅僅是為幾個(gè)運(yùn)營(yíng)或管理層人員使用,更會(huì)面向商戶和用戶。隨著用戶數(shù)量的增加,會(huì)帶來(lái)并發(fā)量的增加。因此,實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)必須具備提供高并發(fā)數(shù)據(jù)服務(wù)的能力。


  2. 查詢速度:目前許多實(shí)時(shí)指標(biāo)的應(yīng)用場(chǎng)景是移動(dòng)端,移動(dòng)端對(duì)數(shù)據(jù)響應(yīng)速度的要求遠(yuǎn)高于PC端。大多數(shù)數(shù)據(jù)使用場(chǎng)景希望能夠在毫秒級(jí)返回?cái)?shù)據(jù)。未來(lái),如果將實(shí)時(shí)標(biāo)簽應(yīng)用于用戶推薦中,對(duì)響應(yīng)速度的要求將更高。


  3. 處理速度:在大促銷(xiāo)期間,需要具備極強(qiáng)的處理能力,能夠應(yīng)對(duì)流量峰值的情況。還需要具備低延遲甚至零延遲的消費(fèi)能力。


實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)的技術(shù)基礎(chǔ):流式技術(shù)架構(gòu) 目前,流式計(jì)算框架相對(duì)成熟,開(kāi)源組件如Storm、Spark Streaming和Flink得到廣泛應(yīng)用。簡(jiǎn)單來(lái)說(shuō),流式數(shù)據(jù)處理是指系統(tǒng)每產(chǎn)生一條數(shù)據(jù),都會(huì)立即采集并發(fā)送到流式任務(wù)中心進(jìn)行處理,無(wú)需額外的定時(shí)調(diào)度。


業(yè)界廣泛采用的框架有Twitter的Storm、Apache的Spark Streaming以及近年來(lái)流行的Flink。這些框架整體架構(gòu)相似,但在實(shí)現(xiàn)細(xì)節(jié)上有許多不同,需要根據(jù)業(yè)務(wù)場(chǎng)景的特征靈活選擇。


流式框架具有以下優(yōu)點(diǎn):

  1. 高時(shí)效性:通常延遲在秒級(jí)別。

  2. 任務(wù)常駐:流式任務(wù)一旦啟動(dòng),會(huì)持續(xù)運(yùn)行,直到人為終止,且數(shù)據(jù)源是無(wú)限的。

  3. 高處理性能:流式計(jì)算通常會(huì)使用高性能服務(wù)器來(lái)運(yùn)行任務(wù),因?yàn)橐坏┨幚硗掏铝繜o(wú)法跟上采集吞吐量,就會(huì)導(dǎo)致數(shù)據(jù)計(jì)算延遲。

  4. 邏輯簡(jiǎn)單:由于流式計(jì)算通常是對(duì)單條數(shù)據(jù)進(jìn)行處理,缺乏數(shù)據(jù)間關(guān)聯(lián)運(yùn)算能力,因此在支持的業(yè)務(wù)邏輯上相對(duì)簡(jiǎn)單,處理結(jié)果與離線存在一定差異。

實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)的兩個(gè)常見(jiàn)架構(gòu): Lambda架構(gòu):Lambda架構(gòu)的核心理念是"流批一體化"。隨著機(jī)器性能和數(shù)據(jù)框架的不斷完善,用戶實(shí)際上并不關(guān)心底層如何運(yùn)行,只要能夠按照統(tǒng)一模型返回結(jié)果即可。現(xiàn)在許多應(yīng)用(例如Spark和Flink)都支持這種結(jié)構(gòu),即數(shù)據(jù)進(jìn)入平臺(tái)后可以選擇批處理運(yùn)行或者流式處理運(yùn)行,但無(wú)論如何,一致性始終保持不變。

Kappa架構(gòu):雖然Lambda架構(gòu)理念很好,但長(zhǎng)期使用會(huì)導(dǎo)致數(shù)據(jù)復(fù)雜性增加。為解決復(fù)雜性問(wèn)題,有人提出了用一套架構(gòu)解決所有問(wèn)題的設(shè)想,而流行的做法就是基于流計(jì)算。通過(guò)增加流計(jì)算的時(shí)間窗口來(lái)實(shí)現(xiàn)邏輯上的批處理操作。

實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)的查詢引擎: 實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)的查詢依賴于交互式查詢引擎,常見(jiàn)于OLAP場(chǎng)景。根據(jù)存儲(chǔ)數(shù)據(jù)方式的不同,可以分為ROLAP、MOLAP和HOLAP:

ROLAP:在大數(shù)據(jù)生態(tài)圈中,常用于ROLAP場(chǎng)景的交互式計(jì)算引擎包括Impala和Presto。它們以關(guān)系數(shù)據(jù)庫(kù)為核心,使用關(guān)系型結(jié)構(gòu)進(jìn)行多維數(shù)據(jù)表示和存儲(chǔ)。

ROLAP將多維結(jié)構(gòu)劃分為事實(shí)表和維度表。事實(shí)表存儲(chǔ)數(shù)據(jù)和維度關(guān)鍵字,維度表存放維度層次、成員類(lèi)別等維度描述信息。ROLAP的優(yōu)勢(shì)是可以實(shí)時(shí)從源數(shù)據(jù)中獲取最新數(shù)據(jù)更新,以保持?jǐn)?shù)據(jù)實(shí)時(shí)性,但運(yùn)算效率較低,用戶等待時(shí)間較長(zhǎng)。

MOLAP:MOLAP是一種通過(guò)預(yù)計(jì)算Cube方式加速查詢的OLAP引擎,其核心思想是"空間換時(shí)間"。常見(jiàn)代表包括Druid和Kylin。MOLAP以多維數(shù)據(jù)組織方式為核心,使用多維數(shù)組存儲(chǔ)數(shù)據(jù)。

多維數(shù)據(jù)形成"數(shù)據(jù)立方體(Cube)"結(jié)構(gòu),該結(jié)構(gòu)經(jīng)過(guò)高度優(yōu)化,可以最大程度提高查詢性能。MOLAP的優(yōu)勢(shì)在于可通過(guò)預(yù)處理多維數(shù)據(jù)顯著提高運(yùn)算效率,但占用存儲(chǔ)空間大且數(shù)據(jù)更新有一定延遲。

HOLAP:HOLAP是基于混合數(shù)據(jù)組織的OLAP實(shí)現(xiàn)。根據(jù)業(yè)務(wù)需求,用戶可以選擇使用ROLAP和MOLAP。通常,不常用或需要靈活定義分析的部分使用ROLAP,而常用、常規(guī)模型采用MOLAP。

實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)的分層模型: 實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)的分層思路沿用了離線數(shù)據(jù)倉(cāng)庫(kù)的思想。

CDM層(明細(xì)數(shù)據(jù)層):根據(jù)業(yè)務(wù)場(chǎng)景的不同,CDM層會(huì)被劃分為各個(gè)主題域。

DWS層(匯總數(shù)據(jù)層):DWS層對(duì)各個(gè)域進(jìn)行適度匯總。

ADS層(應(yīng)用數(shù)據(jù)層):ADS層的設(shè)計(jì)并不完全根據(jù)需求一對(duì)一建設(shè),而是結(jié)合不同需求對(duì)該層進(jìn)行統(tǒng)一設(shè)計(jì),以快速支持更多需求場(chǎng)景。

實(shí)時(shí)技術(shù)中的冪等機(jī)制: 冪等是一個(gè)數(shù)學(xué)概念,其特點(diǎn)是任意多次執(zhí)行產(chǎn)生的影響與一次執(zhí)行的影響相同,例如setTrue()函數(shù)就是一個(gè)冪等函數(shù),無(wú)論執(zhí)行多少次,結(jié)果都一樣。在復(fù)雜情況下(如網(wǎng)絡(luò)波動(dòng)、Storm重啟等),可能出現(xiàn)重復(fù)數(shù)據(jù),因此并非所有操作都是冪等的。在冪等的概念下,我們需要了解消息傳輸保障的三種機(jī)制:At most once、At least once和Exactly once。



At most once:消息傳輸機(jī)制上每條消息傳輸零次或一次,即消息可能丟失。

At least once:意味著每條消息會(huì)進(jìn)行多次傳輸嘗試,至少一次成功,即消息傳輸可能重復(fù)但不會(huì)丟失。

Exactly once:消息傳輸機(jī)制上每條消息有且只有一次,即消息傳輸既不會(huì)丟失也不會(huì)重復(fù)。

實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)中的多表關(guān)聯(lián): 在流式數(shù)據(jù)處理中,數(shù)據(jù)計(jì)算基于計(jì)算增量進(jìn)行,因此各個(gè)環(huán)節(jié)到達(dá)的時(shí)間和順序都是不確定且無(wú)序的。在這種情況下,進(jìn)行兩個(gè)表的關(guān)聯(lián)必須將數(shù)據(jù)存儲(chǔ)在內(nèi)存中。當(dāng)一條數(shù)據(jù)到達(dá)時(shí),需要在另一個(gè)表中查找數(shù)據(jù)。如果能夠找到則關(guān)聯(lián)成功,寫(xiě)入下游;如果找不到,則可以將其分到未分配數(shù)據(jù)集合中等待。為了提高數(shù)據(jù)查找性能,在實(shí)際處理中,通常會(huì)根據(jù)關(guān)聯(lián)主鍵對(duì)數(shù)據(jù)進(jìn)行分桶處理,減少查找數(shù)據(jù)量,提高性能。

實(shí)時(shí)技術(shù)中的洪峰挑戰(zhàn): 解決洪峰挑戰(zhàn)的主要思路如下:

  1. 合理分配獨(dú)占資源和共享資源:在一臺(tái)機(jī)器中,共享資源池可以被多個(gè)實(shí)時(shí)任務(wù)搶占。如果一個(gè)任務(wù)80%的時(shí)間都需要爭(zhēng)奪資源,可以考慮分配更多的獨(dú)占資源。

  2. 合理設(shè)置緩存機(jī)制:盡管內(nèi)存的讀寫(xiě)性能最好,但仍然有許多數(shù)據(jù)需要從讀庫(kù)更新。可以將熱門(mén)數(shù)據(jù)盡量保留在內(nèi)存中,并通過(guò)異步方式更新緩存。

  3. 計(jì)算合并單元:在流式計(jì)算框架中,拓?fù)浣Y(jié)構(gòu)層級(jí)越深,性能越差。考慮合并計(jì)算單元,可以有效降低數(shù)據(jù)傳輸、序列化等時(shí)間。

  4. 內(nèi)存共享:在海量數(shù)據(jù)處理中,大部分對(duì)象以字符串形式存在。合理共享對(duì)象在不同線程間,可以大幅降低字符拷貝帶來(lái)的性能消耗。

  5. 平衡高吞吐與低延遲:高吞吐與低延遲本身就是矛盾體。將多個(gè)讀寫(xiě)庫(kù)操作或ACK操作合并可以有效降低數(shù)據(jù)吞吐量,但也會(huì)增加延遲。可以在業(yè)務(wù)上取舍。

總結(jié): 在實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)的建設(shè)中,已經(jīng)有了常用的方案選擇。整體架構(gòu)設(shè)計(jì)通過(guò)分層設(shè)計(jì)為OLAP查詢分擔(dān)壓力,讓出計(jì)算空間,復(fù)雜的計(jì)算統(tǒng)一在實(shí)時(shí)計(jì)算層處理,避免給OLAP查詢帶來(lái)過(guò)大壓力。匯總計(jì)算交給OLAP數(shù)據(jù)庫(kù)進(jìn)行。

因此,在整個(gè)架構(gòu)中,實(shí)時(shí)計(jì)算通常使用Spark+Flink,消息隊(duì)列Kafka處于壟斷地位。在大數(shù)據(jù)領(lǐng)域,Kafka仍然是消息隊(duì)列應(yīng)用中的首選。Hbase、Redis和MySQL在特定場(chǎng)景下也有一席之地。


我們專注高端建站,小程序開(kāi)發(fā)、軟件系統(tǒng)定制開(kāi)發(fā)、BUG修復(fù)、物聯(lián)網(wǎng)開(kāi)發(fā)、各類(lèi)API接口對(duì)接開(kāi)發(fā)等。十余年開(kāi)發(fā)經(jīng)驗(yàn),每一個(gè)項(xiàng)目承諾做到滿意為止,多一次對(duì)比,一定讓您多一份收獲!

本文章出于推來(lái)客官網(wǎng),轉(zhuǎn)載請(qǐng)表明原文地址:https://www.tlkjt.com/sc/18437.html

在線客服

掃碼聯(lián)系客服

3985758

回到頂部

一级毛片视频免费| 中文字幕97| 人人干人人插| 国产一区二区精品久久91| 欧美1区| 国产一区二区精品在线观看| 精品国产一区二区三区精东影业| 亚洲精品永久一区| 黄视频网站免费观看| 欧美另类videosbestsex高清| 精品视频在线观看一区二区| 欧美18性精品| 色综合久久天天综合绕观看| 夜夜操网| 色综合久久天天综合观看| 成人在免费观看视频国产| 国产原创中文字幕| 成人影视在线观看| 美女免费精品高清毛片在线视| 精品久久久久久综合网| 韩国三级一区| 国产欧美精品| 日韩一级黄色片| 国产成人啪精品| 四虎影视久久久免费| 美女免费精品视频在线观看| 欧美a级片免费看| 精品久久久久久中文| 精品国产三级a∨在线观看| 日韩欧美一二三区| 四虎影视久久久| 国产成人啪精品| 日本特黄特黄aaaaa大片| 午夜精品国产自在现线拍| 精品国产一区二区三区免费 | 欧美激情伊人| 免费一级片在线观看| 国产伦理精品| 国产欧美精品午夜在线播放| 国产不卡在线观看视频| 97视频免费在线观看| 一级女人毛片人一女人| 成人免费网站视频ww| 99久久视频| 久久精品免视看国产成人2021| 二级片在线观看| 国产不卡在线看| 精品国产一区二区三区免费 | 日韩综合| 国产成人精品综合| 一级毛片视频播放| 九九久久国产精品大片| 九九精品在线| 九九久久99综合一区二区| 亚洲精品久久久中文字| 国产福利免费观看| 久久国产影视免费精品| 国产成人精品综合在线| a级精品九九九大片免费看| 成人免费观看视频| 精品国产香蕉在线播出| 一 级 黄 中国色 片| 日韩中文字幕在线观看视频| 国产一级生活片| 欧美a级片视频| 日韩综合| 日本特黄特色aaa大片免费| 香蕉视频久久| 精品视频免费在线| 国产原创视频在线| 九九九网站| 国产亚洲免费观看| 日韩av成人| 黄视频网站免费观看| 日韩专区第一页| 成人高清视频在线观看| 日韩专区一区| 国产一区二区精品| 99热精品一区| 夜夜操网| 国产一区免费在线观看| 国产网站在线| 国产麻豆精品视频| 精品久久久久久中文字幕一区| 久久久久久久久综合影视网| 国产网站免费视频| 国产不卡在线看| 欧美激情在线精品video| 欧美1区2区3区| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 欧美另类videosbestsex高清| 四虎影视久久久免费| 午夜家庭影院| 精品国产香蕉伊思人在线又爽又黄| 久久精品成人一区二区三区| 日韩在线观看视频免费| 夜夜操网| 免费国产在线观看| 精品视频免费在线| 黄视频网站免费| 可以在线看黄的网站| 欧美18性精品| 精品视频免费看| 国产91素人搭讪系列天堂| 欧美a级片免费看| 国产高清视频免费观看| 国产一区免费在线观看| 精品国产一级毛片| 精品国产亚一区二区三区| 久草免费在线观看| 99久久精品国产高清一区二区| 日本特黄特黄aaaaa大片 | 日韩专区亚洲综合久久| 高清一级毛片一本到免费观看| 人人干人人插| 国产一区二区高清视频| 国产一区二区精品在线观看| 尤物视频网站在线观看| 日韩在线观看视频黄| 久久成人性色生活片| 日本免费区| 久久福利影视| 一级片免费在线观看视频| 色综合久久天天综合观看| 999精品在线| 午夜欧美成人香蕉剧场| 欧美国产日韩精品| 亚欧乱色一区二区三区| 九九精品久久久久久久久| 国产网站免费观看| 国产欧美精品午夜在线播放| a级黄色毛片免费播放视频| 日韩在线观看网站| 美国一区二区三区| 国产成人精品综合在线| 国产伦精品一区二区三区无广告 | 黄视频网站在线免费观看| 日韩在线观看视频网站| 毛片的网站| 亚洲精品影院| 青青久久精品| 四虎久久影院| 一a一级片| 午夜在线影院| 精品视频在线观看视频免费视频| 九九热国产视频| 91麻豆精品国产高清在线| 国产不卡在线看| 黄视频网站免费观看| 国产麻豆精品免费密入口| 国产视频一区二区在线播放| 99热精品在线| 一级片片| 成人a大片在线观看| 国产伦精品一区二区三区无广告 | 国产a视频精品免费观看| 四虎久久精品国产| 韩国毛片免费大片| 国产a一级| 黄色免费三级| 成人高清免费| 日韩中文字幕一区二区不卡| 精品国产香蕉在线播出| 免费国产在线观看| 九九精品在线| 日韩专区亚洲综合久久| 99热视热频这里只有精品| 日韩中文字幕在线播放| 国产麻豆精品免费视频| 日本免费乱理伦片在线观看2018| 成人在免费观看视频国产| 一本高清在线| 国产一区二区精品久久91| 午夜精品国产自在现线拍| 99色视频在线| 精品久久久久久综合网| 国产视频网站在线观看| 可以免费在线看黄的网站| 国产精品1024永久免费视频| 美女免费精品视频在线观看| 四虎久久精品国产| 九九免费精品视频| 国产伦久视频免费观看 视频| 免费国产在线观看不卡| 日本在线www| 日日日夜夜操| 韩国毛片| 精品久久久久久免费影院| 亚欧成人乱码一区二区| 韩国毛片基地| a级毛片免费观看网站| 91麻豆精品国产片在线观看| 亚洲精品久久久中文字| 欧美日本免费| 97视频免费在线观看| 九九精品久久久久久久久| 99久久网站| 精品久久久久久综合网| 欧美激情伊人| 国产美女在线观看|