|
Pentaho編排Apache火花工作補(bǔ)充道,灰鴿子使用教程,灰鴿子遠(yuǎn)程控制軟件
Pentaho宣布本土Pentaho數(shù)據(jù)集成的集成(PDI)和Apache火花,使火花的編制工作。
1.jpg (75.46 KB, 下載次數(shù): 1286)
下載附件
2015-5-15 09:45 上傳
Pentaho實(shí)驗(yàn)室在過(guò)去的幾年中,Pentaho業(yè)務(wù)分析專家的研究機(jī)構(gòu),制定各種大數(shù)據(jù)映射用例組織投產(chǎn)的努力提供大數(shù)據(jù)的藍(lán)圖,如果你將一個(gè)大數(shù)據(jù)堆棧。最近,Pentaho實(shí)驗(yàn)室與Apache火花,奉行相同的路徑,今天宣布本機(jī)Pentaho數(shù)據(jù)集成的集成(PDI)和Apache火花,這將使火花的編制工作。
我不是對(duì)技術(shù)持懷疑的態(tài)度,但我懷疑很多的炒作。還有一些人說(shuō)一些火花,是非常不現(xiàn)實(shí)的。
PDI本質(zhì)上是一個(gè)便攜式的ETL、數(shù)據(jù)機(jī)可以部署為一個(gè)獨(dú)立的Pentaho集群或在一個(gè)Hadoop集群通過(guò)MapReduce或紗線。周二的聲明補(bǔ)充道火花,使更快的大數(shù)據(jù)ETL處理。ETL設(shè)計(jì)師可以設(shè)計(jì)、測(cè)試和調(diào)優(yōu)在PDI ETL工作使用圖形設(shè)計(jì)環(huán)境,然后在引發(fā)規(guī)模運(yùn)行它們。
[相關(guān):本地?cái)?shù)據(jù)分析涉及到MongoDB]
Apache火花是一個(gè)集群計(jì)算框架設(shè)計(jì)之上的Hadoop分布式文件系統(tǒng)(HDFS)Hadoop MapReduce的地方。
支持內(nèi)存集群計(jì)算,火花可以實(shí)現(xiàn)性能比Hadoop MapReduce快100倍的內(nèi)存或磁盤上的快10倍。
火花可以是一個(gè)優(yōu)秀的計(jì)算數(shù)據(jù)處理工作流引擎,高級(jí)分析、流處理和業(yè)務(wù)智能/視覺分析。
但火花還年輕——它只有v1.0發(fā)布12個(gè)月前,它仍然是非常棘手的,遠(yuǎn)程控制軟件。
首先,Pentaho聯(lián)合創(chuàng)始人兼首席技術(shù)官詹姆斯·迪克森說(shuō),火花的用例在野外生產(chǎn)的幾乎都是數(shù)據(jù)科學(xué)的用例。
“這就是它——一個(gè)單用戶數(shù)據(jù)的科學(xué)工具,”迪克森說(shuō)。“這不是為流設(shè)計(jì),但引發(fā)流。這不是專為SQL,但是有火花SQL”。
內(nèi)存管理與火花是特別困難的,他說(shuō):灰鴿子教程,灰鴿子使用教程。
“火花的用戶,你將知道你的數(shù)據(jù)量是否會(huì)適合記憶,”他說(shuō)!坝兴膫(gè)不同的記憶模式,你必須選擇正確的一個(gè)!
(相關(guān):10熱hadoop初創(chuàng)公司看)
如果你添加多個(gè)用戶,它變得更加復(fù)雜。然后你需要了解每個(gè)人的內(nèi)存占用,同時(shí)希望利用火花。
也就是說(shuō),火花SQL是數(shù)量級(jí)的速度比蜂巢,迪克森說(shuō),甚至有重大的承諾而黑斑羚。
“有一個(gè)巨大的承諾,”他說(shuō)!拔也粦岩傻募夹g(shù),但我懷疑很多的炒作。還有一些人說(shuō)一些火花,是非常不現(xiàn)實(shí)的!
迪克森指出,Pentaho實(shí)驗(yàn)室一直在嘗試可能引發(fā)用例基于大數(shù)據(jù)的藍(lán)圖和規(guī)模企業(yè)市場(chǎng)機(jī)會(huì)引發(fā)過(guò)去兩年。Hadoop市場(chǎng),Pentaho用例合并在過(guò)去的幾年中三大類:數(shù)據(jù)倉(cāng)庫(kù)優(yōu)化,精簡(jiǎn)數(shù)據(jù)源到數(shù)據(jù)煉油廠和混合操作數(shù)據(jù)源和大數(shù)據(jù)來(lái)源來(lái)獲取客戶的360度視圖。
“第一Hadoop的5至7年的時(shí)間,我們沒有這些模式,”他說(shuō)!艾F(xiàn)在又摻入了火花,我們又回到了原地。(作為一個(gè)行業(yè))我們不確定這項(xiàng)技術(shù)可以用于什么,它應(yīng)該是做什么用的!
但這就是Pentaho實(shí)驗(yàn)室的原因存在,迪克森說(shuō),F(xiàn)在,Pentaho數(shù)據(jù)集成為Apache火花有Pentaho實(shí)驗(yàn)室。Pentaho計(jì)劃通?梢栽2015年6月。 |
|