|
MapR自助SQL分析補(bǔ)充道 灰鴿子遠(yuǎn)程控制軟件,灰鴿子使用教程
MapR技術(shù)更新與Apache的Hadoop分布鉆1.0支持獨(dú)立于SQL為大數(shù)據(jù)分析。
1.jpg (118.16 KB, 下載次數(shù): 1761)
下載附件
2015-5-20 10:56 上傳
今天MapR技術(shù)更新其Hadoop分布來(lái)支持SQL分析自助服務(wù)。
公司介紹Apache鉆去年9月的0.5,但現(xiàn)在取而代之的是Apache鉆1.0版本。
鉆是一個(gè)開(kāi)源的分布式ANSI SQL查詢(xún)引擎自助數(shù)據(jù)探索——上鉆一個(gè)開(kāi)源版本的谷歌的小孔系統(tǒng)交互查詢(xún)大型數(shù)據(jù)集,它的權(quán)力BigQuery服務(wù)。
Apache鉆機(jī)項(xiàng)目的目標(biāo)是使它可以擴(kuò)展到10000個(gè)服務(wù)器或更多在處理海量數(shù)據(jù)和數(shù)萬(wàn)億記錄的秒。
鉆到數(shù)據(jù)
鉆允許您與來(lái)自遺留事務(wù)系統(tǒng)和新數(shù)據(jù)源的數(shù)據(jù),包括物聯(lián)網(wǎng)傳感器(物聯(lián)網(wǎng)),Web click-streams和其他半結(jié)構(gòu)化數(shù)據(jù),支持流行的商業(yè)智能(BI)和數(shù)據(jù)可視化工具。也許最重要的是,這是一個(gè)獨(dú)立于大數(shù)據(jù)的SQL引擎。因?yàn)樗恍枰A(yù)定義的模式定義,它沒(méi)有將自己插入到中間的發(fā)現(xiàn)過(guò)程來(lái)平數(shù)據(jù)。
“這是被強(qiáng)調(diào),這是一個(gè)雞和蛋的問(wèn)題,”杰克諾里斯說(shuō),MapR的名頭。“我們想要探索這個(gè)數(shù)據(jù),但是我們?nèi)绾蝺?yōu)先考慮我們想工作如果我們不知道我們所要找的!
諾里斯說(shuō),利用鉆提供了數(shù)據(jù)的靈活性。例如,JSON文件混亂的結(jié)構(gòu)。它們包含自己的模式,這可能很復(fù)雜,幾乎record-by-record可以改變。一個(gè)文檔可能購(gòu)買(mǎi)的名字。未來(lái)可能包括購(gòu)買(mǎi)和數(shù)據(jù)的配偶和孩子嵌套。當(dāng)你進(jìn)入物聯(lián)網(wǎng)數(shù)據(jù),您可能已經(jīng)JSON文件從成千上萬(wàn)的設(shè)備,每個(gè)數(shù)據(jù)集可能都有不同的格式。
[相關(guān)最好的開(kāi)源大數(shù)據(jù)工具):灰鴿子下載。
“你必須摧毀它或做一些類(lèi)型的子選擇,”諾里斯表示。“這是典型的IT功能來(lái)決定如何表示這些數(shù)據(jù)。這是與其他的工具!
鉆,另一方面,是為了處理嵌套結(jié)構(gòu),不需要介入平出來(lái),提前找出哪些數(shù)據(jù)是很重要的。
諾里斯還指出,擁抱Apache鉆MapR的合作伙伴生態(tài)系統(tǒng),包括:信息建筑商,JReport(Jinfonet軟件),MicroStrategy,Qlik,SAP,辛巴,畫(huà)面和TIBCO。他們都是與MapR和鉆社區(qū)密切合作與鉆可互操作的BI工具通過(guò)標(biāo)準(zhǔn)ODBC / JDBC連接。鉆Explorer坐落在ODBC驅(qū)動(dòng)程序,瀏覽數(shù)據(jù)可以通過(guò)鉆和公開(kāi)透明的視角模式,支持無(wú)縫的和快速的自助服務(wù)數(shù)據(jù)探索。
獲得實(shí)時(shí)的洞察力
“Apache的可用性鉆MapR SQL-on-Hadoop項(xiàng)目分布是一個(gè)重要的里程碑,這是重要的在提供實(shí)時(shí)的見(jiàn)解從復(fù)雜數(shù)據(jù)格式,而不需要任何數(shù)據(jù)準(zhǔn)備,”馬特•Aslett研究主任的數(shù)據(jù)平臺(tái)和分析,451年研究,周二在一個(gè)新聞聲明中說(shuō),遠(yuǎn)程控制軟件。 |
|