|
MapR自助SQL分析補充道 灰鴿子遠程控制軟件,灰鴿子使用教程
MapR技術(shù)更新與Apache的Hadoop分布鉆1.0支持獨立于SQL為大數(shù)據(jù)分析。
1.jpg (118.16 KB, 下載次數(shù): 1761)
下載附件
2015-5-20 10:56 上傳
今天MapR技術(shù)更新其Hadoop分布來支持SQL分析自助服務(wù)。
公司介紹Apache鉆去年9月的0.5,但現(xiàn)在取而代之的是Apache鉆1.0版本。
鉆是一個開源的分布式ANSI SQL查詢引擎自助數(shù)據(jù)探索——上鉆一個開源版本的谷歌的小孔系統(tǒng)交互查詢大型數(shù)據(jù)集,它的權(quán)力BigQuery服務(wù)。
Apache鉆機項目的目標(biāo)是使它可以擴展到10000個服務(wù)器或更多在處理海量數(shù)據(jù)和數(shù)萬億記錄的秒。
鉆到數(shù)據(jù)
鉆允許您與來自遺留事務(wù)系統(tǒng)和新數(shù)據(jù)源的數(shù)據(jù),包括物聯(lián)網(wǎng)傳感器(物聯(lián)網(wǎng)),Web click-streams和其他半結(jié)構(gòu)化數(shù)據(jù),支持流行的商業(yè)智能(BI)和數(shù)據(jù)可視化工具。也許最重要的是,這是一個獨立于大數(shù)據(jù)的SQL引擎。因為它不需要預(yù)定義的模式定義,它沒有將自己插入到中間的發(fā)現(xiàn)過程來平數(shù)據(jù)。
“這是被強調(diào),這是一個雞和蛋的問題,”杰克諾里斯說,MapR的名頭。“我們想要探索這個數(shù)據(jù),但是我們?nèi)绾蝺?yōu)先考慮我們想工作如果我們不知道我們所要找的!
諾里斯說,利用鉆提供了數(shù)據(jù)的靈活性。例如,JSON文件混亂的結(jié)構(gòu)。它們包含自己的模式,這可能很復(fù)雜,幾乎record-by-record可以改變。一個文檔可能購買的名字。未來可能包括購買和數(shù)據(jù)的配偶和孩子嵌套。當(dāng)你進入物聯(lián)網(wǎng)數(shù)據(jù),您可能已經(jīng)JSON文件從成千上萬的設(shè)備,每個數(shù)據(jù)集可能都有不同的格式。
[相關(guān)最好的開源大數(shù)據(jù)工具):灰鴿子下載。
“你必須摧毀它或做一些類型的子選擇,”諾里斯表示!斑@是典型的IT功能來決定如何表示這些數(shù)據(jù)。這是與其他的工具!
鉆,另一方面,是為了處理嵌套結(jié)構(gòu),不需要介入平出來,提前找出哪些數(shù)據(jù)是很重要的。
諾里斯還指出,擁抱Apache鉆MapR的合作伙伴生態(tài)系統(tǒng),包括:信息建筑商,JReport(Jinfonet軟件),MicroStrategy,Qlik,SAP,辛巴,畫面和TIBCO。他們都是與MapR和鉆社區(qū)密切合作與鉆可互操作的BI工具通過標(biāo)準(zhǔn)ODBC / JDBC連接。鉆Explorer坐落在ODBC驅(qū)動程序,瀏覽數(shù)據(jù)可以通過鉆和公開透明的視角模式,支持無縫的和快速的自助服務(wù)數(shù)據(jù)探索。
獲得實時的洞察力
“Apache的可用性鉆MapR SQL-on-Hadoop項目分布是一個重要的里程碑,這是重要的在提供實時的見解從復(fù)雜數(shù)據(jù)格式,而不需要任何數(shù)據(jù)準(zhǔn)備,”馬特•Aslett研究主任的數(shù)據(jù)平臺和分析,451年研究,周二在一個新聞聲明中說,遠程控制軟件。 |
|