久久精品中文字幕,狠狠色丁香婷婷综合,精品国产制服丝袜高跟,国内精品久久久久久久久齐齐 ,国模冰莲极品自慰人体

灰鴿子遠程控制軟件

 找回密碼
 立即注冊

QQ登錄

只需一步,快速開始

查看: 10956|回復: 0
打印 上一主題 下一主題

Apache PredictionIO:使用Spark輕松學習機器

[復制鏈接]
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2017-10-28 10:47:56 | 只看該作者 |只看大圖 回帖獎勵 |倒序瀏覽 |閱讀模式
Apache PredictionIO:使用Spark輕松學習機器

現(xiàn)在Apache指導下的一個開源項目使用模板系統(tǒng)來輕松地訓練和部署Spark-powered機器學習模型
Apache基金會向其名單添加了一個新的機器學習項目,Apache PredictionIO是由Salesforce的子公司最初設計的項目的開源版本。

什么PredictionIO用于機器學習和Spark

Apache PredictionIO構建在Spark和Hadoop之上,并通過使用可定制模板進行常規(guī)任務的數(shù)據(jù)的Spark功能預測。應用程序?qū)?shù)據(jù)發(fā)送到PredictionIO的事件服務器以訓練模型,然后根據(jù)模型查詢引擎的預測。

Spark,MLlib,HBase,Spray和Elasticsearch都與PredictionIO捆綁在一起,Apache提供支持Java,PHP,Python和Ruby的SDK。數(shù)據(jù)可以存儲在各種后端:JDBC,Elasticsearch,HBase,HDFS及其本地文件系統(tǒng)都是開箱即用的。后端是可插拔的,所以開發(fā)人員可以創(chuàng)建一個定制的后端連接器。

PredictionIO模板如何使Spark更容易預測

PredictionIO最顯著的優(yōu)點是其創(chuàng)建機器學習引擎的模板系統(tǒng)。模板減少了設置系統(tǒng)以提供特定類型的預測所需的繁重的提升。它們描述了任務可能需要的任何第三方依賴關系,例如Apache Mahout機器學習應用程序框架。

一些現(xiàn)有的模板包括:

普遍推薦引擎。
文本分類。
生存分析(故障預測之間的時間)。
使用維基百科標識主題作為知識庫。
相似度分析
一些模板還與其他機器學習產(chǎn)品集成。例如,目前在PredictionIO畫廊中的兩個預測模板,用于流失率檢測和一般建議,使用H2O.ai的Sparkling Water增強功能。

PredictionIO還可以自動評估預測引擎,以確定與之一起使用的最佳超參數(shù)。開發(fā)人員需要選擇和設置如何做到這一點的指標,但這樣做的工作通常比在手動調(diào)整超參數(shù)方面要少得多。

作為服務運行時,PredictionIO可以單獨接受或作為批處理。只要批量預測作業(yè)中使用的算法都可串行化,批量預測將在Spark群集中自動并行化。 (PredictionIO的默認算法是。)

哪里可以下載PredictionIO

PredictionIO的源代碼可在GitHub上找到。為方便起見,可以使用各種Docker圖像,以及Heroku構建包。


評帖賺銀幣(0) 收起
分享到:  QQ好友和群QQ好友和群
收藏收藏
您需要登錄后才可以回帖 登錄 | 立即注冊

本版積分規(guī)則

Archiver|手機版|小黑屋|灰鴿子遠程控制軟件|灰鴿子遠程控制軟件 ( 魯ICP備14000061號-4 )

GMT+8, 2025-7-4 18:10 , Processed in 0.062548 second(s), 24 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回復 返回頂部 返回列表