Oracle OAC使用機(jī)器學(xué)習(xí)進(jìn)行線性回歸預(yù)測(cè)

1. OAC簡(jiǎn)介

Oracle Analytics Cloud empowers business analysts and consumers with modern, AI-powered, self-service analytics capabilities for data preparation, visualization, enterprise reporting, augmented analysis, and natural language processing/generation.

OAC(Oracle analytic Cloud,甲骨文分析云),就是甲骨文最新云版數(shù)據(jù)可視化和數(shù)據(jù)分析工具。
更多OAC知識(shí)請(qǐng)移步OAC文檔。

數(shù)據(jù)可視化界面

2. 文檔描述

此技術(shù)文檔主要描述了在OAC中如何使用機(jī)器學(xué)習(xí),使用回歸算法訓(xùn)練一個(gè)模型,根據(jù)優(yōu)惠編碼和日期預(yù)測(cè)銷售數(shù)量,包括建立模型和應(yīng)用模型。主要面對(duì)的是OAC工具的使用,機(jī)器學(xué)習(xí)算法明細(xì)不在此文檔范圍內(nèi)。

3. 創(chuàng)建和訓(xùn)練模型

3.1 創(chuàng)建數(shù)據(jù)流

我們選擇Oracle ADW自帶的銷售數(shù)據(jù)(sh.sales表)作為數(shù)據(jù)集。
我們需要用time_id, promo_id來(lái)預(yù)測(cè)quantity字段,為了后面篩選數(shù)據(jù),添加product_id字段,所以需要取數(shù)據(jù)集這四個(gè)字段:

  • Product_id
  • Time_id
  • Promo_id
  • quantity


    創(chuàng)建數(shù)據(jù)流

3.2 添加篩選器

因OAC中ML一次只能運(yùn)行不超過(guò)12500數(shù)據(jù),我們做一個(gè)篩選,只選取product_id為30的數(shù)據(jù)。


添加篩選器1

添加篩選器2

添加篩選器3

3.3. 添加訓(xùn)練數(shù)字預(yù)測(cè)步驟

這里我們選擇線性回歸作為此次預(yù)測(cè)算法。


添加訓(xùn)練數(shù)字預(yù)測(cè)步驟1

添加訓(xùn)練數(shù)字預(yù)測(cè)步驟2

3.4 配置線性回歸模型參數(shù)

在Target中選擇QUANTITY列作為預(yù)測(cè)目標(biāo)列;


配置線性回歸模型參數(shù)1

回歸方法選擇OLS,即最小二乘法;
其它參數(shù)請(qǐng)參見(jiàn)線性回歸相關(guān)機(jī)器學(xué)習(xí)知識(shí)。


配置線性回歸模型參數(shù)2

3.5 保存模型

添加保存模型步驟,取模型名稱為regr_test,注意,名稱最好為英文。


保存模型

3.6. 運(yùn)行數(shù)據(jù)流訓(xùn)練模型

點(diǎn)擊右上角運(yùn)行數(shù)據(jù)流按鈕,運(yùn)行時(shí)會(huì)提示需要先保存數(shù)據(jù)流。


運(yùn)行數(shù)據(jù)流訓(xùn)練模型1

運(yùn)行數(shù)據(jù)流訓(xùn)練模型2

4. 查看生成的模型

主菜單 > 機(jī)器學(xué)習(xí) 可查看創(chuàng)建的模型。


查看生成的模型1

鼠標(biāo)指針?lè)胖迷谀P土猩?,點(diǎn)擊右邊圖標(biāo)按鈕,點(diǎn)擊檢查菜單可查看模型信息。


查看生成的模型2

查看生成的模型3

5. 應(yīng)用模型預(yù)測(cè)數(shù)據(jù)

準(zhǔn)備測(cè)試數(shù)據(jù),可以手工創(chuàng)建,我們需要的是指定promo_id和time_id,然后應(yīng)用建立的regr_test模型,預(yù)測(cè)quantity值。

5.1. 準(zhǔn)備數(shù)據(jù)

需要準(zhǔn)備測(cè)試集數(shù)據(jù),用于驗(yàn)證模型。這里從sh.sales中隨機(jī)抽取了一定量數(shù)據(jù)用于演示。

5.2. 添加應(yīng)用模型步驟

這里我們選擇開(kāi)始建立的regr_test模型。


添加應(yīng)用模型步驟1

添加應(yīng)用模型步驟2

指定輸出列名稱,這里我們保持系統(tǒng)自動(dòng)生成的名稱。
在輸入欄里指定列的映射。


在輸入欄里指定列的映射

5.3. 添加保存數(shù)據(jù)步驟

該步驟會(huì)生成一個(gè)新的數(shù)據(jù)集,這里我們指定名稱為Test Data Set。


保存數(shù)據(jù)1

保存數(shù)據(jù)2

5.4. 運(yùn)行數(shù)據(jù)流生成包含預(yù)測(cè)列的數(shù)據(jù)集

運(yùn)行前會(huì)要求保存數(shù)據(jù)流。


保存數(shù)據(jù)流

運(yùn)行成功后我們能在數(shù)據(jù)集中查看建立的數(shù)據(jù)集。


查看數(shù)據(jù)集

6. 建立項(xiàng)目查看預(yù)測(cè)值和原值匹配程度

因本次訓(xùn)練集和測(cè)試集為同一表,故按時(shí)間求和后數(shù)據(jù)完全一致。如測(cè)試數(shù)據(jù)為新建數(shù)據(jù),更能驗(yàn)證預(yù)測(cè)準(zhǔn)確率。
其中數(shù)量列為實(shí)際值,PredictedValue列為預(yù)測(cè)值。

查看預(yù)測(cè)值和原值匹配程度

7. 結(jié)語(yǔ)

原創(chuàng)文章,需轉(zhuǎn)載請(qǐng)留言和私信聯(lián)系。如有疑問(wèn),歡迎留言或私信共同探討。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容