日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区

您的位置:首頁技術文章
文章詳情頁

詳解用Python進行時間序列預測的7種方法

瀏覽:31日期:2022-08-02 13:29:17

數據準備

數據集(JetRail高鐵的乘客數量)下載.

假設要解決一個時序問題:根據過往兩年的數據(2012 年 8 月至 2014 年 8月),需要用這些數據預測接下來 7 個月的乘客數量。

import pandas as pd import numpy as np import matplotlib.pyplot as plt df = pd.read_csv(’train.csv’)df.head()df.shape

依照上面的代碼,我們獲得了 2012-2014 年兩年每個小時的乘客數量。為了解釋每種方法的不同之處,以每天為單位構造和聚合了一個數據集。

從 2012 年 8 月- 2013 年 12 月的數據中構造一個數據集。 創建 train and test 文件用于建模。前 14 個月( 2012 年 8 月- 2013 年 10 月)用作訓練數據,后兩個月(2013 年 11 月 ? 2013 年 12 月)用作測試數據。 以每天為單位聚合數據集。

import pandas as pdimport matplotlib.pyplot as plt # Subsetting the dataset# Index 11856 marks the end of year 2013df = pd.read_csv(’train.csv’, nrows=11856) # Creating train and test set# Index 10392 marks the end of October 2013train = df[0:10392]test = df[10392:] # Aggregating the dataset at daily leveldf[’Timestamp’] = pd.to_datetime(df[’Datetime’], format=’%d-%m-%Y %H:%M’) # 4位年用Y,2位年用ydf.index = df[’Timestamp’]df = df.resample(’D’).mean() #按天采樣,計算均值 train[’Timestamp’] = pd.to_datetime(train[’Datetime’], format=’%d-%m-%Y %H:%M’)train.index = train[’Timestamp’]train = train.resample(’D’).mean() # test[’Timestamp’] = pd.to_datetime(test[’Datetime’], format=’%d-%m-%Y %H:%M’)test.index = test[’Timestamp’]test = test.resample(’D’).mean() #Plotting datatrain.Count.plot(figsize=(15,8), title= ’Daily Ridership’, fontsize=14)test.Count.plot(figsize=(15,8), title= ’Daily Ridership’, fontsize=14)plt.show()

我們將數據可視化(訓練數據和測試數據一起),從而得知在一段時間內數據是如何變化的。

詳解用Python進行時間序列預測的7種方法

方法1:樸素法

假設 y 軸表示物品的價格,x 軸表示時間(天)

詳解用Python進行時間序列預測的7種方法

如果數據集在一段時間內都很穩定,我們想預測第二天的價格,可以取前面一天的價格,預測第二天的值。這種假設第一個預測點和上一個觀察點相等的預測方法就叫樸素法。即 $hat{y_{t+1}} = y_t$

dd = np.asarray(train[’Count’])y_hat = test.copy()y_hat[’naive’] = dd[len(dd) - 1]plt.figure(figsize=(12, 8))plt.plot(train.index, train[’Count’], label=’Train’)plt.plot(test.index, test[’Count’], label=’Test’)plt.plot(y_hat.index, y_hat[’naive’], label=’Naive Forecast’)plt.legend(loc=’best’)plt.title('Naive Forecast')plt.show()

詳解用Python進行時間序列預測的7種方法

樸素法并不適合變化很大的數據集,最適合穩定性很高的數據集。我們計算下均方根誤差,檢查模型在測試數據集上的準確率:

from sklearn.metrics import mean_squared_errorfrom math import sqrt rms = sqrt(mean_squared_error(test[’Count’], y_hat[’naive’]))print(rms)

最終均方誤差RMS為:43.91640614391676

方法2:簡單平均法

詳解用Python進行時間序列預測的7種方法

物品價格會隨機上漲和下跌,平均價格會保持一致。我們經常會遇到一些數據集,雖然在一定時期內出現小幅變動,但每個時間段的平均值確實保持不變。這種情況下,我們可以預測出第二天的價格大致和過去天數的價格平均值一致。這種將預期值等同于之前所有觀測點的平均值的預測方法就叫簡單平均法。即詳解用Python進行時間序列預測的7種方法

y_hat_avg = test.copy()y_hat_avg[’avg_forecast’] = train[’Count’].mean()plt.figure(figsize=(12,8))plt.plot(train[’Count’], label=’Train’)plt.plot(test[’Count’], label=’Test’)plt.plot(y_hat_avg[’avg_forecast’], label=’Average Forecast’)plt.legend(loc=’best’)plt.show()

詳解用Python進行時間序列預測的7種方法

物品價格在一段時間內大幅上漲,但后來又趨于平穩。我們也經常會遇到這種數據集,比如價格或銷售額某段時間大幅上升或下降。如果我們這時用之前的簡單平均法,就得使用所有先前數據的平均值,但在這里使用之前的所有數據是說不通的,因為用開始階段的價格值會大幅影響接下來日期的預測值。因此,我們只取最近幾個時期的價格平均值。很明顯這里的邏輯是只有最近的值最要緊。這種用某些窗口期計算平均值的預測方法就叫移動平均法。

計算移動平均值涉及到一個有時被稱為“滑動窗口”的大小值p。使用簡單的移動平均模型,我們可以根據之前數值的固定有限數p的平均值預測某個時序中的下一個值。這樣,對于所有的 i > p:

詳解用Python進行時間序列預測的7種方法

在上文移動平均法可以看到,我們對“p”中的觀察值賦予了同樣的權重。但是我們可能遇到一些情況,比如“p”中每個觀察值會以不同的方式影響預測結果。將過去觀察值賦予不同權重的方法就叫做加權移動平均法。加權移動平均法其實還是一種移動平均法,只是“滑動窗口期”內的值被賦予不同的權重,通常來講,最近時間點的值發揮的作用更大了。即

詳解用Python進行時間序列預測的7種方法

這種方法并非選擇一個窗口期的值,而是需要一列權重值(相加后為1)。例如,如果我們選擇[0.40, 0.25, 0.20, 0.15]作為權值,我們會為最近的4個時間點分別賦給40%,25%,20%和15%的權重。

方法4:簡單指數法

我們注意到簡單平均法和加權移動平均法在選取時間點的思路上存在較大的差異。我們就需要在這兩種方法之間取一個折中的方法,在將所有數據考慮在內的同時也能給數據賦予不同非權重。例如,相比更早時期內的觀測值,它會給近期的觀測值賦予更大的權重。按照這種原則工作的方法就叫做簡單指數平滑法。它通過加權平均值計算出預測值,其中權重隨著觀測值從早期到晚期的變化呈指數級下降,最小的權重和最早的觀測值相關:

詳解用Python進行時間序列預測的7種方法

其中0≤α≤1是平滑參數。對時間點T+1的單步預測值是時序$y_1,…,y_T$的所有觀測值的加權平均數。權重下降的速率由參數α控制,預測值$hat{y}_x$是$alpha cdot y_t $與$(1-alpha) cdot hat{y}_x$的和。

因此,它可以寫為:

詳解用Python進行時間序列預測的7種方法

所以本質上,我們是用兩個權重α和1−α得到一個加權移動平均值,讓表達式呈遞進形式。

from statsmodels.tsa.api import SimpleExpSmoothing y_hat_avg = test.copy()fit = SimpleExpSmoothing(np.asarray(train[’Count’])).fit(smoothing_level=0.6, optimized=False)y_hat_avg[’SES’] = fit.forecast(len(test))plt.figure(figsize=(16, 8))plt.plot(train[’Count’], label=’Train’)plt.plot(test[’Count’], label=’Test’)plt.plot(y_hat_avg[’SES’], label=’SES’)plt.legend(loc=’best’)plt.show()

模型中使用的α值為0.6,我們可以用測試集繼續調整參數以生成一個更好的模型。

方法5:霍爾特(Holt)線性趨勢法

假設y軸表示某個物品的價格,x軸表示時間(天)。

詳解用Python進行時間序列預測的7種方法

如果物品的價格是不斷上漲的(見上圖),我們上面的方法并沒有考慮這種趨勢,即我們在一段時間內觀察到的價格的總體模式。

每個時序數據集可以分解為相應的幾個部分:趨勢(Trend),季節性(Seasonal)和殘差(Residual)。任何呈現某種趨勢的數據集都可以用霍爾特線性趨勢法用于預測。

import statsmodels.api as sm sm.tsa.seasonal_decompose(train[’Count’]).plot()result = sm.tsa.stattools.adfuller(train[’Count’])plt.show()

詳解用Python進行時間序列預測的7種方法

我們從圖中可以看出,該數據集呈上升趨勢。因此我們可以用霍爾特線性趨勢法預測未來價格。該算法包含三個方程:一個水平方程,一個趨勢方程,一個方程將二者相加以得到預測值$hat{y}$:

詳解用Python進行時間序列預測的7種方法

我們在上面算法中預測的值稱為水平(level)。正如簡單指數平滑一樣,這里的水平方程顯示它是觀測值和樣本內單步預測值的加權平均數,趨勢方程顯示它是根據 ℓ(t)−ℓ(t−1) 和之前的預測趨勢 b(t−1) 在時間t處的預測趨勢的加權平均值。

我們將這兩個方程相加,得出一個預測函數。我們也可以將兩者相乘而不是相加得到一個乘法預測方程。當趨勢呈線性增加和下降時,我們用相加得到的方程;當趨勢呈指數級增加或下降時,我們用相乘得到的方程。實踐操作顯示,用相乘得到的方程,預測結果會更穩定,但用相加得到的方程,更容易理解。

詳解用Python進行時間序列預測的7種方法

from statsmodels.tsa.api import Holt y_hat_avg = test.copy() fit = Holt(np.asarray(train[’Count’])).fit(smoothing_level=0.3, smoothing_slope=0.1)y_hat_avg[’Holt_linear’] = fit.forecast(len(test)) plt.figure(figsize=(16, 8))plt.plot(train[’Count’], label=’Train’)plt.plot(test[’Count’], label=’Test’)plt.plot(y_hat_avg[’Holt_linear’], label=’Holt_linear’)plt.legend(loc=’best’)plt.show()

詳解用Python進行時間序列預測的7種方法

這種方法能夠準確地顯示出趨勢,因此比前面的幾種模型效果更好。如果調整一下參數,結果會更好。

方法6:Holt-Winters季節性預測模型

在應用這種算法前,我們先介紹一個新術語。假如有家酒店坐落在半山腰上,夏季的時候生意很好,顧客很多,但每年其余時間顧客很少。因此,每年夏季的收入會遠高于其它季節,而且每年都是這樣,那么這種重復現象叫做“季節性”(Seasonality)。如果數據集在一定時間段內的固定區間內呈現相似的模式,那么該數據集就具有季節性。

詳解用Python進行時間序列預測的7種方法

我們之前討論的5種模型在預測時并沒有考慮到數據集的季節性,因此我們需要一種能考慮這種因素的方法。應用到這種情況下的算法就叫做Holt-Winters季節性預測模型,它是一種三次指數平滑預測,其背后的理念就是除了水平和趨勢外,還將指數平滑應用到季節分量上。

Holt-Winters季節性預測模型由預測函數和三次平滑函數——一個是水平函數ℓt,一個是趨勢函數bt,一個是季節分量 st,以及平滑參數α,β和γ。

詳解用Python進行時間序列預測的7種方法

其中 s 為季節循環的長度,0≤α≤ 1, 0 ≤β≤ 1 , 0≤γ≤ 1。水平函數為季節性調整的觀測值和時間點t處非季節預測之間的加權平均值。趨勢函數和霍爾特線性方法中的含義相同。季節函數為當前季節指數和去年同一季節的季節性指數之間的加權平均值。在本算法,我們同樣可以用相加和相乘的方法。當季節性變化大致相同時,優先選擇相加方法,而當季節變化的幅度與各時間段的水平成正比時,優先選擇相乘的方法。

from statsmodels.tsa.api import ExponentialSmoothing y_hat_avg = test.copy()fit1 = ExponentialSmoothing(np.asarray(train[’Count’]), seasonal_periods=7, trend=’add’, seasonal=’add’, ).fit()y_hat_avg[’Holt_Winter’] = fit1.forecast(len(test))plt.figure(figsize=(16, 8))plt.plot(train[’Count’], label=’Train’)plt.plot(test[’Count’], label=’Test’)plt.plot(y_hat_avg[’Holt_Winter’], label=’Holt_Winter’)plt.legend(loc=’best’)plt.show()

詳解用Python進行時間序列預測的7種方法

我們可以看到趨勢和季節性的預測準確度都很高。我們選擇了 seasonal_period = 7作為每周重復的數據。也可以調整其它其它參數,我在搭建這個模型的時候用的是默認參數。你可以試著調整參數來優化模型。

方法7:自回歸移動平均模型(ARIMA)

另一個場景的時序模型是自回歸移動平均模型(ARIMA)。指數平滑模型都是基于數據中的趨勢和季節性的描述,而自回歸移動平均模型的目標是描述數據中彼此之間的關系。ARIMA的一個優化版就是季節性ARIMA。它像Holt-Winters季節性預測模型一樣,也把數據集的季節性考慮在內。

import statsmodels.api as sm y_hat_avg = test.copy()fit1 = sm.tsa.statespace.SARIMAX(train.Count, order=(2, 1, 4), seasonal_order=(0, 1, 1, 7)).fit()y_hat_avg[’SARIMA’] = fit1.predict(start='2013-11-1', end='2013-12-31', dynamic=True)plt.figure(figsize=(16, 8))plt.plot(train[’Count’], label=’Train’)plt.plot(test[’Count’], label=’Test’)plt.plot(y_hat_avg[’SARIMA’], label=’SARIMA’)plt.legend(loc=’best’)plt.show()

詳解用Python進行時間序列預測的7種方法

我們可以看到使用季節性 ARIMA 的效果和Holt-Winters差不多。我們根據 ACF(自相關函數)和 PACF(偏自相關) 圖選擇參數。如果你為 ARIMA 模型選擇參數時遇到了困難,可以用 R 語言中的 auto.arima。

最后,我們將這幾種模型的準確度比較一下:

詳解用Python進行時間序列預測的7種方法

后話

建議你在解決問題時,可以依次試試這幾種模型,看看哪個效果最好。我們從上文也知道,數據集不同,每種模型的效果都有可能優于其它模型。因此,如果一個模型在某個數據集上效果很好,并不代表它在所有數據集上都比其它模型好。

參考鏈接:

1. 標點符-用Python進行時間序列預測的7種方法

2. 博客園-python時間序列resample參數

3. CSDN-python resample()函數(用于數據聚合)

到此這篇關于詳解用Python進行時間序列預測的7種方法的文章就介紹到這了,更多相關Python 時間序列預測內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Python 編程
相關文章:
日本不卡不码高清免费观看,久久国产精品久久w女人spa,黄色aa久久,三上悠亚国产精品一区二区三区
老司机久久99久久精品播放免费| 福利精品在线| 国产一区二区三区黄网站| 91精品福利观看| 中文字幕亚洲影视| 在线国产日韩| 亚洲欧美久久精品| 亚洲人成亚洲精品| 99视频在线精品国自产拍免费观看| 精精国产xxxx视频在线野外| 日韩专区精品| 精品一区二区三区中文字幕| 国产一区二区色噜噜| 亚洲人成网站在线在线观看| 日韩一二三区在线观看| 久久天堂精品| 99视频精品全国免费| 亚洲人成在线影院| 午夜视频一区二区在线观看| 亚洲精品影视| 欧美日韩亚洲一区在线观看| 国产日韩一区二区三免费高清| 国产福利一区二区精品秒拍 | 天堂va蜜桃一区二区三区| 蜜桃av一区二区在线观看| 国产精品毛片久久| 偷拍亚洲精品| 国产色99精品9i| 国产一区二区三区不卡av | 国产不卡一区| 日韩中文欧美| 中文日韩在线| 亚洲欧美在线综合| 国产精品白浆| 国产精品精品| 99精品电影| 国产视频亚洲| 91九色综合| 久草精品视频| 久久影视一区| 日韩精品欧美精品| 福利视频一区| 日韩视频一区| 中文字幕一区二区三区日韩精品| 国产精品密蕾丝视频下载| 日本不良网站在线观看| 亚洲一区二区三区免费在线观看| 欧美亚洲国产日韩| 日韩欧美一区二区三区在线观看 | 亚洲黑丝一区二区| 色8久久久久| 超碰在线99| 亚洲开心激情| 日韩国产综合| 国产在线不卡| 国产一精品一av一免费爽爽| 丝袜美腿一区| 日韩欧美久久| 电影天堂国产精品| 青青草国产成人99久久| 肉色欧美久久久久久久免费看| 黄色不卡一区| 久久久久久久久丰满| 青青草视频一区| 久久国产中文字幕| 久久精品99久久久| 久久一级电影| 欧美日韩网址| 欧美 日韩 国产一区二区在线视频 | 国产一区二区精品久| 蜜桃伊人久久| 国产精品午夜av| 日韩精品首页| 欧美视频久久| 久久午夜精品一区二区| 日韩一区二区三区免费播放| 国产欧美日韩一区二区三区四区| 日韩午夜在线| 电影亚洲精品噜噜在线观看| 日本免费在线视频不卡一不卡二| 蜜桃一区二区三区| 国产伊人久久| 日韩福利视频一区| 亚洲激情社区| 三上悠亚国产精品一区二区三区| 欧美片网站免费| 一区在线免费观看| 日韩毛片视频| 久久福利在线| 日韩av电影一区| 丝袜亚洲精品中文字幕一区| 精品丝袜在线| 老司机精品视频在线播放| 中文欧美日韩| 亚洲二区在线| 日韩欧美三级| 精品一区二区三区中文字幕视频| 日本不卡高清视频| 日韩激情一区二区| 午夜亚洲精品| 婷婷亚洲五月色综合| 精品一区二区三区视频在线播放 | 久久亚州av| 亚洲激情五月| 久久精品国产www456c0m| 国产高潮在线| 精品淫伦v久久水蜜桃| 国产精品美女在线观看直播 | 欧美成a人国产精品高清乱码在线观看片在线观看久 | 欧美伊人影院| 亚洲三级网址| 视频一区二区三区中文字幕| 国产高清一区二区| 精品丝袜久久| 久久精品免费看| 成人亚洲精品| 电影91久久久| 精品三级在线观看视频| 国产精品日本一区二区不卡视频 | 一区二区精品伦理...| 精品三级久久久| 精品亚洲二区| 久久免费影院| 久久字幕精品一区| 久久这里只有精品一区二区| 免费在线亚洲| 久久超碰99| 久久字幕精品一区| 精品视频一区二区三区在线观看| 国产精品香蕉| 美女精品视频在线| 另类综合日韩欧美亚洲| 精品一区二区三区中文字幕视频 | 亚洲特级毛片| 欧美日韩国产一区精品一区| 91成人超碰| 亚洲免费成人| 一二三区精品| 欧美日韩亚洲一区在线观看| 国产精品久久久久久av公交车| 国产精品nxnn| 国际精品欧美精品| 国产一区二区精品福利地址| 极品av在线| 欧美精品自拍| 亚洲精品福利| 国产精品任我爽爆在线播放| 高清久久精品| 激情综合激情| 亚洲青青久久| 国产精品巨作av| 久久久久久一区二区| 99久久婷婷| 石原莉奈在线亚洲二区| 日本一区二区三区中文字幕| 麻豆精品99| 久久影院午夜精品| 婷婷国产精品| 蜜桃一区二区三区在线观看| 欧美日韩1区| 久久久久久久欧美精品| 欧美成人午夜| 蜜臀久久久99精品久久久久久| 亚洲精品极品| 国产精品v一区二区三区| 国产在线观看www| 一区二区视频欧美| 欧美日韩亚洲一区二区三区在线 | 最新中文字幕在线播放| 在线国产一区二区| 日韩黄色av| 国产美女高潮在线| 日韩影院免费视频| 国产精品超碰| 久久婷婷av| 六月丁香综合| 老牛国内精品亚洲成av人片| 日韩网站中文字幕| 亚洲毛片视频| 成人高清一区| 日韩在线a电影| 精品美女在线视频| 久久一区二区三区喷水| 日本午夜免费一区二区| 综合日韩av| 亚洲乱码久久| 日韩成人高清| 日韩av一区二区在线影视| 黄色aa久久| 色综合视频一区二区三区日韩 | 超碰在线99| 亚洲日本在线观看视频| 综合日韩av| 深夜福利一区| 亚洲成人不卡| 国产精品一区二区中文字幕| 欧美成人午夜| 麻豆中文一区二区| 亚洲精品在线a| 在线日韩电影|