Tahapan ARIMA
… biasakan mencopy dengan menyertakan sumber/referensi …
Tahap ke-1. Deteksi Stasioneritas Data
Stasioneritas berarti fluktuasi data deret waktu berada di sekitar suatu nilai rata-rata yang konstan dan variansnya tetap konstan sepanjang waktu. Untuk mengetahui stasioneritas data deret waktu dapat dideteksi dengan mengamati plot data terhadap waktu (Gujarati, 2004).
Jika data deret waktu tidak stasioner pada variansnya, maka dapat dilakukan transformasi stabilisasi varians, seperti transformasi kuasa Box-Cox (Box-Cox power transformation). Akan tetapi jika data tidak stasioner pada nilai rata-ratanya, maka dapat dilakukan proses differencing (Wei, 2006).
Tahap ke-2. Identifikasi model
Setelah data deret waktu yang akan diolah sudah stasioner, langkah berikutnya adalah penetapan model ARIMA (p,d,q) sementara (tentative) yang sesuai. Jika data tidak mengalami differencing, maka d bernilai 0, jika data stasioner setelah differencing ke-1 maka d bernilai 1 dan seterusnya. Dalam menetapkan p dan q dapat dibantu dengan mengamati pola Autocorrelation Function (ACF) dan Partial Autocorrelation Function (PACF) dengan acuan pada Tabel 1. Dalam penetapan P dan Q pada model SARIMA memiliki acuan yang mirip dengan penetapan p dan q pada model ARIMA (Wei, 2006).
Tabel 1 Acuan pola ACF dan PACF untuk penentuan model ARIMA
Model |
Pola ACF |
Pola PACF |
AR (p) |
menurun secara cepat (dies down) |
Muncul spike yang signifikan hingga lag ke-p dan cut off setelah lag ke-p |
MA (q) |
muncul spike yang signifikan hingga lag ke-q dan cut off setelah lag ke-q |
menurun secara cepat (dies down) |
ARMA (p,q) |
menurun secara cepat (dies down) |
menurun secara cepat (dies down) |
AR (p) atau MA (q) |
muncul spike yang signifikan hingga lag ke-q dan cut off setelah lag ke-q |
muncul spike yang signifikan hingga lag ke-p dan cut off setelah lag ke-p |
Bukan AR(p) atau MA(q) (white noise atau random process) |
tidak ada spike yang signifikan |
tidak ada spike yang signifikan |
Sumber: Bowerman dan O’Connel (1993)
Kesalahan yang sering terjadi dalam penentuan p, q, P dan atau Q bukan merupakan masalah besar pada tahap ini, karena hal ini akan diketahui pada tahap pemeriksaan diagnosa selanjutnya.
Pada pemodelan data deret waktu yang mengalami differencing pada lag ke-1 (d = 1) dan menghasilkan pola ACF dan PACF yang sama sekali tidak ada spike muncul pada lag time sehingga tidak dapat ditentukan orde autoregressive maupun moving average nya disebut sebagai model random walk (Wei, 2006).
Tahap ke-3. Pendugaan parameter model
Ada beberapa metode estimasi yang dapat digunakan untuk mendapatkan parameter-parameter model ARIMA diantaranya adalah metode momen, conditional least square, unconditional least square, nonlinear estimation dan maximum likelihood. Pembahasan mendalam mengenai metode estimasi parameter ini dapat dilihat di Box et al. (1994), Wei (2006) dan Cryer dan Chan (2008).
Tahap ke-4. Pemeriksaan atau diagnosa model
Dalam pemeriksaan terhadap model ada beberapa uji kesesuaian model yang bisa dilakukan, antara lain adalah uji terhadap asumsi normalitas dan white noise pada residual dan uji parameter model:
Asumsi normalitas pada residual diperlukan sehingga dapat dilakukan proses diagnosa lanjutan terhadap model ARIMA. Untuk uji normalitas terhadap residual ini digunakan uji statistik Kolmogorov-Smirnov (Daniel, 1989) dengan hipotesis yang diuji adalah residual berdistribusi normal.
Sedangkan asumsi white noise pada residual harus terpenuhi, yaitu mengikuti proses yang menunjukkan tidak ada korelasi serial (no autocorrelation) atau dengan kata lain bahwa residual sudah tidak mempunyai pola tertentu lagi atau bersifat acak (mean = 0 dan varians konstan). Untuk menguji white noise pada residual digunakan uji Ljung-Box (Ljung dan Box, 1978) dengan hipotesis yang diuji adalah residual sudah white noise.
Uji signifikansi parameter model dilakukan untuk mengetahui layak tidaknya parameter tersebut digunakan dalam model dengan statistik uji t.
Jika diperoleh model ARIMA yang baik dan layak untuk digunakan lebih dari satu model, maka langkah selanjutnya adalah menentukan model terbaik yang dapat digunakan kriteria kebaikan model (in sample), salah satunya adalah Akaike’s information criterion (AIC) (Akaike, 1974) dan Schwarz’s Bayesian criterion (SBC) atau biasa disebut Bayesian Information criterion(BIC) (Schwarz, 1978). Model yang memiliki nilai AIC dan BIC terkecil dipilih menjadi model terbaik.
Tahap ke-5. Penggunaan model untuk peramalan
Jika model terbaik telah ditetapkan, maka model siap digunakan untuk peramalan. Untuk data yang mengalami differencing, bentuk selisih harus dikembalikan pada bentuk awal dengan melakukan proses integral karena yang diperlukan adalah ramalan deret waktu awal (data asli). Mengenai tahapan peramalan dengan menggunakan model ARIMA ini lebih lengkap dapat dilihat di Wei (2006) dan Cryer dan Chan (2008).
sumber:
Wijaya, Adi. (2012). Peramalan Produksi Padi dengan ARIMA, Fungsi Transfer dan Adaptive Neuro Fuzzy Inference System (ANFIS). Tesis. Surabaya: ITS