BAB V
ANALISIS REGRESI SEDERHANA
Ketergantungan variabel
terikan pada variabel-variabel bebas dalam bentuk yang speseifik. Bentuk fungsi
itu bisa linear, kuadrattik, logaritma, eksponensial, atau hiperbola.
5.1. Hubungan stokastik dan
Nir-stokastik (uji tidak pasti)
Hubungan antara x dan y yang dibentuk Y = f (x) dikatakan “deteministik” pasti
atau “nir-stokastik”, jika setiap nilai variabel bebas (X) terdapat satu nilai
variabel terikat (Y). Suatu hungan antara X dan Y dikatakan “stokastik”, jika
suatu nilai X tertentu terdapat distribusi probabilitas menyeluruh dari nilai
Y.
Contoh :
Peemintaan suatu barang
tertentu, diansumsikan, tergantung pada harga barang itu saja (faktor penentu
lainya dianggap konstan, atau ceteris paribus), dan bentuk fungsinya adalah
linear.
Q= f(p) = a + bp
Dengan data p dan q
tertentu misalnya diperoleh a = 25 dan b = -2, sehingga persaman permintaan itu
menjadi q= 25-2p
Hubungan antara p dan q
diatas menunjukakan setiap nilai p tertentu misalnya 2 satuan hanya ada 1 nilai
q, yaitu 21 satuan. Jika harga p adalah 5 satuan, maka jumlah barang yang
diminta menjadi 15 satuan dan seterusnya.
Hubungan pasti (exact)
atau hubungan deterministik antara p dan q ini tidak pernah sesuai dengan dunia
nyata.
5.2. Model Regresi
Linear Sederhana
Bentuk paling sederhana dari hubungan slokasok antara dua variabel X dan Y
disebut “model regresi linear”.
Yi = a + bXi + Ui ( i =
1,...,n)
Y disebut variabel
terikat (dependent variabel), X adalah variabel bebas (independen variabel)
atau variabel peinjelas (explanatory variabel), U adalah
variabel gangguan stokastik (stochastic disturbance), a dan b adalah parameter
– parameter regresi. Subskrip i menunjukan pengamatan yang ke-i. Parameter a
dan b ditaksir atas dasar yang data yang tersedia untuk variabel X dan Y.
Asumsi 1. Ui adalah
sebuah variabel random riil dan memiliki distribusi normal.
Asumsi 2. Nilai rerata
dari Ui setiap periode tertentu adalah nol.
E[Ui] = 0
(i = 1,......,n).
Asumsi 3. Varian dari Ui adalah
konstan setiap periode.
E[Ui2] = σ2
(σ2 adalah konstan)
Asumsi ini dikenal sebagai asumsi
“homoskedasstisitas” ( homoscedasticity)
Asumsi 4. Faktor
gangguan dari pengamatan yang berbeda-beda (Ui, Uj) tidak
tergantung
(independent)
E[Ui Uj] =
0
(i ≠ j)
Asumsi ini dikenal sebagai asumsi “nir-otokorelasi”
(nonautocorrelation)
Asumsi 5.
Variabel-variabel penjelas/bebas adalah variabel nir- stokastik dan diukur
tanapa
kesalahan; Ui tidak tergantung
pada variabel penjelas/bebas.
E[Xi Uj] = Xi [Ei Uj]
= 0 untuk seluruh i,j = 1, ......,n
Pengaruh asumsi pertama sampai ketiga terhadap distribusi probabilitas dari
variabel terikat Y dirangkum berikut ini:
a. Dalam persamaan Yi = α + βXi +
Ui: Yi merupakan fungsi dari Ui. Karena
Ui. Diasumsikan berdistribusi normal maka Yi berdistribusi
normal.
b. Yi = α +β Xi + Ui: jadi
E[Yi] = E[α + β Xi + Ui]
= α
+β Xi
{karena E[Ui] = 0}
Oleh karena itu
rerata dari Y1 atau E[Yi] ditentukan oleh (α + β Xi)
c. Var (Yi)
= E [Yi -
Ӯ]2 =
E [Yi –
E[Yi]]2
= E [α +β Xi + Ui -
(α + β Xi)]2
= [Ui]2
= σ2
karena E[Ui]2 = σ2
Jadi varian Yi = σ2
Dengan mengabaikan (untuk sementara bahwa teori tersebut mungkin
tidak benar, alasan penyisipan faktor U adalah :
a. Karena kesalahan dalam persamaan
Misalnya, model Y= α + βX + U: Y menunjukkan pengeluaran konsumsi,
dan X adalah penghasilan siap pakai (disposibel income). Model ini menyatakan
pengeluaran konsumsi tergantung sepenuhnya pada penghasilan siap pakai.
b. Karena kesalahan dalam pengukuran (kesalahan
dalam variabel)
Alasan lain untuk
memasukkan faktor U adalah karena faktor gangguan dapat mewakili
kesalahan-kesalahan dalam pengukuran baik dalam pencatatan, pengumpulan maupun
dalam pengolahan data X dan Y.
c. Kerena ketidak sempurnaan spesifikasi bentuk
matematis modal
Bentuk persamaan yang
sebenarnya mungkin bukan linear. Terdapat beberapa persamaan yang sesungguhnya
termasuk dalam model, tetapi tidak dimasukkan. Pada hakikatnya fenomena ekonomi
jauh lebih komples dari hanya sekedar suatu persamaan tunggal.
d. Karena agregasi
Untuk melakuakan spesifikasi model harus
diperhatikan tiga hal berikut:
1. Bentuk matematis hubungan antara
variabel-variabel dalam model
2. Distribusi probabilitas faktor gangguan
3. Hakikat nilai-nilai variabel penjelas/variabel
bebas
5.3 penaksiran
parameter-parameter regresi
Yang dimaksud penaksiran
α dan β dengan metode kuadrat terkecil (OLS = Ordinary Least Squares) atau
kuadrat terkecil klasik (CLS = Classical Least Squares) adalah menemukan
nilai-nilai taksiran α dan β yang meminimumkan jumlah kuadrat residu:
Dari garis regresi
sampel Y = α’+β’X¡+e¡; di peroleh :
e¡=Y¡-(α’+β’X¡)
Pentingnya sifat BLU
A. LINEAR
Sifat ini dibutuhkan untuk memudahkan
perhitungan dalam penaksiran.
B. UNBIASADNESS
Secara sendirian sifat ini tidak
berguna.satu-satunya jaminan dari sifat ini adalah bila jumlah sampel sangat
besar,penaksir parameter diperoleh dari sampel besar kira-kira lebih mendekati
nilai parameter sebenarnya.
C. BEST
Sifat varian terkecil secara sendirian tidak
dibutuhkan karena suatu taksiran memiliki penyimpangan yang besar (enormous
bias).sifat varian minimum dibutuhkan bila dikombinasikan dengan sifat tidak
bias (unbiasadness).pentingnya sifat ini kelihatan bila diterapkan dalam uji
signifikansi baku (standard) terhadap α’ dan β’,serta membuat interval
keyakinan taksiran-taksiran.
Penaksir linier kuadrat terkecil (Ordinary Least
Square) yang memenuhi persyaratan seluruh asumsi klasik dinamakan penaksir yang
BLUE (Best Linier Unbiased Estimator).kesimpulan ini merupakan teorema
Gauss-Markov.
5.5. Penaksir maksimum likelihood (maximum likelihood estimator)
Ada dua hal penting yang diamati dari hasil
penurunan (derivasi) subbab 5.3 dan 5.4 yaitu:
a.untuk membuktikan sifat BLU penaksir kuadrat
terkecil tidak semua asumsi klasik dipergunakan.misalnya untuk membuktikan
sifat linieritas diperlukan asumsi kovarian antara factor gangguan dan variabel
bebas E[X¡U¡]=0.sifat unbiasadness memerlukan asumsi tersebut bersama-sama
dengan asumsi bahwa rerata dari factor-faktor gangguan adalah nol, {E[X¡U¡]=0
dan E[U¡]=0}.
Derevasi dari varian dari parameter dan sifat
varian minimum tergantung pada asumsi-asumsi yang berkaitan dengan sifat
homoskedastisitas dan nir-otoregresif dari factor-faktor gangguan {E[U¡²]=σ²
dan E[X¡U¡]=0}.
B.untuk membuktikan sifat-sifat BLU tidak perlu
dibuat asumsi bentuk spesifik dari distribusi factor-faktor
gangguan.kenyataannya asumsi normalitas dari U tidak diperlukan untuk
membuktikan α’ dan β’ sebagai BLUE.
5.6 Distribusi Sampel Penaksir Kuadrat
Terkecil
Oleh karena penaksir-penaksir kuadrat terkecil
merupakan kombinasi linier variabel-variabel normal Y₁,Y₂,Y₃,…Yn tidak saling tergantung,maka α’ dan β’ juga
berdistribusi normal,dengan sifat-sifat sebagai berikut:
a.α’ dan β’ adalah penaksir-penaksir yang tidak
bias,yaitu merata masing-masing sama dengan nilai α dan β yang sebenarnya.
b.varian dari setiap penaksir,
5.7. Interval keyakinan dan uji Hipotesis
Penyusun interval keyakinan (confidence
intervals) penting untuk memperoleh ketepatan α’ dan β’. Untuk itu, semua
informasi yang berhubungan dengan distribusi α’ dan β’ sudah di bahas.
.
Goodness of Fit (R²)
Goodness of fit
menjelaskan tentang garis regresi sebagai suatu keseluruhan dan diuji kebenaran
letak taksirannya. Variasi (perubahan) Yᵢ dalam dua komponen, yaitu “yang bisa
dijelaskan” (explained) dan “yang tak bisa dijelaskan”(unexplained). Dari
uraian sebelumnya diketahui:
Untuk seluruh pengamatan, persamaan ini akan
menjadi:
∑ (Y¡ - Ÿ) = ∑ (Ŷ¡ - Ÿ) + ∑e¡
∑ (Y¡ - Ÿ)² = ∑ [(Ŷ¡- Ÿ) + e¡]²
= ∑ (Ŷ¡ - Ÿ² + 2∑ (Ŷ¡ - Ÿ)e¡+ ∑e¡²
Tapi ∑ (Ŷ¡
-Ÿ)e¡ = ∑ (ά + βˆX¡ - Ÿ)e¡
= ά∑e¡ + βˆ∑X¡e¡ - Ÿ∑e¡
= 0 (karena ∑e¡ = 0 dan ∑X¡e¡ = 0)
∑ (Ŷ¡ -Ÿ)² = ∑ (ά + βˆX¡ - Ÿ)²
= ∑[(Ÿ - βˆX) + βˆX¡ - Ÿ)²
= ∑ [βˆ(X¡-X)]²
= βˆ²(X¡-X)²
Jadi, ∑ (Y¡ -
Ÿ) = βˆ² (X¡-X)² + ∑e¡²
Pelaporan Hasil-hasil Analisis Regresi
Hasil-hasil analisis regresi
dilaporkan dalam bentuk (format) yang konvensional. Koefisien-koefisien regresi
bersama-sama dengan kesalahan standar (standard errors) dan nilai R² harus
dilaporkan lalu pelaporannya juga menyajikan persamaan hasil taksiran dengan
menempatkan kesalahan standar , dalam kurung di bawah masing-masing nilai
taksiran parameter. Kemudian melengkapinya dengan pencatuman nilai R² di
sebelah kanan persamaan regresi tersebut.
Beberapa pakar ekonomi sering menyertakan t-ratio dari koefisian taksiran
sebagai pengganti kesalahan standar. Cara penyajian semacam ini lebih
memudahkan pengujian hipotesis, karena t-ratio langsung bisa dilihat dan
dibandingkan dengan t-tabel.
Aplikasi (Penerapan)
Contoh 1:
Penetapan Interval Keyakinan
Misalnya, ingin ditetapkan
suatu internal keyakinan (confidence internal) untuk α dan β pada tingkat
probabilitas p = 0.95. dengan kata lain, ingin memperoleh nilai t yang
membatasi 0,025 area di kedua sisi distribusi. Dengan derajat bebas = 18, lihat
baris ke-18 dan kolom dengan tanda “0,025” pada table-t. Nilai pada koordinat
adalah 2,101.
Oleh karena itu, 95%
internal keyakinan untuk α dan β adalah :
92,95 – (2,101)(4,38) ≤ α ≤ 92,95 +
(2,101)(4,38)
83,75 ≤ α ≤ 102,15
dan : 5,54 – (2,101)(0,34) ≤ α ≤ β ≤
5,54 + (2,101)(0,34)
4,38 ≤ β ≤ 6,25
Contoh 2:
Tabel berikut menyajikan
produk nasional bruto (X) dan permintaan akan makanan (Y) diukur dalam
satuan-satuan arbitrary. Data tersebut berasal dari sebuah negara berkembang,
yang meliputi periode 10 tahun. taksirlah fungsi permintaan akan makanan Y = α
+ βX + U.
Tahun
|
1960
|
1961
|
1962
|
1963
|
1964
|
1965
|
1966
|
1967
|
1968
|
1969
|
Y
|
6
|
7
|
8
|
10
|
8
|
9
|
10
|
9
|
11
|
10
|
X
|
50
|
52
|
55
|
59
|
57
|
58
|
62
|
65
|
78
|
70
|
Jawaban :
Diketahui fungsi makanan: Y = α + βX + U selain
perlu di estimasi fungsi makanan ini, juga perlu dihitung:
(i) Koefisien determinasi
(ii) Kesalahan standar taksiran regresi, dan
(iii) Melakukan uji signifikansi pada tingkat
signifikansi 5%.
Berdasarkan perhitungan dari table diatas
diperoleh hasil sebagai berikut:
ƩXᵢ = 596, ƩYᵢ = 88, ƩXᵢYᵢ = 5325, ƩXᵢ² = 35916
n = 10; Ʃxᵢyᵢ = 80,20; ƩXᵢ² = 394,4; Ʃyᵢ² = ƩYᵢ²-nῩ² = 21,60
Tidak ada komentar:
Posting Komentar