Sekelumit tentang regresi poisson yg ad di tugas terberat seumur hidup....
Uji
Multikolinieritas
Uji Parsial
Distribusi Poisson
Regresi Poisson merupakan salah satu bagian dari analisis regresi. Percobaan
poisson adalah percobaan yang menghasilkan variabel random X yang bersifat
numeric, yaitu banyaknya sukses selama selang waktu tertentu atau dalam daerah
tertentu atau dalam daerah tertentu. Selang waktu tertentu dapat berupa
sedetik, semenit, sejam, sehari, seminggu maupun sebulan. Daerah tertentu dapat
berupa satu meter, satu kilometer persegi dan lain lain. Percobaan poisson
memiliki ciri-ciri sebagai berikut :
1. Banyaknya sukses terjadi dalam suatu selang waktu atau
daerah tertentu tidak terpengaruh oleh apa yang terjadi pada selang waktu
tertentu atau daerah lain.
2.
Peluang
terjadinya suatu sukses dalam selang waktu yang amat pendek atau dalam daerah
yang kecil tidak tergantung pada banyaknya sukses yang terjadi di luar selang
waktu atau daerah lain.
3. Peluang terjadinya lebih dari satu sukses dalam selang
waktu yang pendek atau daerah yang sempit tersebut dapat di abaikan.
Distribusi poisson di beri nama sesuai dengan penemunya yaitu Siemons Denis
Poisson. Distribusi poisson adalah suatu distribusi peluang yang menyatakan
kemungkinan sejumlah peristiwa yang terjadi dalam suatu periode waktu. Distribusi
poisson adalah suatu distribusi peluang yang menyatakan kemungkinan sejumlah
peristiwa yang terjadi dalam suatu
periode waktu. Distribusi poisson dapat digunakan untuk menyatakan peristiwa
dalam unit tertentu atau periode dari waktu, jara, luas area, volume dan
sebagainya. (Nugraha J, 2013)
Penggunaan distribusi poisson sebagai dasar pada regresi poisson.
Distribusi poisson akan membuat model peluang dari kejadian y menurut proses poisson
(Tiani Wahyu, 2013), adalah :
f(y;µ)=
… ……………..……………………………(3.1.)
Dengan
y :0,1,2,…
µ : rata rata banyaknya sukses yang terjadi dalam selang
waktu/ daerah tertentu.
e : 2.7183 (nilai konstan)
Untuk melakukan pengujian regresi poisson maka data di asumsikan mengikuti
proses percobaan poisson. Jika dilihat dari kesesuaian variabel dependent
dengan ciri ciri distribusi poisson maka peluang terjadinya sangat kecil pada
suatu populasi serta variabel dependent yang merupakan data diskrit dari hasil
menghitung, pencacahan namun bukan hasil pengukuran.
Pada penelitian ini penulis membahas model regresi
binomial negatif, akan tetapi tidak terlalu mendalam dan hanya akan membahas tentang
pengujian overdispersi pada model regresi poisson dimana penerapannya di
lakukan pada data kasus gizi buruk di kabupaten Bangka.
Model
regresi poisson adalah model regresi nonlinier
yang berasal dari distribusi poisson yang merupakan penerapan dari Generalized Linear Models (GLM) yang
menggambarkan hubungan antara variabel dependen dengan variabel independen, dengan
variabel dependen berupa data diskrit/count. Dengan asumsi
atau disebut equidispersi (Agresti, 2002).
Berdasarkan
konsep GLM untuk distribusi Poisson bahwa pada saat
sama dengan parameter natural
, kanonikal link
(fungsi yang menstranformasikan nilai mean ke parameter natural) yang digunakan
adalah log natural link:
. Sehingga
hubungan
denga prediktor linier
, dinyatakan
dengan
. Dengan
menggunakan fungsi link log natural tersebut diperoleh model regresi Poisson
dalam bentuk:
………………………… (3.2)
Dengan
:
β0 , β1
: menyatakan parameter parameter yang tidak di ketahui
Nilai
µi merupakan ekspektasi yi
berdistribusi
poisson dengan
i=1,2,3,n (Agresti, 2002)
1.1.1. Pengujian
Distribusi Poisson
Pengujian data berdistribusi poisson
perlu dilakukan untuk membuktikan data dari sampel yang dimiliki berdistribusi poisson.
Pengujian poisson
bertujuan untuk mengetahui apakah data penelitian berdistribusi poisson atau tidak (Rini Cahyandari,
2014). Uji normalitas
Kolmogorov-Smirnov adalah uji yang digunakan pada penelitian ini dimana uji
yang bertujuan untuk mengetahui apakah data dalam variabel yang akan dianalisis
berdistribusi poisson. Jika data berdistribusi poisson maka analisis statistik dapat memakai pendekatan parametrik sedangkan jika data tidak berdistribusi poisson maka analisis menggunakan pendekatan non-parametrik. Dalam
uji Kolmogorov smirnov dasar pengambilan
keputusannya adalah
(Nurwihdah, 2013) :
·
Jika
nilai Signifikasi > 0,05 maka data berdistribusi normal
·
Jika
nilai Signifikasi < 0,05 maka data tidak berdistribusi normal
Uji multikoliniearitas
digunakan untuk mengetahui ada atau tidaknya penyimpangan asumsi klasik
multikolinearitas yaitu adanya hubungan linear antar variabel
independen dalam model regresi. Prasyarat yang harus terpenuhi dalam model
regresi adalah tidak adanya multikolinearitas. Ada beberapa metode pengujian
yang bisa digunakan diantaranya yaitu :
1.
Dengan melihat nilai inflation
faktor (VIF) pada model regresi.
2.
Dengan membandingkan nilai koefisien
determinasi individual (r2) dengan nilai determinasi secara
serentak (R2)
3.
Dengan melihat nilai eigenvalue dan
condition index.
Menurut Imam Ghozali (Tiani, 2013) tujuan dari uji multikolinearitas adalah “ “Uji multikolinearitas
bertujuan untuk menguji apakah model regresi ditemukan adanya korelasi antar variabel bebas
(independen). Karena model regresi yang
baik seharusnya tidak terjadi korelasi di antara variabel independen “
Uji multikolinearitas dilakukan dengan melihat tolerance value dan variance inflation factor (VIF). Multikolinearitas terjadi bila
nilai VIF diatas nilai 5 atau tolerance value dibawah 0,05. Multikolinearitas tidak terjadi bila nilai VIF dibawah
nilai 5 atau tolerance
value diatas 0,05. (Santoso, 2002) . Adapun untuk mengetahui suatu variabel independen
terjadi multikolinieritas atau tidak, dapat di lakukan melalui uji
multikolinieritas dengan hipotesis sebagai berikut :
·
Hipotesis
H0 : tidak terdapat hubungan antar variabel
dependent
H1 : terdapat hubungan antar variabel
dependent
·
Tingkat
signifikasi
α : 0.05
·
Statistik
uji
VIF
=
……………………………………………………………. (3.3)
Dimana R2 adalah koefisien determinasi
·
Daerah
kritis
Tolak H0 jika nilai VIF > 5
Uji Estimasi Regresi
Poisson
Uji estimasi regresi poisson
terdiri dari uji parameter secara serentak dan individual. Pengujian secara serentak dilakukan menggunakan uji
overall, sedangkan secara individu menggunakan uji parsial.
Uji Overall
Pengujian overall menggunakan statistik uji G. Dimana uji G adalah uji rasio kemungkinan (likelihood ratio test) yang di gunakan untuk menguji peranan
variabel independen di dalam model secara bersama sama,. Uji rasio kemungkinan
(likelihood ratio test) di peroleh
dengan cara membandingkan fungsi log likelihood dari seluruh variabel bebas
dengan fungsi likelihood tanpa variabel bebas (Raharjati dan Widiarih, 2005).
Uji G digunakan untuk menguji hiipotesis :
H0 : βj = 0 dengan βj ≠ 0 j =
1,2,…,p (tidak ada variabel independen berpengaruh terhadap variabel dependen)
H1: paling sedikit ada satu j dengan βj ≠ 0 , j = 1,2,….p (paling sedikit ada satu variabel independen yang berpengaruh
terhadap variabel independen).
Misalkan L1 adalah nilai likelihood dari model yang mengandung
variabel independent (log (µi (xi ) = β0 + β1xi )dan L0
adalah nilai likelihood dari model
yang tidak mengandung variabel independen (log (µi ) = β0
). Statistik uji yang digunakan untuk menguji hipotesis di atas adalah statistik
uji rasio likelihood (Renita, 2006) :
G2 = -2 log
= -2 (log L0 – log L1
)
= 2 (log L1 – log L0
) ……………………….. (3.4)
Dengan :
LO : Likelihood
tanpa variabel independen
L1 : Likelihood
dengan variabel independen
Statistik
uji G mengikuti distribusi Chi-Square
sehingga dibandingkan dengan tabel Chi-Square
dengan derajat bebas , dengan daerah penolakan H0 jika
>
atau berdasarkan nilai Sig. yang dibandingkan
dengan nilai
, dengan daerah
penolakan Sig. <
.
Uji Wald merupakan metode pengujian yang di gunakan untuk
menguji parameter secara parsial. Hipotesis yang digunakan adalah :
·
Hipotesis
H0 : βj = 0 (variabel independen Xj tidak berpengaruh signifikan terhadap variabel dependen)
H1: βj ≠ 0 (variabel
independen Xj berpengaruh
signifikan terhadap variabel dependen)
·
Tingkat
signifikasi : α :0.05
·
Statistik uji Wald adalah (Fitriana, 2011) :
W = (........................
)2……………………………………..(3.5.)
Dimana
: Nilai dugaan untuk parameter
: Dugaan galat baku untuk koefisien
Nilai uji W mengikuti distribusi chi square sehingga di
bandingkan dengan
chi square tabel
. Maka
kriteria uji untuk pengambilan keputusan dengan taraf nyata (α) adalah tolak H0
jika nilai W >
. Dalam
uji Wald jika ingin di ketahui parameter signifikan terhadap data di gunakan
hipotesis :
H0 : βj = 0
H1 :
βj ≠ 0
Uji
Overdispersi
Pada
model regresi Poisson terdapat asumsi yang harus dipenuhi, salah satunya adalah
asumsi kesamaan antara rataan (mean) dan variansi dari variabel
dependen, yang disebut juga equidispersi. Namun, dalam analisis data cacah
seringkali dijumpai data yang variansinya lebih besar dari rataannya
(overdispersi).
Jika pada data
cacah terjadi overdispersi namun tetap digunakan regresi Poisson, akan
berpengaruh pada nilai standart error
yang menjadi turun atau underestimate,
sehingga kesimpulannya menjadi tidak valid (Hilbe dalam Fatmasari, 2011).Fenomena overdispersi dapat dituliskan:
………………………………………..(3.6)
Overdispersi
dapat diindikasikan dengan nilai devians dan pearson chi-square yang dibagi dengan derajat bebasnya. Jika kedua
nilai tersebut lebih dari 1 maka dikatakan terjadi overdispersi pada data (McCullagh dan Nelder dalam Fatmasari, 2011).
Terdapat dua cara yang digunakan untuk mendeteksi overdispersi, yaitu:
1.
Devians
……………………………..(3.7.)
Dimana
dengan
merupakan
banyaknya parameter termasuk konstanta,
merupakan banyaknya pengamatan dan
adalah nilai Deviasi (Hilbe dalam Fatmasari, 2011).
2. Pearson
Chi-Square
…………………………………………………..(3.8.)
Dimana
dengan
merupakan
banyaknya parameter termasuk konstanta,
merupakan banyaknya pengamatan dan
adalah nilai pearson chi-square (Ismail & Jemain, 2007). Jika nilai
overdispersi
bernilai lebih dari 1 maka terjadi overdispersi pada data.