Senin, 02 November 2015

Regresi Poisson

Sekelumit tentang regresi poisson yg ad di tugas terberat seumur hidup....



Distribusi Poisson

Regresi Poisson merupakan salah satu bagian dari analisis regresi. Percobaan poisson adalah percobaan yang menghasilkan variabel random X yang bersifat numeric, yaitu banyaknya sukses selama selang waktu tertentu atau dalam daerah tertentu atau dalam daerah tertentu. Selang waktu tertentu dapat berupa sedetik, semenit, sejam, sehari, seminggu maupun sebulan. Daerah tertentu dapat berupa satu meter, satu kilometer persegi dan lain lain. Percobaan poisson memiliki ciri-ciri sebagai berikut :
1.      Banyaknya sukses terjadi dalam suatu selang waktu atau daerah tertentu tidak terpengaruh oleh apa yang terjadi pada selang waktu tertentu atau daerah lain.
2.      Peluang terjadinya suatu sukses dalam selang waktu yang amat pendek atau dalam daerah yang kecil tidak tergantung pada banyaknya sukses yang terjadi di luar selang waktu atau daerah lain.
3.      Peluang terjadinya lebih dari satu sukses dalam selang waktu yang pendek atau daerah yang sempit tersebut dapat di abaikan.
Distribusi poisson di beri nama sesuai dengan penemunya yaitu Siemons Denis Poisson. Distribusi poisson adalah suatu distribusi peluang yang menyatakan kemungkinan sejumlah peristiwa yang terjadi dalam suatu periode waktu. Distribusi poisson adalah suatu distribusi peluang yang menyatakan kemungkinan sejumlah peristiwa yang  terjadi dalam suatu periode waktu. Distribusi poisson dapat digunakan untuk menyatakan peristiwa dalam unit tertentu atau periode dari waktu, jara, luas area, volume dan sebagainya. (Nugraha J, 2013)
Penggunaan distribusi poisson sebagai dasar pada regresi poisson. Distribusi poisson akan membuat model peluang dari kejadian y menurut proses poisson (Tiani Wahyu, 2013), adalah :
                              f(y;µ)=   … ……………..……………………………(3.1.)
      Dengan
      y :0,1,2,…
     µ : rata rata banyaknya sukses yang terjadi dalam selang waktu/ daerah tertentu.
     e : 2.7183 (nilai konstan)
Untuk melakukan pengujian regresi poisson maka data di asumsikan mengikuti proses percobaan poisson. Jika dilihat dari kesesuaian variabel dependent dengan ciri ciri distribusi poisson maka peluang terjadinya sangat kecil pada suatu populasi serta variabel dependent yang merupakan data diskrit dari hasil menghitung, pencacahan namun bukan hasil pengukuran. Pada penelitian ini penulis membahas model regresi binomial negatif, akan tetapi tidak terlalu mendalam dan hanya akan membahas tentang pengujian overdispersi pada model regresi poisson dimana penerapannya di lakukan pada data kasus gizi buruk di kabupaten Bangka.
Model regresi poisson adalah model regresi nonlinier yang berasal dari distribusi poisson yang merupakan penerapan dari Generalized Linear Models (GLM) yang menggambarkan hubungan antara variabel dependen dengan variabel independen, dengan variabel dependen berupa data diskrit/count. Dengan asumsi  atau disebut equidispersi (Agresti, 2002).
Berdasarkan konsep GLM untuk distribusi Poisson bahwa pada saat  sama dengan parameter natural , kanonikal link (fungsi yang menstranformasikan nilai mean ke parameter natural) yang digunakan adalah log natural link: . Sehingga hubungan  denga prediktor linier , dinyatakan dengan . Dengan menggunakan fungsi link log natural tersebut diperoleh model regresi Poisson dalam bentuk:
 
 
             ………………………… (3.2)
Dengan :
β0 ,  β1 : menyatakan parameter parameter yang tidak di ketahui
Nilai µi merupakan ekspektasi yi  berdistribusi poisson dengan i=1,2,3,n (Agresti, 2002)

1.1.1.      Pengujian Distribusi Poisson

Pengujian data berdistribusi poisson perlu dilakukan untuk membuktikan data dari sampel yang dimiliki berdistribusi poisson.  Pengujian poisson bertujuan untuk mengetahui apakah data penelitian berdistribusi poisson atau tidak (Rini Cahyandari, 2014). Uji normalitas Kolmogorov-Smirnov adalah uji yang digunakan pada penelitian ini dimana uji yang bertujuan untuk mengetahui apakah data dalam variabel yang akan dianalisis berdistribusi poisson. Jika data berdistribusi poisson maka analisis statistik dapat memakai pendekatan parametrik sedangkan jika data tidak berdistribusi poisson maka analisis menggunakan pendekatan non-parametrik. Dalam uji Kolmogorov smirnov  dasar pengambilan keputusannya adalah  (Nurwihdah, 2013) :
·         Jika nilai Signifikasi > 0,05 maka data berdistribusi normal
·         Jika nilai Signifikasi < 0,05 maka data tidak berdistribusi normal

Uji Multikolinieritas

Uji multikoliniearitas digunakan untuk mengetahui ada atau tidaknya penyimpangan asumsi klasik multikolinearitas yaitu adanya hubungan linear antar variabel independen dalam model regresi. Prasyarat yang harus terpenuhi dalam model regresi adalah tidak adanya multikolinearitas. Ada beberapa metode pengujian yang bisa digunakan diantaranya yaitu :
1.      Dengan melihat nilai inflation faktor (VIF) pada model regresi.
2.      Dengan membandingkan nilai koefisien determinasi individual (r2) dengan nilai determinasi secara serentak (R2)
3.      Dengan melihat nilai eigenvalue dan condition index.
Menurut Imam Ghozali (Tiani, 2013) tujuan dari uji multikolinearitas adalah “ “Uji multikolinearitas bertujuan untuk menguji apakah model regresi ditemukan adanya   korelasi antar variabel bebas (independen).  Karena model regresi yang baik seharusnya tidak terjadi korelasi di antara variabel independen “
Uji multikolinearitas dilakukan dengan melihat tolerance value dan variance inflation factor (VIF). Multikolinearitas terjadi bila nilai VIF diatas nilai 5 atau tolerance value dibawah 0,05. Multikolinearitas tidak terjadi bila nilai VIF dibawah nilai 5 atau tolerance value diatas 0,05. (Santoso, 2002) . Adapun untuk mengetahui suatu variabel independen terjadi multikolinieritas atau tidak, dapat di lakukan melalui uji multikolinieritas dengan hipotesis sebagai berikut :
·         Hipotesis
H0 : tidak terdapat hubungan antar variabel dependent
H1 : terdapat hubungan antar variabel dependent
·         Tingkat signifikasi
α : 0.05
·         Statistik uji
VIF = ……………………………………………………………. (3.3)
Dimana R2 adalah koefisien determinasi
·         Daerah kritis
Tolak H0 jika nilai VIF > 5

Uji Estimasi Regresi Poisson
                
                 Uji estimasi regresi poisson terdiri dari uji parameter secara serentak dan individual. Pengujian secara serentak dilakukan menggunakan uji overall, sedangkan secara individu menggunakan uji parsial.
   Uji Overall

      Pengujian overall menggunakan statistik uji G. Dimana uji G adalah uji rasio kemungkinan (likelihood ratio test) yang di gunakan untuk menguji peranan variabel independen di dalam model secara bersama sama,. Uji rasio kemungkinan (likelihood ratio test) di peroleh dengan cara membandingkan fungsi log likelihood dari seluruh variabel bebas dengan fungsi likelihood tanpa variabel bebas (Raharjati dan Widiarih, 2005). Uji G digunakan untuk menguji hiipotesis :
            H0 : βj = 0 dengan βj ≠ 0         j = 1,2,…,p (tidak ada variabel independen berpengaruh terhadap variabel dependen)
            H1: paling sedikit ada satu j dengan βj ≠ 0  , j = 1,2,….p (paling sedikit ada satu variabel independen yang berpengaruh terhadap variabel independen).
      Misalkan L1 adalah nilai likelihood dari model yang mengandung variabel independent (log (µi (xi ) = β0 + β1xi )dan L0  adalah nilai likelihood dari model yang tidak mengandung variabel independen (log (µi ) = β0 ). Statistik uji yang digunakan untuk menguji hipotesis di atas adalah statistik uji rasio likelihood (Renita, 2006) :
                             G2 = -2 log
                                 = -2 (log L0 – log L1 )
                                 = 2 (log L1 – log L0 ) ……………………….. (3.4)
Dengan :
LO : Likelihood  tanpa variabel independen
L1 : Likelihood dengan variabel independen
Statistik uji G mengikuti distribusi Chi-Square sehingga dibandingkan dengan tabel Chi-Square dengan derajat bebas , dengan daerah penolakan H0 jika  >  atau berdasarkan nilai Sig. yang dibandingkan dengan nilai , dengan daerah penolakan Sig. < .


Uji Parsial
Uji Wald merupakan metode pengujian yang di gunakan untuk menguji parameter secara parsial. Hipotesis yang digunakan adalah :
·         Hipotesis
H0 : βj = 0                               (variabel independen Xj tidak berpengaruh signifikan terhadap variabel dependen)
H1: βj ≠ 0                                (variabel independen Xj berpengaruh signifikan terhadap variabel dependen)
·         Tingkat signifikasi  : α :0.05
·         Statistik uji Wald adalah (Fitriana, 2011) :
 W = (........................ )2……………………………………..(3.5.)
Dimana
        : Nilai dugaan untuk parameter
  : Dugaan galat baku untuk koefisien
Nilai uji W mengikuti distribusi chi square sehingga di bandingkan dengan chi square tabel  . Maka kriteria uji untuk pengambilan keputusan dengan taraf nyata (α) adalah tolak H0 jika nilai W > . Dalam uji Wald jika ingin di ketahui parameter signifikan terhadap data di gunakan hipotesis :
                                               H0 : βj = 0
                                               H1 : βj ≠ 0

Uji Overdispersi
                
                 Pada model regresi Poisson terdapat asumsi yang harus dipenuhi, salah satunya adalah asumsi kesamaan  antara rataan (mean) dan variansi dari variabel dependen, yang disebut juga equidispersi. Namun, dalam analisis data cacah seringkali dijumpai data yang variansinya lebih besar dari rataannya (overdispersi).
                 Jika pada data cacah terjadi overdispersi namun tetap digunakan regresi Poisson, akan berpengaruh pada nilai standart error yang menjadi turun atau underestimate, sehingga kesimpulannya menjadi tidak valid (Hilbe dalam Fatmasari, 2011).Fenomena overdispersi dapat dituliskan:
              ………………………………………..(3.6)  
                 Overdispersi dapat diindikasikan dengan nilai devians dan pearson chi-square yang dibagi dengan derajat bebasnya. Jika kedua nilai tersebut lebih dari 1 maka dikatakan terjadi overdispersi pada data (McCullagh dan Nelder dalam Fatmasari, 2011). Terdapat dua cara yang digunakan untuk mendeteksi overdispersi, yaitu:
1.      Devians
 
……………………………..(3.7.)
                 Dimana  dengan merupakan banyaknya parameter termasuk konstanta,  merupakan banyaknya pengamatan dan  adalah nilai Deviasi (Hilbe dalam Fatmasari, 2011).
2.      Pearson Chi-Square
  …………………………………………………..(3.8.)
                 Dimana  dengan merupakan banyaknya parameter termasuk konstanta,  merupakan banyaknya pengamatan dan  adalah nilai pearson chi-square (Ismail & Jemain, 2007). Jika nilai overdispersi  bernilai lebih dari 1 maka  terjadi overdispersi pada data.