Posted in Biostatistik

Analisis Regresi

Analisis regresi menerangkan hubungan antara hasil yang disebut outcome variable dengan satu atau lebih variabel yang disebut sebagai explanatory variables.

Analisis regresi sering sekali digunakan sehingga dokter harus mampu setidaknya memahami laporan regresi multivariabel yang banyak dipakai di jurnal kedokteran.

Bagaimana analisis regresi dilakukan tergantung pada tipe data hasilnya (outcome). Ada tiga metode yang lazim dilakukan:

=> jika outcomenya kontinyu (misalnya tinggi badan): regresi linear

=> jika outcomenya biner/dikotomi (misalnya stroke/tidak stroke): regresi logistik

=> jika outcomenya time-to-event (misalnya time to death): Cox proportional hazards.

 

Regresi Linear

Regresi linear sederhana (simple linear regression) digunakan untuk menerangkan hubungan antara variabel outcome jenis kontinyu dengan variabel lain (variabel explanatory). Variabel lain bisa berjenis biner/dikotomi (contohnya laki-laki/perempuan), memiliki beberapa kategori (contohnya kewarganegaraan), atau berjenis kontinyu juga.

Sebelum melakukan analisis linear, buatlah dulu scatter plot (tanpa garis regresi), untuk melihat hubungan antara kedua variabel.

Jika tidak tampak hubungan yang jelas, tidak diperlukan analisis lebih lanjut.

scatter plot

Jika hubungannya jelas tidak berbentuk garis lurus (tidak linear), maka garis regresi linear sederhana tidak cocok untuk merangkumkan hubungan kedua variabel.

scatter plot kuadrat

Sebaran data (varians) juga mempengaruhi penilaian. Data yang tampak makin menyebar atau menyempit tidak cocok dinilai dengan regresi linear sederhana.

scatter plot corong

Jika tampak hubungannya berbentuk garis dengan sebaran yang relatif konstan, barulah dapat (dan perlu) dicari garis regresinya.

scatter plot linear

Scatter plot juga bisa menggambarkan adanya outlier. Analisis dapat dilakukan dengan atau tanpa memperhitungkan outlier untuk mengetahui efeknya, dan untuk melihat bagaimana sebaiknya menginterpretasikan hasilnya. Outlier dapat memberikan pergeseran kemiringan garis regresi yang cukup bermakna. Pada tulisan harus jelas dinyatakan apakah outliernya disingkirkan, kenapa disingkirkan, dan apa efeknya; outlier tidak boleh disingkirkan begitu saja tanpa penjelasan.

Tidak banyak manfaatnya bila dalam grafik hanya ditampilkan garis regresi tanpa ada scatter plot dari data penelitian, karena garis regresi hanya mewakili perhitungan persamaan regresinya. Harus diingat bahwa persamaan regresi hanya cocok untuk rentang data penelitian yang ada, seharusnya tidak digunakan untuk memprediksikan hasil dari nilai suatu variabel diluar rentang yang digunakan dalam data penelitian.

Mungkin saja membuat garis yang tidak lurus untuk menggambarkan hubungan antar variabel, meskipun prosedurnya menjadi jauh lebih rumit. Saat membaca jurnal yang menjelaskan hubungan non-linear yang kompleks (tidak berbentuk garis lurus), pertimbangkan apakah hasilnya masuk akal. Software statistik tidak memberi tahu penggunanya apakah hasilnya masuk akal, program komputer tersebut hanya akan melakukan serumit apapun hitungannya dan menyajikan garis yang aneh dan rumit dalam grafik.

Artikel jurnal sering menampilkan nilai R2. Nilai ini adalah proporsi variabilitas dari variabel outcome yang diterangkan oleh variabel explanatory. Nilai yang mendekati 1 menunjukkan bahwa variabel explanatory mencakup hampir seluruh variasi pada variabel outcome (data mayoritas tersebar di dekat garis, tersebar tidak terlalu jauh di sekitar garis regresi); nilai yang mendekati 0 menunjukkan bahwa variabel explanatory hanya mencakup sedikit variasi pada variabel outcome (data hanya sedikit yang tersebar di sekitar garis regresi, mayoritas tersebar jauh dari garis regresi). Jadi makin besar nilainya makin baik.

 

Regresi Logistik

Regresi logistik digunakan saat outcome dari suatu variabel hanya 2 (biner, dikotomi), contohnya seperti variabel yang pilihan jawabannya hanya ya dan tidak. Variabel explanatory dapat biner/dikotomi (misalnya jenis kelamin), memiliki beberapa kategori (misalnya suku bangsa), atau kontinyu (misalnya usia). Prinsip regresi logistik sangat mirio dengan regresi linear. Setiap pasien memiliki peluang (p) untuk mengalami suatu hasil (misalnya terserang stroke), dan ini dapat dimodelkan sebagai berikut:

log natural

(ini adalah log natural).

Software statistik sering memberikan nilai B, yang dapat dipakai untuk menentukan odds ratio. Ini adalah gambaran yang biasanya dijumpai pada paper. Odds ratio adalah ukuran kekuatan suatu hubungan dan menerangkan kesempatan salah satu kelompok pasien (misalnya wanita) menderita suatu kejadian relatif terhadap anggota kelompok lain (misalnya pria). Nilai 1 menunjukkan tidak ada hubungan. Contoh analisis regresi logistik bisa dilihat di tabel 1.

regresi logistik

 

Cox Proportional Hazards

Ini adalah jenis analisis regresi yang sering digunakan saat outcomenya adalah waktu terjadinya suatu kejadian (contohnya waktu hingga meninggal). Di akhir penelitian, beberapa pasien mungkin tidak mengalami outcome yang diperirakan (misalnya tidak mengalami stroke), dan yang diketahui hingga saat tersebut adalah pasien tidak mengalami stroke hingga suatu titik waktu tertentu. Observasi semacam ini disebut “censored”, dan analisis Cox proportional hazards (CPH) menggunakan informasi ini.

Model regresi (CPH) memiliki rumus matematika yang rumit, tapi hasilnya diinterpretasikan seperti model regresi logistik. Hasilnya disampaikan dalam istilah hazard ratio bukan odds ratio. Hazard adalah risiko suatu kejadian pada waktu tertentu, jika pasien belum mengalami kejadian pada saat itu. Contoh analisis regresi Cox bisa dilihat di tabel 2.

cox proportional hazard

 

[PEPO]

Sumber:

Regression analysis oleh Steff Lewis, terbit pada Practical Neurology 2007;7;259-264.

Penulis:

Being a PHD

Silahkan berkomentar.

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s