Menentukan Hubungan Antar Variabel

Data yang dianalisis mungkin tidak hanya terdiri dari satu variabel, namun beberapa variabel. Diantara sejumlah variabel, ada pasangan variabel yang dikatakan saling terkait atau memiliki hubungan.

Hubungan Antar Variabel

Sebagai contoh, Anda sedang menganalisis angka penjualan rumah di suatu wilayah. Data yang Anda peroleh adalah luas tanah dan harga penjualannya. Perhatikan tabel berikut ini.

Variabel yang saling terhubung di tabel tersebut adalah luas tanah dan harga jual tanah. Supaya lebih mudah memahaminya, data ini akan diilustrasikan ke dalam scatterplot berikut.

Scatterplot menunjukkan ada korelasi antara kedua variabel ini. Apakah dengan menjual rumah yang tanahnya luas, maka harga jualnya juga besar? Nah, ukuran statistika yang digunakan untuk mengetahui korelasi kedua variabel disebut dengan Kovarians atau Covariance.

Baca juga: Teknik Visualisasi Data dalam Statistika

Apa rumus untuk mengukur nilai Kovarians?

Rumus menghitung Konvarians untuk data sampel adalah sebagai berikut,

$$ S_{xy}=\left(\sum_{i=1}^{n}\left(x_i-\bar{x}\right)\bullet\left(y_i-\bar{y}\right)\right)/\left(n-1\right) $$

Langkah-langkah menghitung Kovarians untuk data sampel, yakni

  1. Temukan nilai Mean untuk kedua variabel yang sedang dianalisis korelasinya.
  2. Hitung selisih setiap nilai dataset di kedua variabel dengan nilai Mean.
  3. Temukan hasil perkalian antara selisih dataset pertama dengan dataset kedua.
  4. Jumlahkan seluruhnya.
  5. Hasilnya dibagi dengan banyak dataset dikurangi satu.

Sedangkan rumus untuk menghitung Kovarians untuk data populasi adalah,

$$ \sigma_{xy}=\left(\sum_{i=1}^{n}\left(x_i-\mu_x\right)\bullet\left(y_i-\mu_y\right)\right)/N $$

Contoh Perhitungan Nilai Kovarian

Berdasarkan contoh dataset sebelumnya, misal \( x \) adalah luas tanah, dan \( y \) adalah harga jualnya, maka langkah menghitung nilai Kovarian dengan rumus untuk data sampel diperlihatkan di tabel berikut.

Apa Makna Nilai Kovarian?

Setelah mendapatkan perhitungan nilai Kovarian, langkah terakhir adalah mengetahui makna dari angka hasil perhitungannya. Apabila nilai Kovarian \( >0 \), maka nilai kedua variabel berubah bersamaan dengan arah yang sama. Jika nilainya nol, maka kedua variabel tidak bergerak bersama atau bisa dikatakan bahwa kedua variabel tidak memiliki hubungan sama sekali. Namun, saat nilainya \( <0 arah.="" bergerak="" berlawanan="" dataset="" kedua="" nilai="" p="" saling="">

Koefisien Korelasi

Angka yang ditunjukkan oleh nilai Kovarian lebih mudah diinterpretasikan dengan menghitung nilai Koefisien Korelasi atau Correlation Coefficient. Nilai Koefisien Korelasi juga dapat menunjukkan hubungan antar variabel namun lebih mudah dimaknai. Kenapa begitu?

Nilai Koefisien Korelasi hanya berkisar antara \( -1 \) hingga \( 1 \). Berbeda dengan nilai Kovarian yang seperti di contoh sebelumnya, nilainya mencapai milyaran. Apabila nilainya \( 1 \) maka seluruh variabilitas salah satu variabel berhubungan sepenuhnya oleh variabel lain. Jika nilainya \( 0 \), maka kedua variabel bersifat independen atau tidak ada hubungan satu sama lain. Namun apabila nilainya \( -1 \) maka saat nilai salah satu variabel meningkat, maka nilai variabel lainnya menurun.

Apa rumus menghitung nilai Koefisien Korelasi?

Nilai Koefisien Korelasi dihitung dengan nilai Standar Deviasi kedua variabel dan nilai Kovariannya.

$$ \rho_{xy}=\frac{{\rm Cov}_{\left(xy\right)}}{\sigma_x\sigma_y} $$

\( \rho_{xy} \) adalah nilai Koefisien Korelasi, \( {\rm Cov}_{\left(xy\right)} \) adalah nilai Kovarian dari kedua variabel, dan \( \sigma_x \) dan \( \sigma_y \) adalah nilai Standar Deviasi.

Baca juga: Mengukur Variabilitas suatu Dataset

Pada contoh dataset diatas, maka perhitungan nilai Koefisien Korelasinya adalah sebagai berikut.

Nilai Koefisien Korelasi yang diperoleh adalah sebesar \( 0,00000001898280254 \). Karena nilainya lebih dari \( 0 \), maka dapat disimpulkan bahwa variabel luas tanah dan harga tanah bergerak satu arah.

Nilai Kovarian dan nilai Koefisien Korelasi tidak menunjukkan adanya hubungan sebab-akibat di kedua variabel. Kedua nilai hanya memperlihatkan bahwa ada atau tidaknya hubungan diantara mereka.

foto penulis

Penulis

adalah seorang Dosen di Bidang Ilmu Komputer. Ia bergelar Master of Computer Science dari Universitas Gadjah Mada.

Anda mencari sesuatu? Cari disini!