Memahami Makna Ukuran Kemiringan Suatu Dataset

Salah satu langkah utama dalan analisis statistika adalah menemukan karakteristik dari suatu dataset. Karakteristik dataset harus mampu menjawab pertanyaan seperti, "Mana data yang memiliki banyak frekuensi?" atau "Seberapa banyak ragam dataset ini?" Salah satu karakteristik dataset adalah kemiringan atau skewness.

Apa yang dimaksud dengan Kemiringan?

Kemiringan (skewness) adalah ukuran ketidaksimetrisan pada distribusi normal untuk suatu dataset. Semakin tinggi nilai kemiringan suatu dataset, maka dataset tersebut semakin jauh dari bentuk distribusi normal atau Bell Curve.

Bagaimana bentuk Kemiringan itu?

Perhatikan kurva di bawah ini.

Kemiringan Dataset

Apabila puncak pada kurva bergeser ke kiri atau ke kanan, maka distribusi tersebut dikatakan miring. Jika puncak kurva berada di tengah, maka distribusi tersebut dikatakan normal atau Bell curve. Suatu distribusi memiliki kurva yang berada di puncak, dan sisi kanan dan kiri yang disebut dengan ekor (tail).

Nilai ukuran kemiringan sebesar nol menunjukkan bahwa dataset berbentuk distribusi normal yang tampak simetris. Apabila nilai ukuran kemiringan merupakan bilangan positif, maka kurva akan memiliki ekor yang memanjang ke kanan. Sebaliknya, jika nilainya negatif, maka ekor akan memanjang ke kiri.

Bentuk histogram tidak hanya menunjukkan kemiringan namun juga menunjukkan hubungan antara nilai Mean, Median, dan Modus. Pelajari di artikel Mengenal Central Tendency: Mean, Median, dan Modus

Apa rumus untuk mencari nilai Kemiringan?

Rumus mencari nilai kemiringan ada beberapa cara. Salah satunya ialah cara Karl Pearson yang menggunakan nilai Modus (Mode) dan menggunakan nilai Median. Jika dataset tidak memiliki nilai Modus maka dapat menggunakan nilai Median, rumusnya adalah

$$Sk=\left(3\times\left(\bar{X}-Md\right)\right)/s$$

Jika menggunakan nilai Modus, menggunakan rumus ini.

$$Sk=\left(\bar{X}-Mo\right)/s$$

\(Sk\) adalah nilai kemiringan, sedangkan \( \bar{X} \) merupakan nilai Mean. Standar Deviasi disimbolkan dengan \( s \), dan \( Md \) dan \( Mo \) adalah nilai Median dan Modus.

foto penulis

Penulis

adalah seorang Dosen di Bidang Ilmu Komputer. Ia bergelar Master of Computer Science dari Universitas Gadjah Mada.

Anda mencari sesuatu? Cari disini!