Teknik Visualisasi Data dalam Statistika

Anda sudah berhasil mengumpulkan data harga tanah di suatu kota. Anda ingin menunjukkan kepada teman Anda, bahwa semakin dekat lokasi tanah dengan pusat kota, maka semakin mahal harganya. Bagaimana cara Anda menjelaskan kepada mereka? Anda bisa memvisualisasikannya.

Data adalah aspek paling penting di dalam statistika. Data harus dipahami agar kita bisa memilih mana teknik analisis yang sesuai. Kesimpulan yang ditarik berdasarkan analisis data yang sesuai adalah kesimpulan yang terbaik.

Lalu bagaimana caranya agar dapat memahami data?

Memahami data dapat dilakukan dengan memvisualisasikan data dalam bentuk chart atau grafik, serta tabel. Apa saja teknik-teknik dalam visualisasi data? Tipe data apa yang sesuai untuk setiap teknik yang digunakan? Semua akan kita bahas di artikel ini.

Baca juga: 7 Tipe Data dalam Statistika.

#1 Histogram untuk Variabel Kontinu

Histogram, grafik ini ditampilkan dalam bentuk beberapa bar atau batang yang mewakili rentang-rentang data. Tinggi setiap bar menunjukkan seberapa banyak data ada di rentang tersebut.

Sebagai contoh, suatu perusahaan mengumpulkan data usia seluruh karyawan mereka. Histogram berikut menunjukkan jumlah karyawan perusahaan ini yang didominasi oleh mereka yang berusia 22 hingga 28 tahun dan 34 hingga 40 tahun.

Histogram

#2 Scatterplot untuk Variabel Kontinu

Scatterplot adalah salah satu tipe grafik yang menampilkan titik-titik dalam koordinat Cartesian untuk menunjukkan hubungan antar dua dataset.

Misalnya, pada suatu RT dikumpulkan data berat badan dan usia sejumlah warga. Data ini digambarkan di scatterplot berikut. Sumbu X menunjukkan berat badan, dan sumbu Y menunjukkan usia. Terlihat ada banyak warga yang berusia kurang dari 30 tahun ternyata memiliki berat badan antara 50 hingga 56 kg

Scatterplot

#3 Time Series Plot untuk Variabel Kontinu dengan Waktu

Time series plot adalah grafik yang terdiri dari sumbu X untuk menunjukkan variabel waktu, serta sumbu Y yang menunjukkan dataset. Grafik ini memiliki titik-titik yang terhubung oleh garis lurus untuk menunjukkan perkembangan data dari waktu ke waktu.

Misal, suatu perusahaan memiliki data profit untuk setiap tahunnya yang ditunjukkan oleh Time Series Plot berikut. Pada kuartal ketiga, terlihat bahwa perusahaan ini mengalami penurunan profit dan kemudian mampu kembali meningkat di tahun-tahun berikutnya.

Time Series Plot

#4 Bar Chart untuk Variabel Diskrit

Bar chart menampilkan variabel diskrit ataupun data kategorikal dalam bentuk bar horizontal atau vertikal dengan tinggi atau panjang bar yang sesuai dengan jumlah datanya.

Sebagai contoh, Anda memiliki data yang berupa nilai sejumlah mahasiswa untuk suatu mata kuliah. Bar chart di bawah ini dapat membantu Anda untuk mengetahui apakah seluruh mahasiswa berhasil menyelesaikan perkuliahan dengan baik atau tidak. Berdasarkan Bar chart ini, sebagian besar mahasiswa memiliki nilai yang baik.

Bar Chart

#5 Pie Chart untuk Data Kategorikal dan Biner

Pie chart ditampilkan dalam bentuk lingkaran yang terbagi dengan ukuran panjang busur tertentu untuk menunjukkan perbandingan jumlah data.

Pie chart berikut menunjukkan rasio jumlah mahasiswa laki-laki dengan mahasiswa perempuan di suatu kampus. Jumlah mahasiswa perempuan jauh lebih banyak daripada jumlah mahasiswa laki-laki yang hanya 22 persen dari total keseluruhan mahasiswa.

Pie Chart

#6 Tabel Frekuensi

Nilai data dijabarkan ke dalam suatu kolom yang disebut kolom frekuensi. Angka yang diperlihatkan dari setiap baris di dalam kolom frekuensi memudahkan seseorang untuk mengetahui mana nilai data terkecil ataupun nilai data yang terbesar.

Tabel frekuensi di bawah ini menunjukkan angka penjualan mobil di berbagai merek. Berdasarkan tabel, Anda dapat melihat merek mobil yang paling tinggi angka penjualannya, yaitu mobil bermerek Honda.

Tabel Frekuensi

#7 Cross Table

Cross table juga biasa disebut dengan istilah pivot table. Cross table digunakan untuk memperlihatkan hubungan nilai diantara sejumlah variabel.

Pada cross table di bawah ini memperlihatkan hubungan antara variabel minat membaca dengan minat menulis sejumlah orang. Seseorang yang memiliki minat membaca yang tinggi, cenderung memiliki ketertarikan yang besar untuk menulis.

Cross Table
foto penulis

Penulis

adalah seorang Dosen di Bidang Ilmu Komputer. Ia bergelar Master of Computer Science dari Universitas Gadjah Mada.

Anda mencari sesuatu? Cari disini!