Outlier adalah data yang berada diluar nilai rata-rata atau mempunyai nilai yang jauh berbeda dari sekelompok data lainnya. Dalam dunia statistik dan pendataan, outlier ini sering kali menjadi pengganggu dan mempengaruhi hasil analisis secara keseluruhan. Salah satu cara untuk mengetahui adanya data outlier adalah dengan menggunakan diagram boxplot.
Apa itu Diagram Boxplot?
Diagram boxplot, atau biasa juga disebut sebagai box and whisker plot, merupakan metode penggambaran dalam statistik yang bisa memberikan gambaran tentang sebaran data, nilai tengah data, serta data outlier jika ada. Diagram ini menggambarkan lima angka penting dalam data, yaitu nilai minimum, kuartil pertama (Q1), median (Q2), kuartil ketiga (Q3), dan nilai maksimum.
Bagaimana Cara Kerja Diagram Boxplot?
Diagram boxplot bekerja dengan cara membagi data menjadi empat bagian (kuartil), kemudian menggambar ‘box’ atau kotak yang merepresentasikan seluruh kuartil tersebut. Garis dalam kotak menunjukkan median atau nilai tengah data. Sementara ‘whisker’ atau garis yang keluar dari kotak menunjukkan rentang nilai data, dari nilai terkecil hingga nilai terbesar.
Seluruh nilai data yang berada di luar dari ‘whisker’ ini dapat didefinisikan sebagai outlier. Jadi, dengan menggunakan diagram boxplot, pengguna bisa dengan mudah melihat adanya data yang bersifat outlier.
Bagaimana Membuat Diagram Boxplot?
Untuk membuat diagram boxplot, berikut adalah langkah-langkah yang bisa diikuti:
- Hitung nilai minimum, Q1, median, Q3, dan nilai maksimum dari data.
- Gambar kotak yang merepresentasikan Q1 sampai dengan Q3, dan tarik garis di median.
- Gambar ‘whisker’ yang merepresentasikan nilai minimum dan maksimum.
- Tunjukkan data outlier dengan cara menambahkan simbol (misalnya titik atau bintang) pada data yang berada di luar dari ‘whisker’.
Dalam praktiknya, banyak software statistik dan bahasa pemrograman, seperti Python dan R, yang menyediakan fungsi untuk membuat diagram boxplot ini dengan mudah dan cepat.
Pertanyaan: Anda Dapat Mengetahui Data yang Bersifat Outlier, dengan Menggunakan Diagram Boxplot?
Jadi, jawabannya apa?
Ya, Anda dapat mengetahui data yang bersifat outlier dengan menggunakan diagram boxplot. Diagram boxplot menunjukkan outlier sebagai titik atau simbol yang berada di luar dari ‘whisker’. Dengan demikian, data outlier bisa terlihat jelas dan bisa diputuskan apakah data tersebut akan dipertahankan, diubah, atau dihapus dari analisis.