Formula Outlier - Langkah demi Langkah Pengiraan Outlier (dengan Contoh)

Rumus Outlier menyediakan alat grafik untuk mengira data yang berada di luar set taburan yang diberikan yang mungkin sisi dalam atau luar bergantung pada pemboleh ubah.

Apa itu Formula Outlier?

Outlier adalah titik data dari sampel yang diberikan atau pemerhatian yang diberikan atau dalam sebaran yang berada di luar keseluruhan corak. Peraturan yang biasa digunakan yang mengatakan bahawa titik data akan dianggap sebagai outlier jika memiliki lebih dari 1.5 IQR di bawah kuartil pertama atau di atas kuartil ketiga.

Dengan kata lain, outliers rendah terletak di bawah Q1-1.5 IQR dan outliers tinggi terletak Q3 + 1.5IQR

Seseorang perlu mengira median, kuartil, termasuk IQR, Q1, dan Q3.

Rumus outlier ditunjukkan seperti berikut,

Rumus untuk Q1 = ¼ (n + 1) istilah ke  -Formula untuk Q3 = ¾ (n + 1) istilah ke  -Formula untuk Q2 = Q3 - Q1

Langkah demi langkah Pengiraan Outlier

Langkah-langkah di bawah perlu diikuti untuk mengira Outlier.

  • Langkah 1: Kira kuartil pertama, Q1, Q2 dan interquartile
  • Langkah 2: Sekarang hitung nilai Q2 * 1.5
  • Langkah 3: Sekarang Kurangkan nilai Q1 dari nilai yang dikira dalam Langkah2
  • Langkah 4: Di sini Tambahkan Q3 dengan nilai yang dikira pada langkah2
  • Langkah 5: Buat julat nilai yang dikira dalam Langkah3 dan Langkah4
  • Langkah 6: Susun data mengikut urutan menaik
  • Langkah 7: Periksa sama ada terdapat nilai yang berada di bawah atau lebih tinggi daripada julat yang dibuat di Langkah5.

Contohnya

Pertimbangkan satu set data dengan nombor berikut: 10, 2, 4, 7, 8, 5, 11, 3, 12. Anda diminta untuk mengira semua Outliers.

Penyelesaian:

Pertama, kita perlu menyusun data dalam urutan menaik untuk mencari median, yang akan menjadi Q2 bagi kita.

2, 3, 4, 5, 7, 8, 10, 11, 12

Sekarang kerana jumlah pemerhatian adalah ganjil, iaitu 9, median akan berada pada posisi ke- 5 , yaitu 7, dan yang sama akan menjadi Q2 untuk contoh ini.

Oleh itu, pengiraan Q1 adalah seperti berikut -

S1 = ¼ (9 + 1)

= ¼ (10)

Q1 akan menjadi -

S1 = 2.5 penggal

Ini cara yang Q1 adalah purata 2 nd dan 3 rd kedudukan pemerhatian, yang 3 & 4 di sini, dan purata adalah sama (3 + 4) / 2 = 3.5

Oleh itu, pengiraan Q3 adalah seperti berikut -

S3 = ¾ (9 + 1)

= ¾ (10)

S3 akan -

Q3 = 7.5 jangka

Ini cara yang Q3 ialah purata tempoh 7 th dan 8 th kedudukan pemerhatian, iaitu 10 & 11 di sini, dan purata adalah sama (10 + 11) / 2 = 10.5

Sekarang, outliers rendah terletak di bawah Q1-1.5IQR, dan outlier tinggi terletak di Q3 + 1.5IQR

Jadi, nilai adalah 3.5 - (1.5 * 7) = -7 dan julat yang lebih tinggi ialah 10.5 + (1.5 * 7) = 110.25.

Oleh kerana tidak ada pemerhatian yang terletak di atas atau lebih rendah daripada 110.25 dan -7, kami tidak mempunyai garis besar dalam sampel ini.

Contoh Formula Outlier dalam Excel (dengan Templat Excel)

Kelas bimbingan kreatif sedang mempertimbangkan untuk memberi ganjaran kepada pelajar yang berada di 25% teratas. Walau bagaimanapun, mereka ingin mengelakkan sebarang kelebihan. Data adalah untuk 25 pelajar. Gunakan persamaan Outlier untuk menentukan sama ada ada outlier?

Penyelesaian:

Di bawah ini diberikan data untuk mengira outlier.

Jumlah pemerhatian di sini adalah 25, dan langkah pertama kami adalah menukar data mentah di atas dalam urutan menaik.

Median akan -

Nilai median = ½ (n + 1)

= ½ = ½ (26)

= Penggal ke- 13

Q2 atau median ialah 68.00

Yang merupakan 50% daripada populasi.

Q1 akan menjadi -

S1 = ¼ (n + 1) penggal ke-1

= ¼ (25 + 1)

= ¼ (26)

= 6,5 th jangka, yang bersamaan dengan 7 th jangka

Q1 adalah 56.00, yang berada di bawah 25%

S3 akan -

Akhirnya, Q3 = ¾ (n + 1) penggal ke-3

= ¾ (26)

= 19.50 penggal

Di sini rata-rata perlu diambil, iaitu istilah ke -19 dan ke -20 yang 77 dan 77 dan rata-rata yang sama adalah (77 + 77) / 2 = 77.00

Q3 adalah 77, yang merupakan 25% teratas

Julat Rendah

Sekarang, outliers rendah terletak di bawah Q1-1.5IQR, dan outlier tinggi terletak di Q3 + 1.5IQR

Julat Tinggi -

Jadi, nilai adalah 56 - (1.5 * 68) = -46 dan julat yang lebih tinggi ialah 77 + (1.5 * 68) = 179.

Tidak ada penyekat.

Perkaitan dan Kegunaan

Rumus outliers sangat penting untuk diketahui kerana mungkin ada data yang akan cenderung dengan nilai tersebut. Ambil contoh pemerhatian 2, 4, 6, 101, dan sekarang jika seseorang mengambil nilai rata-rata ini, nilainya akan menjadi 28,25, tetapi 75% pemerhatian berada di bawah 7, dan oleh itu satu keputusan yang salah mengenai pemerhatian terhadap sampel ini.

Di sini dapat diperhatikan bahawa 101 jelas menunjukkan garis besarnya, dan jika ini dihapus, maka rata-rata akan menjadi 4, yang mengatakan mengenai nilai atau pemerhatian yang ada dalam lingkungan 4. Oleh itu, sangat penting untuk melakukan ini pengiraan untuk mengelakkan penyalahgunaan maklumat utama data. Ini digunakan secara meluas oleh ahli statistik di seluruh dunia setiap kali mereka melakukan penyelidikan.

Artikel menarik...