หลังจากที่เราแนะนำส่วนประกอบของ Box Plot กันไปเรียบร้อยแล้ว (หวังว่าทุกคนยังจำกันได้) ในตอนนี้ ผมจะมาอธิบายการคำนวณค่าต่างๆของ Box Plot อย่างละเอียด
สำหรับการดูและการคำนวณในแต่ละข้อนั้น มีรายละเอียดดังนี้
1. Distribution เราจะสังเกตการกระจายได้จากตำแหน่งของ Interquartile Range หาก IQR อยู่ตรงกลาง เราจะสรุปได้ว่า ข้อมูลชุดนี้เป็น Normal Distribution หรือ Symmetric Shape
2. Right Skew (Positive Skew) หมายถึง ชุดข้อมูลที่ค่าเฉลี่ยมากกว่า Median หรือ มีความถี่ของข้อมูลด้านซ้ายมากกว่าความถี่ของข้อมูลด้านขวา และ Left Skew (Negative Skew) หมายถึง ชุดข้อมูลที่ค่าเฉลี่ยน้อยกว่า Median หรือ มีความถี่ของข้อมูลด้านขวามากกว่าความถี่ของข้อมูลด้านซ้าย
ซึ่งข้อ 3-9 จะยกตัวอย่างโดยใช้วิธีการคำนวณแบบละเอียด
ข้อมูลชุดหนึ่งมีจำนวน 10 ตัว ดังนี้ 35 37 29 34 25 38 30 29 28 35
ก่อนอื่นเราต้องเรียงลำดับจากน้อยไปมากก่อน (ทุกครั้ง) เราจะได้ 25 28 29 29 30 34 35 35 37 38
3. Median หรือ ค่ากลางของข้อมูล เช่น มี 5 จำนวน ค่ากลางก็จะเป็นตำแหน่งที่ 3 แต่ถ้าเป็นเลขคู่เช่นกรณีนี้ ค่ากลางก็จะเป็นค่าเฉลี่ยของ 2 ตำแหน่งกลาง เช่น 30 + 34 / 2 = 32 ดังนั้น Median = 32
4. Min Value and Max Value หรือ ข้อมูลสูงสุดและข้อมูลต่ำสุดของข้อมูลชุดนั้น สำหรับในที่นี้ก็ค่อนข้างที่จะตรงไปตรงมา (หลังจากเรียงจากน้อยไปมากแล้ว) นั่นก็คือ Min Value = 25 และ Max Value = 38
5. 25% Percentile หรือ Lower Quartile คือ ค่าที่ตำแหน่งที่ 25th percentile นั่นก็คือตำแหน่งที่ 25/100 x 10 = 2.5 ปัดขึ้นเป็น 3 นั่นก็คือ ค่าของตำแหน่งที่ 3 ดังนั้น 25% Percentile = 29
*50% Percentile หรือ ค่า Median คือค่ากลางข้อมูลซึ่งคือข้อ 3.
6. 75% Percentile หรือ Upper Quartile คือ ค่าของตำแหน่งที่ 75th Percentile นั่นก็คือตำแหน่งที่ 75/100 x 10 = 7.5 ปัดขึ้นเป็น 8 นั่นก็คือ ค่าของตำแหน่งที่ 8 ดังนั้น 75% Percentile = 35
7. Interquartile Range (IQR) คือระยะห่างระหว่าง 75th Percentile และ 25% Percentile ซึ่งในที่นี้ก็คือ
35 – 29 = 6
8. Whiskers คือ ค่านอกจากค่าใน IQR ซึ่งก็คือ 25th Percentile บน และ 25th Percentile ล่าง ซึ่งก็คือ ช่วงตั้งแต่ 25 – 29 และ 35 – 38 ซึ่งเราสามารถเรียกว่า Whisker บน และ Whisker ล่างได้เช่นกัน
สำหรับการคำนวณ Outliers จะมีรายละเอียดปลึกย่อยเพิ่มอีกเล็กน้อย ผมจะไปอธิบายต่อในบทความหน้ากันนะครับ
Source:
https://www.simplypsychology.org/boxplots.html
https://www.khanacademy.org/math/statistics-probability/summarizing-quantitative-data/box-whisker-plots/a/box-plot-review
https://en.wikipedia.org/wiki/Percentile#:~:text=A%20percentile%20(or%20a%20centile,the%20observations%20may%20be%20found.
https://www.google.com/search?q=positive+skew&sxsrf=ALeKk020V-2CLC9-K9a4vK1ZfVWmSOTm5A:1597929098052&source=lnms&tbm=isch&sa=X&ved=2ahUKEwiKvo_i7anrAhWJXM0KHZnvBWkQ_AUoAXoECA0QAw&biw=1276&bih=950#imgrc=t6Dohm8q9E3FQM