Box Plot การแสดงผลแบบกล่องอันทรงพลัง!! ตอนที่ 1

เวลาพูดถึงการแสดงผลของข้อมูล (Data Visualization) หลายคนอาจจะสงสัย ว่าเจ้ากล่องสี่เหลี่ยมยาวๆนี้คืออะไร มีประโยชน์อะไรบ้าง?  บางคนอาจจะไม่สนใจเลย เนื่องจากมันไม่ได้ดูปุ๊บรู้ปั๊บ เข้าใจง่ายๆ เหมือนกับ Line Graph หรือว่า Bar Chart แต่หารู้ไม่ ว่าเจ้ากล่องสี่เหลี่ยมผืนผ้าเหล่านี้ มีข้อมูลทางสถิติที่น่าสนใจอยู่มาก ต่อมาเราจะไปดูกันนะครับ ว่า Box Plot คืออะไร และ มีประโยชน์อะไรบ้าง ก่อนอื่นเรามาทำความรู้จักกับส่วนประกอบต่างๆของ Box Plot กันก่อน

Box Plot หรือ Whisker Plot (ใช้ได้ทั้งสองชื่อ) คือ Data Visualization ประเภทหนึ่งที่ใช้ในการอธิบายข้อมูลทางสถิติของกลุ่มข้อมูลที่เราต้องการ Box Plot สามารถบอกข้อมูลทางสถิติของกล่มข้อมูลนั้นได้หลายอย่างมากๆ เหมาะสำหรับการทำ Data Analysis เบื้องต้น

1. Distribution (ข้อมูลการกระจายตัว) ใช้บอกว่าข้อมูลนั้นมีการกระจายตัวอย่างไร เช่น Normal Distribution

2. Skewness (ข้อมูลการแจกแจงเบ้ซ้ายหรือเบ้ขวา) ใช้บอกการแจกแจงความถี่ว่าข้อมูลมีความถี่มากช่วงใด

3. Mean (ค่ากลางของข้อมูล) ซึ่งเป็นค่าของตำแหน่งที่อยู่ตรงกลางของข้อมูลชุดนั้นๆ

4. Min Value and Max Value (ข้อมูลสูงสุดและข้อมูลต่ำสุด) คือค่ามากที่สุด และ ค่าน้อยที่สุดของชุดข้อมูล

นอกจากข้อมูลทั้ง 4 ที่สังเกตได้ง่ายแล้วนั้น Box Plot ยังบอกข้อมูลทางสถิติอื่นๆอีกด้วย

5. 25% Percentile หรือ Lower Quartile บอกค่าของตำแหน่งที่ 25th Percentile ของข้อมูลข้อมูลชุดนั้น

*50% Percentile หรือ ค่า Median คือค่ากลางข้อมูลซึ่งคือข้อ 3.

6. 75% Percentile หรือ Upper Quartile บอกค่าของตำแหน่งที่ 75th Percentile ของข้อมูลชุดนั้น

7. Interquartile Range (IQR) คือระยะห่างระหว่าง 75th Percentile และ 25% Percentile ซึ่งก็คือระยะ 50% ตรงกลาง ที่อยู่ในกล่องสี่เหลี่ยมนั่นเอง

8. Whiskers คือ ค่านอกจากค่าใน IQR ซึ่งก็คือ 25th Percentile บน และ 25th Percentile ล่าง

9. Outliers (ข้อมูลค่าผิดปกติ) ซึ่งก็คือข้อมูลที่ผิดปกติ (Anomaly) กล่าวคือ ข้อมูลที่แตกต่างจากข้อมูลในชุดนั้นๆมากจนเกินไป

ซึ่งเมื่อพิจารณา Box Plot ในแนวนอน (จะเป็นแนวตั้งหรือแนวนอน ค่าต่างๆก็ไม่เปลี่ยนไป) ส่วนประกอบของ Box Plot จะมีดังภาพ

Source:
https://www.simplypsychology.org/boxplots.html
https://www.khanacademy.org/math/statistics-probability/summarizing-quantitative-data/box-whisker-plots/a/box-plot-review
https://en.wikipedia.org/wiki/Percentile#:~:text=A%20percentile%20(or%20a%20centile,the%20observations%20may%20be%20found.
https://www.google.com/search?q=positive+skew&sxsrf=ALeKk020V-2CLC9-K9a4vK1ZfVWmSOTm5A:1597929098052&source=lnms&tbm=isch&sa=X&ved=2ahUKEwiKvo_i7anrAhWJXM0KHZnvBWkQ_AUoAXoECA0QAw&biw=1276&bih=950#imgrc=t6Dohm8q9E3FQM

Write a comment