ทำความรู้จักกับข้อมูล (Data) ให้มากขึ้น ตอน 7

หลังจากที่เราได้เรียนรู้เกี่ยวกับการวัดค่าเฉลี่ยทางสถิติสองแบบแรกไปแล้ว นั่นก็คือ

1. Weighted Mean และ

2. Geometric Mean

ดังนั้นในบทความนี้เราจะมาเรียนรู้และทำความรู้จักกับการวัดค่าเฉลี่ยทางสถิติแบบที่ 3 นั่นก็คือ

3. Harmonic Mean หรือ ค่าเฉลี่ยฮาร์โมนิก

ค่าเฉลี่ยฮาร์โมนิกมีวิธีการคิดที่แตกต่างจากค่าเฉลี่ยแบบอื่นๆพอสมควร นั่นคือ ส่วนกลับของค่าเฉลี่ยของส่วนกลับ อ่านแล้วอาจจะงง เรามาดูสูตรกันดีกว่าครับ

Harmonic Mean Definition | DeepAI

ตัวอย่างเช่น จงหาค่าเฉลี่ย Harmonic ของข้อมูล 1,2,4 เราจะได้ว่า

หลายคนอาจจะสงสัยว่าเราทำแบบนี้ไปทำไม เรามาดูอีกตัวอย่างที่สามารถตอบคำถามนี้ได้กันครับ

จงหาค่าเฉลี่ยฮาร์โมนิคความเร็ว ของการเดินทาง 10 กิโลเมตรด้วยความเร็ว 60 กิโลเมตร/ชั่วโมง และเดินทางอีกครั้งด้วยระยะทาง 10 กิโลเมตรด้วยความเร็ว 20 กิโลเมตร/ชั่วโมง

หากเราคิดแบบค่าเฉลี่ยแบบธรรมดาเราจะได้ 60+20 / 2 = 40 กิโลเมตรต่อชั่วโมง

ซึ่งถ้าเราใช้ Common Sense พิจารณาว่า เดินทาง 60 กิโลเมตร/ชั่วโมง ระยะทาง 10 กิโลเมตร ใช้เวลาไป 10 นาที และอีกครั้งหนึ่ง 20 กิโลเมตร/ชั่วโมง ระยะทาง 10 กิโลเมตร ใช้เวลาไป 30 นาที

ดังนั้น ระยะทางทั้งหมดเป็น 40 กิโลเมตร ใช้เวลา 20 นาที จะเท่ากับเดินทางด้วยความเร็วเฉลี่ย 30 กิโลเมตรต่อชั่วโมง

ดังนั้นค่าเฉลี่ยแบบธรรมจึงผิด ต่อมาเราจะลองหาด้วยค่าเฉลี่ยฮาร์โมนิก

จึงสรุปได้ว่า ค่าเฉลี่ยแบบฮาร์โมนิกคือค่าเฉลี่ยที่ถูกต้องสำหรับการหาความเร็วเฉลี่ยนั่นเองครับ

ประโยชน์อีกอย่างหนึ่งของการหาค่าเฉลี่ยแบบ Harmonic นั่นก็คือ ค่าเฉลี่ยแบบนี้สามารถใช้จัดการกับ Outliers ได้ดีมากกว่า ตัวอย่างเช่น เรามีข้อมูล 4 ตัวดังนี้:

2, 4, 6, 100

หากเราหาค่าเฉลี่ยธรรมดาจะได้ว่า 2 + 4 + 6 + 100 = 28

แม้ว่า 2 4 และ 6 จะมีค่าน้อยมากกๆ แต่ถูก 100 ซึ่งเป็น Outlier ของข้อมูลชุดนี้ดึงขึ้นมา ทำให้ค่าเฉลี่ยธรรมดามีค่าสูงถึง 28 ซึ่งหากใครกำลังเรียน Machine Learning จะรู้ว่าการมี Outliers ใน Dataset จะทำให้ข้อมูลมีความแม่นยำน้อยลง ดังนั้นค่าเฉลี่ยแบบฮาร์โมนิก ก็สามารถเป็นตัวเลือกที่ดีได้

หากเราหาค่าเฉลี่ย Harmonic จากข้อมูลชุดนั้นเราจะได้ว่า

ซึ่งจะเห็นว่าค่าเฉลี่ยแบบฮาร์โมนิกมีค่าน้อยกว่ามากค่าเฉลี่ยแบบธรรมดามาก เพราะ Outlier มีความสำคัญน้อยลงมากจากการกลับเศษเป็นส่วนนั่งเอง

Write a comment