ในตอนก่อนหน้านี้เราได้เรียนรู้เกี่ยวกับ ค่าเฉลี่ยแบบต่างๆเช่น Weighted Mean, Geometric Mean, and Harmonic Mean จากข้อมูลเชิงตัวเลขเรียบร้อยแล้ว ในบทความนี้เราจะมาโลกเปิดโลกให้กว้างขึ้น เพราะว่าไม่ใช่ข้อมูลทุกอย่างที่จะเก็บเป็นตัวเลขโดดๆ เช่น 10, 12, 13, 15, 18, 22 หมายความว่าข้อมูลอาจจะถูกเก็บอยู่ในรูปแบบตาราง (Table) ก็ได้เช่นกัน
ดังนั้น บทความนี้เราจะมาหาค่า Mean และ Median จากข้อมูลอยู่ในรูปแบบของตาราง หรือ อาจจะเรียกว่าเป็น Grouped Frequency Data.
โดยการหาค่า Mean และ and Median ของข้อมูลแบบตารางมีข้อจำกัดที่สำคัญอยู่ที่ว่า ค่าที่เราหาออกมานั้นไม่ใช่ค่าที่แน่นอน 100% (Exact Values) แต่จะเป็นค่าประมาณที่ใกล้เคียงแทน (Estimates)
สมมติว่าเรามีข้อมูลความยาวของแตงกวาสายพันธ์หนึ่ง มีค่าดังนี้ 150,150,151,153,154,155,158,160,161,162,163,164,164,165,165,165,166,167,167,168,169,170,170,171,172,172,172,173,173,174,175,175,175,175,175,175,176,177,178,178,179,180,180,181,183,184,184,185,188,189
สรุป เรามีข้อมูลความยาวของแตงกวา 50 ผล โดยแจกแจงตามข้อมูลด้านบน หากเรามาเก็บข้อมูลอยู่ในตารางเราจะได้ว่า
ความยาว (มิลลิเมตร) | ความถี่ |
150-154 | 5 |
155-159 | 2 |
160-164 | 6 |
165-169 | 8 |
170-174 | 9 |
175-179 | 11 |
180-184 | 6 |
185-189 | 3 |
แต่ถ้าเราเกิดอุบัติเหตุทำข้อมูลหายล่ะ!! เหลือแค่ตารางเราจะหา Mean, Median ได้อย่างไร
การหาค่าเฉลี่ย Mean จะทำได้ง่ายที่สุด โดยจะหาค่าผลรวมของ ตรงกลาง(เป็นตัวแทนของ Interval นั้นๆ) คูณกับความถี่ แล้วหารด้วยจำนวนทั้งหมด
ความยาว (มิลลิเมตร) | ค่าตรงกลาง | ความถี่ |
150-154 | 152 | 5 |
155-159 | 157 | 2 |
160-164 | 162 | 6 |
165-169 | 167 | 8 |
170-174 | 172 | 9 |
175-179 | 177 | 11 |
180-184 | 182 | 6 |
185-189 | 187 | 3 |
ดังนั้น เราจะได้ว่า (152×5) + (157×2) + (162×6) + (167×8) + (172×9) + (177×11) + (182×6) + (187×3) / 50
เราจึงสรุปได้ว่า ค่าเฉลี่ยประมาณของความยาวของแตงกวาที่อยู่ในรูปตาราง = 8530/50 = 170.6 มิลลิเมตร
เมื่อเทียบกับค่าเฉลี่ยจริงๆจะได้ = 8516/50 = 170.32 ซึ่งถือว่าใกล้เคียงมากๆทีเดียว
ต่อมาเรามาหาค่ากลาง (Median) จากข้อมูลกันครับ
โดย
L = ขอบเขตล่างของข้อกลุ่มข้อมูลที่ Median อยู่
N = จำนวนข้อมูลทั้งหมด
B = ความถี่สะสมของก่อนจะถึงกลุ่มที่ Median อยู่
G = ความถี่ของกลุ่มที่ Median อยู่
W = ระยะ (Inteval) ของกลุ่ม
เราจะได้ว่าค่า Median จะอยู่ระหว่างสมาชิกลำดับที่ 25 และ 26 (เนื่องจากเป็นเลขคู่) ดังนั้นจะอยู่ในกลุ่ม 170 – 174 เมื่อนับจากความถี่สะสม ดังนั้นเราจะได้
L = 169.5, n=50, B=21, G=9, w=5
ดังนั้น ค่าประมาณ Mean = = 171.7 มิลลิเมตร
ซึ่งค่า Median ที่แท้จริงคือ 172 ซึ่งถือว่าใกล้เคียงมากๆทีเดียว