ทำความรู้จักกับข้อมูล (Data) ให้มากขึ้น ตอน 8

ในตอนก่อนหน้านี้เราได้เรียนรู้เกี่ยวกับ ค่าเฉลี่ยแบบต่างๆเช่น Weighted Mean, Geometric Mean, and Harmonic Mean จากข้อมูลเชิงตัวเลขเรียบร้อยแล้ว ในบทความนี้เราจะมาโลกเปิดโลกให้กว้างขึ้น เพราะว่าไม่ใช่ข้อมูลทุกอย่างที่จะเก็บเป็นตัวเลขโดดๆ เช่น 10, 12, 13, 15, 18, 22 หมายความว่าข้อมูลอาจจะถูกเก็บอยู่ในรูปแบบตาราง (Table) ก็ได้เช่นกัน

ดังนั้น บทความนี้เราจะมาหาค่า Mean และ Median จากข้อมูลอยู่ในรูปแบบของตาราง หรือ อาจจะเรียกว่าเป็น Grouped Frequency Data.

โดยการหาค่า Mean และ and Median ของข้อมูลแบบตารางมีข้อจำกัดที่สำคัญอยู่ที่ว่า ค่าที่เราหาออกมานั้นไม่ใช่ค่าที่แน่นอน 100% (Exact Values) แต่จะเป็นค่าประมาณที่ใกล้เคียงแทน (Estimates)

สมมติว่าเรามีข้อมูลความยาวของแตงกวาสายพันธ์หนึ่ง มีค่าดังนี้ 150,150,151,153,154,155,158,160,161,162,163,164,164,165,165,165,166,167,167,168,169,170,170,171,172,172,172,173,173,174,175,175,175,175,175,175,176,177,178,178,179,180,180,181,183,184,184,185,188,189

สรุป เรามีข้อมูลความยาวของแตงกวา 50 ผล โดยแจกแจงตามข้อมูลด้านบน หากเรามาเก็บข้อมูลอยู่ในตารางเราจะได้ว่า

ความยาว (มิลลิเมตร)ความถี่
150-1545
155-1592
160-1646
165-1698
170-1749
175-17911
180-1846
185-1893

แต่ถ้าเราเกิดอุบัติเหตุทำข้อมูลหายล่ะ!! เหลือแค่ตารางเราจะหา Mean, Median ได้อย่างไร

การหาค่าเฉลี่ย Mean จะทำได้ง่ายที่สุด โดยจะหาค่าผลรวมของ ตรงกลาง(เป็นตัวแทนของ Interval นั้นๆ) คูณกับความถี่ แล้วหารด้วยจำนวนทั้งหมด

ความยาว (มิลลิเมตร)ค่าตรงกลางความถี่
150-1541525
155-1591572
160-1641626
165-1691678
170-1741729
175-17917711
180-1841826
185-1891873

ดังนั้น เราจะได้ว่า (152×5) + (157×2) + (162×6) + (167×8) + (172×9) + (177×11) + (182×6) + (187×3) / 50

เราจึงสรุปได้ว่า ค่าเฉลี่ยประมาณของความยาวของแตงกวาที่อยู่ในรูปตาราง = 8530/50 = 170.6 มิลลิเมตร

เมื่อเทียบกับค่าเฉลี่ยจริงๆจะได้ =  8516/50 = 170.32 ซึ่งถือว่าใกล้เคียงมากๆทีเดียว

ต่อมาเรามาหาค่ากลาง (Median) จากข้อมูลกันครับ

โดย

L = ขอบเขตล่างของข้อกลุ่มข้อมูลที่ Median อยู่

N = จำนวนข้อมูลทั้งหมด

B = ความถี่สะสมของก่อนจะถึงกลุ่มที่ Median อยู่

G = ความถี่ของกลุ่มที่ Median อยู่

W = ระยะ (Inteval) ของกลุ่ม

เราจะได้ว่าค่า Median จะอยู่ระหว่างสมาชิกลำดับที่ 25 และ 26 (เนื่องจากเป็นเลขคู่) ดังนั้นจะอยู่ในกลุ่ม 170 – 174 เมื่อนับจากความถี่สะสม ดังนั้นเราจะได้

L = 169.5, n=50, B=21, G=9, w=5

ดังนั้น ค่าประมาณ Mean =  = 171.7 มิลลิเมตร

ซึ่งค่า Median ที่แท้จริงคือ 172 ซึ่งถือว่าใกล้เคียงมากๆทีเดียว

Write a comment