ทำความรู้จักกับข้อมูล (Data) ให้มากขึ้น ตอน 4

สำหรับตอนที่ 4 นี้นะครับ เราจะมาต่อกับการวัดค่าทางสถิติเบื้องต้นของข้อมูล

4. Coefficient of Variation (COV) คือ ค่าสัมประสิทธิ์ของความแปรผัน จะไม่มีหน่วย ใช้ในกรณีที่ต้องการเปรียบเทียบการกระจายตัวของข้อมูลกับข้อมูลชุดอื่น

โดย COV มีสูตรว่า     

             

ทีนี้มาลองดูตัวอย่างกันนะครับว่า COV สามารถใช้ทำอะไรได้บ้าง

โดย ในตารางเราจะเห็นการแปลงสกุลเงินไทยกับออสเตรเลียที่ 1 AUD = 20.5 THB

ดังนั้นค่า STD ของหน่วยเงินไทยจะสูงกว่ามหาศาลที่ 689.85 และค่า STD ของเงินออสเตรเลียจะอยู่ที่ 33.65 ซึ่งถ้าเราวัด STD ธรรมดา เราก็สรุปได้เลยว่าค่า STD เงินออสเตรเลียต่ำกว่าไทยอยู่มากโข แต่จริงๆแล้วมันเป็นอัตราเปรียบเทียบกัน ดังนั้นเราจะหาค่าเฉลี่ยของข้อมูลทั้งสองชุด ซึ่งได้ 18.125 และ 371.5625 ตามลำดับ และเข้าสูตร COV

ซึ่งเราจะได้ 33.65/18.125 = 1.856 และ 689.85/371.56 = 1.856 ซึ่ง COV จะบอกว่าข้อมูลชุดนั้นมี STD เท่ากับเท่าไหร่เมื่อเทียบกับค่าเฉลี่ยของตัวเอง ในที่นี้ได้ค่าเท่ากันเนื่องจากมันเป็นอัตราส่วนซึ่งกันแหละกัน

5. Covariance หรือ ค่าความแปรปรวนร่วม คือ ค่าที่หาความแปรปรวนของข้อมูลสองชุด

หากเมื่อพิจารณาข้อมูล ขนาดที่ดินและราคาที่ดิน จะเห็นว่าทั้งสองข้อมูลไปทิศทางเดียวกัน

ดังนั้นเราจะได้ค่า Covariance จะมีค่าสูงมาก ซึ่งถ้าค่าของข้อมูลทั้งสองชุดสวนทางกัน ค่า Covariance ก็จะติดลบ แต่ปัญหาคือ Covariance มีค่ามากหรือน้อยเกินไป (เมื่อยูนิตที่พิจารณาต่างกัน) ดังนั้นเราจึงมีการวัดอีกอย่างหนึ่งที่มาแก้ปัญหาจุดนี้

6. Correlation Coefficient หรือ ค่าสัมประสิทธิ์สหสัมพันธ์หรือค่า Covariance ที่ทำ Normalized แล้ว

ดังนั้นค่า Correlation Coefficient จะมีค่าอยู่ระหว่าง [-1,1] เพื่อการเปรียบเทียบกับข้อมูลคนละประเภทกันได้ง่ายยิ่งขึ้น

โดย ถ้าค่า Correlation Coefficient เข้าใกล้ -1 หมายความว่าข้อมูลทั้งสองชุดมีทิศทางตรงกันข้าม กล่าวคือ ข้อมูลชุดแรกเพิ่มขึ้น ข้อมูลชุดสองลดลง เช่น อุณหภูมิลดขึ้น เมื่อความสูงจากระดับน้ำทะเลเพิ่มขึ้น

ถ้าค่า Correlation Coefficient เข้าใกล้ 1 หมายความว่าข้อมูลทั้งสองชุดมีทิศทางเดียวกัน กล่าวคือ ข้อมูลชุดแรกเพิ่มขึ้น ข้อมูลชุดสองเพิ่มขึ้น เช่น ราคาที่ดินกับขนาดที่ดิน

Write a comment