สำหรับตอนที่ 4 นี้นะครับ เราจะมาต่อกับการวัดค่าทางสถิติเบื้องต้นของข้อมูล
4. Coefficient of Variation (COV) คือ ค่าสัมประสิทธิ์ของความแปรผัน จะไม่มีหน่วย ใช้ในกรณีที่ต้องการเปรียบเทียบการกระจายตัวของข้อมูลกับข้อมูลชุดอื่น
โดย COV มีสูตรว่า
ทีนี้มาลองดูตัวอย่างกันนะครับว่า COV สามารถใช้ทำอะไรได้บ้าง
ดังนั้นค่า STD ของหน่วยเงินไทยจะสูงกว่ามหาศาลที่ 689.85 และค่า STD ของเงินออสเตรเลียจะอยู่ที่ 33.65 ซึ่งถ้าเราวัด STD ธรรมดา เราก็สรุปได้เลยว่าค่า STD เงินออสเตรเลียต่ำกว่าไทยอยู่มากโข แต่จริงๆแล้วมันเป็นอัตราเปรียบเทียบกัน ดังนั้นเราจะหาค่าเฉลี่ยของข้อมูลทั้งสองชุด ซึ่งได้ 18.125 และ 371.5625 ตามลำดับ และเข้าสูตร COV
ซึ่งเราจะได้ 33.65/18.125 = 1.856 และ 689.85/371.56 = 1.856 ซึ่ง COV จะบอกว่าข้อมูลชุดนั้นมี STD เท่ากับเท่าไหร่เมื่อเทียบกับค่าเฉลี่ยของตัวเอง ในที่นี้ได้ค่าเท่ากันเนื่องจากมันเป็นอัตราส่วนซึ่งกันแหละกัน
5. Covariance หรือ ค่าความแปรปรวนร่วม คือ ค่าที่หาความแปรปรวนของข้อมูลสองชุด
หากเมื่อพิจารณาข้อมูล ขนาดที่ดินและราคาที่ดิน จะเห็นว่าทั้งสองข้อมูลไปทิศทางเดียวกัน
ดังนั้นเราจะได้ค่า Covariance จะมีค่าสูงมาก ซึ่งถ้าค่าของข้อมูลทั้งสองชุดสวนทางกัน ค่า Covariance ก็จะติดลบ แต่ปัญหาคือ Covariance มีค่ามากหรือน้อยเกินไป (เมื่อยูนิตที่พิจารณาต่างกัน) ดังนั้นเราจึงมีการวัดอีกอย่างหนึ่งที่มาแก้ปัญหาจุดนี้
6. Correlation Coefficient หรือ ค่าสัมประสิทธิ์สหสัมพันธ์หรือค่า Covariance ที่ทำ Normalized แล้ว
ดังนั้นค่า Correlation Coefficient จะมีค่าอยู่ระหว่าง [-1,1] เพื่อการเปรียบเทียบกับข้อมูลคนละประเภทกันได้ง่ายยิ่งขึ้น
โดย ถ้าค่า Correlation Coefficient เข้าใกล้ -1 หมายความว่าข้อมูลทั้งสองชุดมีทิศทางตรงกันข้าม กล่าวคือ ข้อมูลชุดแรกเพิ่มขึ้น ข้อมูลชุดสองลดลง เช่น อุณหภูมิลดขึ้น เมื่อความสูงจากระดับน้ำทะเลเพิ่มขึ้น
ถ้าค่า Correlation Coefficient เข้าใกล้ 1 หมายความว่าข้อมูลทั้งสองชุดมีทิศทางเดียวกัน กล่าวคือ ข้อมูลชุดแรกเพิ่มขึ้น ข้อมูลชุดสองเพิ่มขึ้น เช่น ราคาที่ดินกับขนาดที่ดิน