ความเบี่ยงเบน

ในชีวิตประจำวันเราใช้สถิติโดยที่เราไม่รู้ตัวอยู่มากมาย เช่น สงกรานต์ปีนี้มีคนขึ้นไปเที่ยวเชียงใหม่กันมาก ส่วนใหญ่มาจากกรุงเทพมหานคร ความหมายในที่นี้คือ กลุ่มคนที่มาเที่ยวเชียงใหม่มีกระจัดกระจายจากที่ต่าง ๆ แต่กลุ่มคนที่มามากที่สุดคือ มาจากกรุงเทพมหนคร

คราวนี้ถ้าดูกันในแง่ของสถิติ เราต้องการดูความแปรปรวนของข้อมูล เช่น เรามีข้อมูลอยู่สองชุด คือ

ข้อมูลชุดที่ 1    10, 12, 14
ข้อมูลชุดที่ 2    30, 5, 1

ข้อมูลทั้งสองชุดนี้ให้ค่าเฉลี่ยเท่ากันคือ 12 แต่หากพิจารณาที่พิสัย (range) จะพบว่า ขอบเขตของข้อมูลชุดที่สองมีการกระจายตัวกว้างกว่า คือ จาก 1 ถึง 30 เราจะเห็นว่า ชุดที่ 1 มีการรวมกลุ่มกัน กระจายตัวน้อยกว่า ทางสถิติเราคำนวณค่าความเบี่ยงเบนนี้ และเรียกว่า วาเรียนซ์ (varience)

ใช้สัญลักษณ์ 
(อ่านว่าซิกมา ยกกำลังสอง)
ใช้สัญลักษณ์ s2 ใช้สัญลักษณ์  และ s
แทนวาเรียนซ์ของประชากร แทนวาเรียนซ์ของประชากร แทนส่วนเบี่ยงเบนมาตรฐานของประชากร แทนส่วนเบี่ยงเบนมาตรฐานของตัวแทน

  วาเรียนซ์ คือ ผลบวกของกำลังสองของความแตกต่างระหว่างแต่ละค่า กับค่าเฉลี่ย หารด้วยจำนวนซึ่งน้อยกว่าจำนวนค่าทั้งหมดหนึ่ง

ดังนั้น ถ้าประชากรมี x1, x2, . . ., xn และมี เป็นค่าเฉลี่ย วาเรียนซ์ที่ได้
=
=

สำหรับวาเรียนซ์ของตัวแทน หาได้จาก  s =
การหาค่าเฉลี่ยและวาเรียนซ์ทำให้เข้าใจลักษณะของข้อมูลการกระจายตัวของข้อมูล เช่น

ชุดข้อมูล A มีข้อมูล 0 48 49 51 52 100
ชุดข้อมูล B มีข้อมูล 47 48 49 51 52 53
ทั้งสองข้อมูลมีค่าเฉลี่ย เท่ากับ 50 เท่ากัน แต่พิสัยต่างกัน ความแปรปรวนของข้อมูลพิจารณาได้จากวาเรียนซ์

ข้อมูลชุด A ข้อมูลชุด B

ข้อมูล
0 -50 2500
48 -2 4
49 -1 1
51 1 1
52 2 4
100 50 2500
ผลรวม 5010

ข้อมูล
47 -3 9
48 -2 4
49 -1 1
51 1 1
52 2 4
53 3 9
ผลรวม 28

เมื่อนำมาหารด้วย s = 1002
วาเรียนซ์ของข้อมูลชุด A มีค่าเท่ากับ 1002
วาเรียนซ์ ของข้อมูลชุด A มีค่าเท่ากับ 28/5 ได้ 5.6

เห็นได้ชัดว่าข้อมูลสองชุดมีจำนวนข้อมูลเท่ากัน มีค่าเฉลี่ยเท่ากัน แต่การเปรียบเทียบข้อมูลยังมีความแตกต่างกัน ในเรื่องความปรวนแปร ข้อมูลชุด A มีความปรวนแปร หรือ มีวาเรียนซ์สูงกว่า ข้อมูลชุด B

การใช้งานในชีวิตประจำวันอาจพบเห็นได้ เช่น เมื่อต้องการลงทุนในการซื้อหุ้นกิจการบริษัทในตลาดหลักทรัพย์ โดยพิจารณาจากบริษัทสามบริษัท คือ บริษัทรุ่งเรือง บริษัทค้าดี และบริษัทกิจการดี ข้อมูลที่เก็บย้อนหลังสิบปี โดยข้อมูลทั้งสิบปีประกอบด้วยข้อมูล การปันผล เมื่อนำเอาข้อมูลปันผลทั้งสิบปีมาคิดหาค่าสำคัญทางสถิติ ได้ผล ดังนี้

 
บริษัท ค่าเฉลี่ยการปันผล % ความเบี่ยงเบนมาตรฐาน %
บริษัทรุ่งเจริญ
บริษัทค้าดี
บริษัทกิจการดี
8
5
5
5
2
1

คำถามมีอยู่ว่า เราจะเลือกลงทุนในกิจการบริษัทใดดี เพราะถ้าได้ปันผลเฉลี่ยสูง แต่มีความแปรปรวนสูง บางปีอาจได้ต่ำ บางปีอาจได้สูง หรือมีความเสี่ยงมาก

เพื่อให้มีเงื่อนไขการตัดสินใจได้ง่ายขึ้น เรามีการวัด ค่าด้วยสัมประสิทธิ์ของความผันแปร (Coefficient of variation) ซึ่งค่านี้เป็นค่าส่วนความเบี่ยงเบนมาตรฐานคิดเป็นเปอร์เซนต์ของค่าเฉลี่ย
cv = * 100

ดังนั้น จากข้อมูลที่ได้มาจะเห็นว่าทั้งสามบริษัทมีค่า cv แตกต่างกัน

cv ของบริษัทรุ่งเจริญ (5/8) * 100 = 62.5 %
cv ของบริษัทค้าดี (2/5) * 100 = 40 %
cv ของบริษัทกิจการดี (1/5) * 100 = 20 %

ข้อมูลนี้เป็นข้อมูลช่วยในการตัดสินใจ ถ้าเราต้องการความเสี่ยง โดยอาจได้ปันผลสูงในบางปี ก็ต้องเลือกบริษัทรุ่งเจริญ แต่ถ้าต้องการความแน่นอนก็ต้องเลือกบริษัทกิจการดี


ที่มา: รศ. ยืน ภู่วรวรรณ, สำนักบริการคอมพิวเตอร์ มหาวิทยาลัยเกษตรศาสตร์