Solution Center Minitab

ผู้เขียน : Solution Center Minitab

อัพเดท: 13 ธ.ค. 2018 14.55 น. บทความนี้มีผู้ชม: 9611 ครั้ง

เมื่อคุณใช้ Minitab ในการวิเคราะห์การถดถอย (Regression Analysis) ถ้าเราเริ่มต้นการทำงานกับข้อมูลจำนวนมากและไม่รู้ว่าจะเริ่มต้นที่ตรงไหน ในหลายๆครั้งเรามักจะมุ่งสนใจที่ค่า p-values เพียงอย่างเดียว โดยมองข้ามสิ่งอื่นๆในกระบวนการไป ในบทความนี้จะเป็นการแนะนำค่าสถิติอีกหนึ่งค่าที่ Minitab แสดงให้เห็นในผลการวิเคราะห์ คือ VIF (Variance Inflation Factor)


VIF คืออะไร (What in the World Is a VIF?)

เมื่อคุณใช้ Minitab ในการวิเคราะห์การถดถอย (Regression Analysis) ถ้าเราเริ่มต้นการทำงานกับข้อมูลจำนวนมากและไม่รู้ว่าจะเริ่มต้นที่ตรงไหน  ในหลายๆครั้งเรามักจะมุ่งสนใจที่ค่า p-values เพียงอย่างเดียว โดยมองข้ามสิ่งอื่นๆในกระบวนการไป ในบทความนี้จะเป็นการแนะนำค่าสถิติอีกหนึ่งค่าที่ Minitab แสดงให้เห็นในผลการวิเคราะห์ คือ VIF (Variance Inflation Factor) 

ค่า VIF เป็นค่าที่จะสะท้อนให้เห็นถึงอิทธิพลร่วมของตัวแปรทำนาย (predictor) ในตัวแบบเส้นตรง   ภาวะร่วมของตัวแปรในตัวแบบเส้นตรง (multicollinearity) คือ การอธิบายว่าตัวแปรทำนายที่อยู่ในตัวแบบนั้นมีความสัมพันธ์กันอย่างไร

ค่า VIF เป็นตัววัดที่แสดงให้เห็นว่าถ้าตัวแปรทำนายนั้นมีความสัมพันธ์กันจะทำให้ความแปรปรวนของค่าสัมประสิทธิ์ของตัวแบบการถดถอยจะมีค่าเพิ่มขึ้น ซึ่งเมื่อความแปรปรวนเพิ่มขึ้นนั่นหมายถึงว่าไม่ดี เพราะเราต้องการความแม่นยำในการประมาณค่า และเมื่อความแปรปรวนของเพิ่มขึ้นแปลว่าความน่าเชื่อถือของตัวแบบคงลดลง

มาดูกันว่าค่า VIF คำนวณมาได้อย่างไร

ดูที่ Minitab Help’s regression จากตัวอย่างเพื่อดูว่าค่า VIF คำนวณอย่างไร

ตัวแปรทำนายแต่ละตัวในตัวแบบจะมีค่า VIF จากตัวอย่าง ค่าตัวแปรตอบสนองคือค่าวัด total heat flux ที่มาจากเครื่องสร้างกำลังไฟฟ้าจากพลังงานแสงอาทิตย์ที่ใช้ตามบ้าน โดยมีตัวแปรทำนายคือตำแหน่งจุดโฟกัส(Focal points) ที่แตกต่างกัน 3 ทิศทางคือ ทิศตะวันออก ทิศใต้ และ ทิศเหนือ จากนั้นมีการใช้ Minitab ในการวิเคราะห์การถดถอยเพื่อดูผลลัพธ์ ซึ่งได้ดังนี้

มาดูกันว่าค่า VIF แต่ละตัวคำนวณมาอย่างไร โดยเราจะเริ่มจากตัวแปรทำนายเพื่อดูว่าส่งผลต่อค่าตัวแปรตอบสนองอย่างไรในตัวแบบ  ถ้าเรามีข้อมูลเราจะใช้คำสั่งใน Minitab คือ Stat > Regression > Regression > Fit Regression Model เพื่อวิเคราะห์ผลลัพธ์

ในส่วนช่อง  Response เราจะใส่ค่าตัวแปรทำนายที่ต้องการจะวิเคราะห์ ซึ่งในตัวอย่างนี้เราจะเลือก ทิศใต้(South)  ส่วนช่อง continuous predictors เราจะใส่ตัวแปรทำนายที่เหลือ ซึ่งในที่นี้คือ  ทิศตะวันออก (East) และ ทิศเหนือ (North) จากนั้นให้โปรแกรมทำการคำนวณค่าต่างๆ

ค่าที่สำคัญสำหรับผลลัพธ์ของเรา คือ ค่า R-Sq

จากตัวอย่างนี้ได้ค่า R-sq เท่ากับ 0.1707 ซึ่งค่า R-sq มาจากสมการนี้

จากสมการเราได้ 1/(1-.1707) = 1.21

และรากที่สองของค่า VIF คือ standard error เป็นค่าที่บ่งบอกว่าตัวแปรทำนายนั้นจะไม่มีความสัมพันธ์กับตัวแปรทำนายอื่นๆ ในตัวแบบ

จากตัวอย่า ทิศใต้ มีค่า standard error เท่ากับ  ซึ่งหมายความว่า ตัวแปรทำนายทิศใต้มี standard error เป็น 1.1 เท่าซึ่งเท่ากับว่าตัวแปรทิศใต้นี้ไม่มีความสัมพันธ์ใดใดกับตัวแปรทำนายตัวอื่นๆในตัวแบบ ซึ่งแสดงถึงความไม่มีนัยสำคัญของการเปลี่ยนแปลงในตัวแบบ ค่า VIF ที่ดีจะมีค่าประมาณ 1

คำแนะนำเกี่ยวกับค่า VIF โดยทั่วไปค่าที่ยอมรับทั่วไป คือ ถ้า VIF > 10 หมายความว่ามีสหสัมพันธ์ของตัวแปรทำนายมาก หรือมีภาวะร่วมของตัวแปรในตัวแบบเส้นตรงสูง ในตัวอย่างนี้มีค่าประมาณ 1 ซึ่งถือว่าเป็นเรื่องดีและเราสามารถพิจารณาเรื่องอื่นๆของการวิเคราะห์ถดถอยต่อไปได้


บทความต้นฉบับ

http://blog.minitab.com/blog/starting-out-with-statistical-software/what-in-the-world-is-a-vif


บทความนี้เกิดจากการเขียนและส่งขึ้นมาสู่ระบบแบบอัตโนมัติ สมาคมฯไม่รับผิดชอบต่อบทความหรือข้อความใดๆ ทั้งสิ้น เพราะไม่สามารถระบุได้ว่าเป็นความจริงหรือไม่ ผู้อ่านจึงควรใช้วิจารณญาณในการกลั่นกรอง และหากท่านพบเห็นข้อความใดที่ขัดต่อกฎหมายและศีลธรรม หรือทำให้เกิดความเสียหาย หรือละเมิดสิทธิใดๆ กรุณาแจ้งมาที่ ht.ro.apt@ecivres-bew เพื่อทีมงานจะได้ดำเนินการลบออกจากระบบในทันที