สมมติว่ามีการเก็บข้อมูลของรอบเวลา (cycle time) รายได้ (revenue) มิติขนาดของชิ้นงาน (dimension) หรือตัวชี้วัด (metric) บางค่าที่มีความสำคัญกับคุณ แล้วคุณต้องการรู้ว่าตัวแปรใดที่มีความสัมพันธ์กับค่าเหล่านี้ แล้วควรทำอย่างไรต่อไป
เมื่อตอนที่ผมเรียนจบมาด้วยปริญญาที่เกี่ยวกับทางสถิติ ซึ่งในตอนเรียนนั้นได้มีการลงเรียนหลากหลายในวิชาสถิติ เช่น ตัวแบบการถดถอยเชิงเส้น (Linear regression) ANOVA หรือ ตัวแบบถดถอยลอจิสติกส์ (Logistic regression)
แต่ไม่มีวิชาไหนเลยที่รวมเอาหัวข้อเหล่านี้มาอธิบายในเรื่องเดียวกัน และระบุว่าเครื่องมือไหนที่เราควรเลือกใช้ เมื่ออยู่ในสถานการณ์อะไร เมื่อผมมีข้อมูลทั้ง Y และ X's และต้องการที่จะอธิบายความสัมพันธ์ระหว่างสองตัวแปรนี้ จะต้องทำอย่างไร
ซึ่งผมต้องการใครสักคนที่จะมาอธิบายว่า ในการวิเคราะห์ด้วย regression หรือ ANOVA นั้นเหมาะสมกับข้อมูลแบบใด ดังนั้นเรามาเริ่มต้นกันที่ การเลือกเครื่องมือที่เหมาะสมกับค่า Y ที่เป็นข้อมูลแบบต่อเนื่อง (ค่าวัด)
เมื่อค่า Y และ X(s) เป็นข้อมูลต่อเนื่อง (ค่าวัด)
ตัวอย่างเช่น
Y: น้ำหนักของผู้ใหญ่เพศชาย
X’s: อายุ ความสูง จำนวนนาทีที่ออกกำลังกายในหนึ่งสัปดาห์
เครื่องมือใดที่เลือกใช้ ถ้าคำตอบคือ Regression
ใน Minitab จะสามารถใช้ได้ด้วยการเลือก Stat > Regression > Regression > Fit Regression Model
กรณีที่ ค่า Y เป็นค่าต่อเนื่อง (ค่าวัด)และ X(s) เป็นข้อมูลประเภทหรือหมวดหมู่ (Categorical)
ตัวอย่างเช่น
Y: คะแนนจากเกม Mario Kart Wii
X’s: การใช้ตัวควบคุมของ Wii (แบบ พวงมาลัยบังคับ (racing wheel) หรือ แบบมาตรฐาน) ท่าที่ใช้ขณะเล่น (ยืน หรือ นั่ง) ตัวละครที่ใช้ในการเล่นเกม (Mario, Luigi, Yoshi, Bowser, Peach)
เครื่องมือใดที่เลือกใช้ ถ้าคำตอบคือ ANOVA
ใน Minitab จะสามารถใช้ได้ด้วยการเลือก Stat > ANOVA > General Linear Model > Fit General Linear Model
กรณีที่ ค่า Y เป็นค่าต่อเนื่อง (ค่าวัด)และ X(s) เป็นข้อมูลประเภทหรือหมวดหมู่ (Categorical) และ ค่าต่อเนื่อง (ค่าวัด)
ตัวอย่างเช่น
Y: จำนวนชั่วโมงที่นอนในแต่ละคืน
X’s: อายุ กิจกรรมที่ทำก่อนเข้านอน (ไม่ได้ทำอะไรเลย อ่านหนังสือ ดูโทรทัศน์ เล่นอินเตอร์เนท) มีเด็กเล็กอยู่ด้วยหรือไม่... “ฝันร้าย” “หิวน้ำ” “มีปีศาจอยู่ใต้เตียง” (เป็นกรณีจากเด็กๆที่มักจะโวยวายกับผู้ใหญ่ในระหว่างคืน)
เครื่องมือใดที่เลือกใช้ ถ้าคำตอบคือ ANOVA หรือ Regression
ใน Minitab จะสามารถใช้ได้ด้วยการเลือก Stat > ANOVA > General Linear Model > Fit General Linear Model หรือ Stat > Regression > Regression > Fit Regression Model
ส่วนตัวแล้วผมจะเลือกใช้ GLM เพราะว่าสามารถทำการเปรียบเทียบเชิงซ้อนได้ (multiple comparisons) ซึ่งมีประโยชน์มากกับกรณีที่เจอกับข้อมูล X ที่เป็นแบบประเภทหรือหมวดหมู่ ตั้งแต่ 2 ระดับขึ้นไปและมีนัยสำคัญ ตัวอย่างเช่น กิจกรรมที่ทำก่อนเข้านอนมีนัยสำคัญ การเปรียบเทียบจะบอกได้ว่าระหว่าง 4 กิจกรรม – ไม่ได้ทำอะไรเลย อ่านหนังสือ ดูโทรทัศน์ และ เล่นอินเตอร์เนท – มีนัยสำคัญ และแตกต่างกันอย่างไร
คนที่ดูโทรทัศน์ มีจำนวนชั่วโมงในการนอนคล้ายคลึงกับคนที่เล่นอินเตอร์เนท แต่น้อยกว่าคนที่ไม่ได้ทำอะไร และ คนที่อ่านหนังสือ หรือ คนที่เล่นอินเตอร์เนทจะมีผลแตกต่างอย่างมีนัยสำคัญ จากอีกสามกิจกรรมที่เหลือ ซึ่งการวิเคราะห์แบบเปรียบเทียบจะทำให้รู้ถึงความแตกต่างนี้ได้
ข้อมูล Y ที่เป็นแบบประเภทหรือหมวดหมู่ (Categorical)
กรณีที่ Y เป็นข้อมูลนับ แบบประเภทหรือหมวดหมู่ คุณควรใช้เครื่องมือในการวิเคราะห์คือ ตัวแบบถดถอยแบบลอจิสติกส์ (logistic regression) สำหรับข้อมูล X’s ที่อาจเป็นได้ทั้งข้อมูลวัดและข้อมูลนับ ซึ่งตัวแบบถดถอยแบบลอจิสติกส์
มีทั้งหมด 3 แบบให้เลือกใช้ได้ คือ
Binary: ค่า Y มี 2 ระดับ เช่น ใช่/ไม่ใช่ หรือ ผ่าน/ไม่ผ่าน (yes/no, pass/fail)
Ordinal: ค่า Y มีมากกว่า 2 ระดับ และมีลักษณะเป็นการเรียงลำดับขั้น เช่น ต่ำ กลาง สูง (low/medium/high)
Nominal: ค่า Y มีมากกว่า 2 ระดับและไม่มีลักษณะการเรียงลำดับ เช่น ประเภทรถ sedan/SUV/minivan/บรรทุก
ดังนั้นในครั้งต่อไปที่คุณมีข้อมูล X’s และ Y อยู่ แล้วคุณต้องการศึกษาถึงความสัมพันธ์ของข้อมูลทั้งสองตัวแปรนี้ ให้เลือกเครื่องมือโดยมีเกณฑ์ตามที่สรุปให้ดังนี้
สำหรับขั้นตอนในการใช้เครื่องมือ General Regression, General Linear Model, หรือ Logistic Regression ใน Minitab นั้นสามารถหาได้เพิ่มเติมจากการเลือก Help จากตัวเลือกด้านล่างซ้ายของกล่องข้อความ ซึ่งจะแสดงตัวอย่างการใช้งานที่อยู่ในหน้าจอด้านบนของหน้าต่าง Help หรือ สามารถติดต่อฝ่ายสนับสนุนลูกค้าของ Minitab ด้วยทาง 814-231-2682 หรือ www.minitab.com/contact-us. ซึ่งมีทีมงานที่จะคอยตอบคำถามทางเทคนิคให้กับทุกคนโดยไม่มีค่าใช้จ่ายเพิ่มเติม
บทความต้นฉบับ : https://blog.minitab.com/blog/michelle-paret/regression-versus-anova-which-tool-to-use-when
เนื้อหาบทความโดยบริษัท Minitab Inc. ประเทศสหรัฐอเมริกา
แปลและเรียบเรียงโดยสุวดี นําพาเจริญ และ ชลทิชา จํารัสพร, บริษัท โซลูชั่น เซ็นเตอร์ จํากัด webadmin@solutioncenterminitab.com
บทความนี้เกิดจากการเขียนและส่งขึ้นมาสู่ระบบแบบอัตโนมัติ สมาคมฯไม่รับผิดชอบต่อบทความหรือข้อความใดๆ ทั้งสิ้น เพราะไม่สามารถระบุได้ว่าเป็นความจริงหรือไม่ ผู้อ่านจึงควรใช้วิจารณญาณในการกลั่นกรอง และหากท่านพบเห็นข้อความใดที่ขัดต่อกฎหมายและศีลธรรม หรือทำให้เกิดความเสียหาย หรือละเมิดสิทธิใดๆ กรุณาแจ้งมาที่ ht.ro.apt@ecivres-bew เพื่อทีมงานจะได้ดำเนินการลบออกจากระบบในทันที