Minitab มีเครื่องมือทางสถิติอยู่หลายตัวที่ถูกนำมาใช้งานไม่บ่อยนัก และในบรรดาเครื่องมือเหล่านั้นเครื่องมือที่เกี่ยวกับพหุตัวแปร (multivariate) Minitab มีเครื่องมือเกี่ยวกับการวิเคราะห์พหุตัวแปรอยู่หลายอย่าง เช่น การวิเคราะห์องค์ประกอบหลัก (principal component analysis) การวิเคราะห์องค์ประกอบ (Factor analysis) การจำแนกกลุ่มด้วยวิธี Cluster และอื่นๆ ในบทความนี้ผมต้องการให้คุณได้เห็นภาพของเครื่องมือเกี่ยวกับการวิเคราะห์ พหุตัวแปรที่เรียกว่าการจำแนกกลุ่มด้วยเทคนิค Discriminant และวิธีการใช้เครื่องมือนี้
การจำแนกกลุ่มด้วยเทคนิค Discriminant จะนำมาใช้เพื่อแบ่งกลุ่มข้อมูลออกเป็น 2 กลุ่มหรือมากกว่านั้น ถ้าคุณมีสิ่งตัวอย่างที่ถูกจำแนกกลุ่มไว้แล้ว โดยพื้นฐานการแยกแยะกลุ่มสามารถจัดการได้ง่าย เมื่อกลุ่มต่างๆถูกจัดแยกไว้แล้วข้อมูลใหม่ที่ได้มาจะถูกจัดลงในกลุ่มต่างๆ ตามคุณสมบัติที่กำหนดไว้ การจำแนกกลุ่มด้วยเทคนิค Discriminant
จะถูกนำมาใช้เพื่อวิเคราะห์ว่าข้อมูลนั้นควรจัดลงในกลุ่มใด
เครื่องมือนี้จะเป็นประโยชน์ต่องานการคัดแยกชาติพันธุ์ (Species) อย่างมาก เราจะใช้ตัวอย่างนี้ในการอธิบายการทำงานของเครื่องมือ และถ้าคุณต้องการที่จะทำตามตัวอย่างในบทความนี้และคุณยังไม่มี Minitab คุณสามารถดาวน์โหลด free ใช้ได้ 30 วันที่ http://www.minitab.com/products/minitab/free-trial/
การทำงานของการจำแนกกลุ่มด้วยเทคนิค Discriminant
ผมมีข้อมูลหนึ่งชุดเกี่ยวกับสุนัขป่าพันธุ์ Rocky Mountain และ Arctic เรารู้แล้วว่าข้อมูลที่เราเก็บมานั้นเป็นของพันธุ์ไหน เป้าหมายของการวิเคราะห์ครั้งนี้คือข้อมูลที่เรามีนั้นเป็นตัวแบ่งแยกกลุ่ม อย่างไร และนำสิ่งที่ได้(สมการ)มาใช้ในการแยกข้อมูลว่าจะเป็นกลุ่มใด
ใน Minitab เราเริ่มจากการสร้าง worksheet แบบทั่วไป โดยให้คอลัมน์เป็นพันธุ์ของสุนัขป่า และอีก 9 คอลัมน์เป็นค่าวัดของแต่ละข้อมูล
เมื่อ Worksheet ของเรามีค่าทำนายที่เป็นตัวแปรต่อเนื่องและตัวจำแนกกลุ่มที่อยู่ในแต่ละ คอลัมน์ครบ เราจะเริ่มที่ Stat>Multivariate>Discriminant Analysis จากนั้นทำการกรอกข้อมูลในไดอะลอก
ในช่อง ‘Group’ เราจะใส่ชื่อคอลัมน์ ที่มีข้อมูลที่เป็นตัวบ่งบอกกลุ่มของข้อมูล ในกรณีตัวอย่างนี้คือ ‘Location’ ซึ่งเป็นค่าบอกพันธุ์ของสุนัขป่า ส่วนตัวแปรทำนายอยู่ที่ X1-X9 ซึ่งเป็นค่าวัดต่างๆของสุนัขป่าแต่ละตัว ซึ่งมีทั้งหมด 9 หมวดหมู่ ซึ่งเราจะใช้เป็นคุณสมบัติในการจำแนกเพื่อแยกว่าเป็นกลุ่มใด
หมายเหตุก่อนที่เราจะให้โปรแกรมเริ่มวิเคราะห์ เราจะเริ่มจากการใช้ฟังก์ชั่นเส้นตรง (Linear Discrimination Function) ก่อน โดยมีสมมติฐานว่า Covariance Matrix นั้นมีความเท่ากันในทุกกลุ่ม ซึ่งการพิสูจน์ตรงนี้ใช้วิธี Bartlett’s Test (ซึ่งมีให้ใน Minitab เช่นกัน) และเมื่อกรอกข้อมูลในไดอะลอกเสร็จเลือก ‘OK’ เพื่อให้โปรแกรมแสดงผลลัพธ์
การใช้ Linear Discriminant Function ในการจำแนกกลุ่มให้กับข้อมูลตัวใหม่
เราจะได้ส่วนที่สำคัญที่สุดของการวิเคราะห์ คือ สมการเชิงเส้นเพื่อการจำแนกกลุ่ม (Linear Discriminant Function) จากตัวอย่างของเราจะมีหน้าตาแบบนี้
สมการนี้จะใช้เพื่อจำแนกข้อมูลใหม่ว่าควรจะอยู่กลุ่มใด การใช้สมการนี้คือนำสัมประสิทธิ์ที่อยู่ในแต่ละกลุ่มเพื่อจำแนกข้อมูลว่าควร จะอยู่กลุ่มไหน ใน Minitab ยังมีตัวเลือก “options” ใน subdialog ตัวอย่างเช่น ถ้าเรามีข้อมูลที่มีค่าแน่นอนแต่ละค่าวัด (X1,….,X9) และถ้าเราทำการประมวลผลอีกครั้ง ผลลัพธ์ที่เราจะได้จะเป็นเช่นนี้
ซึ่งผลลัพธ์นี้เราจะได้ค่าความน่าจะเป็นของข้อมูลตัวใหม่ว่าควรจะอยู่ใน กลุ่มใด 2 กลุ่มที่เรามีตามตัวอย่าง ซึ่งจากผลลัพธ์จะเห็นว่าความน่าจะเป็นที่อยู่ในกลุ่ม AR คือ 1 ซึ่งหมายความว่าข้อมูลใหม่ของเราอยู่ในกลุ่ม AR แต่บางครั้งในการวิเคราะห์อาจให้ผลลัพธ์ค่าความน่าจะเป็นนั้นมีความใกล้ เคียงกันมาก นั้นหมายความว่าทำให้เราไม่สามารถจำแนกได้อย่างชัดเจน
ผมหวังว่าคุณจะได้แนวคิดการใช้งานการจำแนกกลุ่มด้วยเทคนิค Discriminant ด้วย Minitab เพื่อทำการตัดสินใจในงานของคุณได้มากขึ้น
บทความต้นฉบับ : http://blog.minitab.com/blog/starting-out-with-statistical-software/an-overview-of-discriminant-analysis
เนื้อหาบทความโดยบริษัท Minitab Inc. ประเทศสหรัฐอเมริกา
แปลและเรียบเรียงโดยสุวดี นําพาเจริญ และ ชลทิขา จํารัสพร, บริษัท โซลูชั่น เซ็นเตอร์ จํากัด webadmin@solutioncenterminitab.com
บทความนี้เกิดจากการเขียนและส่งขึ้นมาสู่ระบบแบบอัตโนมัติ สมาคมฯไม่รับผิดชอบต่อบทความหรือข้อความใดๆ ทั้งสิ้น เพราะไม่สามารถระบุได้ว่าเป็นความจริงหรือไม่ ผู้อ่านจึงควรใช้วิจารณญาณในการกลั่นกรอง และหากท่านพบเห็นข้อความใดที่ขัดต่อกฎหมายและศีลธรรม หรือทำให้เกิดความเสียหาย หรือละเมิดสิทธิใดๆ กรุณาแจ้งมาที่ ht.ro.apt@ecivres-bew เพื่อทีมงานจะได้ดำเนินการลบออกจากระบบในทันที