ตอนนี้อาจมีประโยชน์ที่มีค่ารออยู่ในข้อมูลของคุณซึ่งเก็บไว้ในระบบตอนนี้ ข้อมูลเหล่านี้อาจจะถูกนำมาใช้ในวัตถุประสงค์ต่างๆกัน ข้อมูลที่ดีย่อมทำให้เกิดการตัดสินใจที่ดี ธนาคาร บริษัทประกันภัย และ บริษัทโทรคมนาคม เป็นองค์กรที่มีข้อมูลลูกค้าอยู่เป็นจำนวนมาก ซึ่งเป็นแหล่งที่นำมาใช้การสร้างความสัมพันธ์ของลูกค้ากับองค์กร
แต่บางองค์กรอาจจะมีการใช้ข้อมูลด้านเกษตรกรรมเพื่อสร้างตัวแบบที่ซับซ้อนให้เหมาะกับความต้องการของตนเอง โดยการใช้ปัจจัยตั้งต้น (Input variables) ที่มีอยู่จำนวนมาก (เช่น ลักษณะดิน สภาพอากาศ ชนิดของพืช ฯลฯ) เพื่อปรับปรุงผลผลิตที่จะได้ บริษัทสายการบิน หรือ บริษัทกลุ่มโรงแรม อาจจะใช้ตัวแบบการตั้งราคาแบบพลวัต (Dynamic Pricing model) เพื่อปรับปรุงผลในการจัดการ ข้อมูลจึงมีบทบาทอย่างมากในศตวรรษที่ 21 เปรียบเหมือน เหมืองทองคำ นั่นเอง มีปัจจัยอยู่หลายอย่างที่ทำให้ข้อมูลมีความสำคัญมากขึ้น (รวมถึง การวิเคราะห์ข้อมูลด้วย)
ข้อมูลที่มีปริมาณมหาศาล
การเก็บข้อมูลไม่เคยเป็นเรื่องง่าย (เซนเซอร์ในโรงงานผลิต, เซนเซอร์ที่เชื่อมต่อกับวัตถุ ข้อมูลที่ใช้บนอินเตอร์เนทและการเชื่อมต่อเวบไซต์ ข้อมูลจากบัตรเครดิต ข้อมูลของลูกค้าในองค์กรเพื่อการจัดการความสัมพันธ์ลูกค้า ภาพถ่ายดาวเทียม ฯลฯ) และสามารถจัดเก็บได้ด้วยต้นทุนที่ลดลงกว่าเมื่อก่อนมาก (ความจุของคลังข้อมูลขนาดใหญ่สามารถหาได้จาก Cloud หรือแหล่งอื่นๆ) จำนวนข้อมูลที่ถูกจัดเก็บจึงไม่ใช่เพียงขนาดมหาศาลแต่ยังเกิดขึ้นและเพิ่มจำนวนอย่างรวดเร็ว
ความรวดเร็วที่คาดไม่ถึง (Unprecedented Velocity)
เครื่องมือ/อุปกรณ์ที่เชื่อมต่อ เช่น สมาร์ตโฟน ที่เป็นแหล่งข้อมูลให้เราแบบทันท่วงทีและสามารถทำงานได้อย่างรวดเร็ว รวมทั้งยังสามารถตอบสนองต่อการเปลี่ยนแปลงได้ทันที
ความหลากหลายที่มีมากมาย (Incredible variety)
ข้อมูลที่เก็บมาอาจไม่สามารถจะทำให้เปลี่ยนเป็นสาระข้อมูล (information)ได้เสมอไป แหล่งข้อมูลทุกอย่างล้วนแต่มีคุณค่ากับธุรกิจ ไม่เฉพาะข้อมูลตัวเลขเท่านั้นแต่ยังรวมถึงข้อมูลประเภทวิดีโอ รูปภาพ และอื่นๆ ขึ้นกับรูปแบบสถานการณ์ต่างๆ
เพราะเรามีข้อมูลจำนวนมากที่สามารถนำมาใช้กับธุรกิจเพื่อให้สามารถแก้ปัญหาที่ซับซ้อนได้
เราจะสามารถสร้างคุณค่าจากทรัพยากรที่มีได้อย่างไร (How can we create value from these resources?)
วิธีการที่พื้นฐานง่ายๆ เช่น การนับคำใน queries ของเวบไซต์ของบริษัท ซึ่งสามารถนำมาดูการเปลี่ยนแปลงต่างๆและทิศทางของลูกค้า ค่าความสัมพันธ์ทางสถิติ หรือ ค่าทางสถิติต่างๆ ได้ถูกนำมาใช้โดยผู้ส่งมอบเพื่อดูว่าลูกค้ามีการซื้อผลิตภัณฑ์ใดๆบ้างบนเวบไซต์
ลองมาเดาดูว่าตัวแบบสมการถดถอย (regression) หรือ เทคนิคการวิเคราะห์หลายตัวแปร (multivariate) ซึ่งสามารถใช้งานกับ Minitab ได้ง่ายๆ นั้นจะนำมาใช้ในการทำงานอะไรได้บ้าง
ตัวอย่างประโยชน์ที่ได้จากการวิเคราะห์ข้อมูลจำนวนมาก (A simple example of the benefits of analyzing an enormous database)
ลองมาดูตัวอย่างหนึ่งของบริษัทที่มีการใช้วิเคราะห์ข้อมูลขนาดใหญ่เพื่อมาทำให้เกิดประโยชน์ มีขั้นตอนหลายอย่างๆที่จะต้องทำเสียก่อนที่จะนำเครื่องบินออกปฏิบัติงานได้ (เช่น การตรวจสอบความปลอดภัย การทำความสะอาดห้องผู้โดยสาร ฯลฯ) เนื่องจากความล่าช้าจะส่งผลกระทบต่อความพึงพอใจของลูกค้า และผลิตภาพ (productivity)
บริษัทสายการบินจึงมีการเก็บข้อมูลประจำวันเกี่ยวกับความล่าช้าของเที่ยวบินและเวลาในการทำงานก่อนจะนำเครื่องออกปฏิบัติงาน
ซึ่งข้อมูลจำนวนมากที่เก็บอาจจะมาจากการเก็บอัตโนมัติหรือด้วยการรวบรวมโดยคน
บริษัทฯ ตั้งใจจะนำข้อมูลที่ได้นั้นมาวางแผนขั้นตอนการทำงานเพื่อการตรวจจับความล่าชั้นที่อาจจะเกิดขึ้น โดยบริษัทมีการใช้ Minitab ในการทำ stepwise regression analysis เพื่อดูว่าปัจจัยใดบ้างที่จะมีบทบาทหลัก หลายๆปัจจัยแสดงผลว่ามีนัยสำคัญทางสถิติแต่ที่เห็นได้อย่างชัดเจนมีอยู่สองปัจจัยคือ X6 และ X10
เมื่อต้องใช้ฐานข้อมูลจำนวนมากในการวิเคราะห์เชิงสถิติ อาจจะทำให้การตรวจจับความแตกต่างนั้นมีไว (sensitive) มากเกิน (เนื่องมาจากจำนวนสิ่งตัวอย่างขนาดใหญ่ และ อำนาจในการทดสอบ(power of the analysis) ที่มีค่าสูง) ค่า P-Value มักจะมีค่าน้อย (p<0.05) สำหรับกรณีที่มีตัวทำนาย (predictor) หลายค่า
อย่างไรก็ตาม Minitab ได้มีการสร้างผลของการวิเคราะห์การถดถอยไว้ ซึ่งเมื่อคุณเลือกในกล่องของ Regression dialogue และเลือก Expanded tables จะมีการแสดงส่วน contributions ของปัจจัยนั้นๆให้เห็นผลลัพธ์ด้วย
X6 และ X10 เมื่อพิจารณาร่วมกันจะได้ contribution 80% ของความผันแปรทั้งหมด (ด้วยค่า F มาก) นั่นหมายความว่าตัวแปรที่เหลือให้ contribution เปรียบเทียบนั้นน้อยมาก จากนั้นบริษัทได้มีการวิเคราะห์เศษเหลือ (residual analysis) เพื่อทำการทวนสอบตัวแบบอีกหนึ่งครั้ง (cross-validate)
Minitab ยังมีการวิเคราะห์เพิ่มเติมอีกเรียกว่า การวิเคราะห์องค์ประกอบหลัก (Principal Component Analysis , PCA, a multivariate technique) เพื่อดูความสัมพันธ์ระหว่างตัวแปรทำนายที่สำคัญกับตัวแปรตอบสนอง (response) ซึ่งผลที่คาดไว้คือต้องมีความสัมพันธ์กันอย่างมาก
จากกราฟด้านบนนี้แสดง Loading plot จากการวิเคราะห์องค์ประกอบหลัก เส้นที่มีทิศทางเดียวกันและอยู่ใกล้กันแสดงว่าตัวแปรเหล่านั้นอยู่ในกลุ่มเดียวกัน การจับกลุ่มตัวแปรจะดูจากเส้นที่แสดงบนกราฟรวมถึงการดูค่าความสัมพันธ์ทางสถิติเพื่อดูว่าตัวแปรเหล่านั้นมีความสัมพันธ์ใกล้ชิดกันอย่างไร
มีตัวแปร 9 ตัวที่แสดงความสัมพันธ์ชัดเจนในกลุ่มเดียวกัน และตัวแปรสำคัญ 2 ตัวคือ X6 และ X10 มีความสัมพันธ์ชัดเจนกับค่าเวลาความล่าช้า (Y) ความล่าช้าของขั้นตอน X6 มีผลกระทบไปยังขั้นตอน X7 และ X8 (ที่เป็นการทำงานขั้นตอนย่อยต่อจาก X6) และความล่าช้าของขั้นตอน X10 มีผลกระทบยังขั้นตอนย่อยของ X11 และ X12
บทสรุป
การวิเคราะห์นี้ให้ผลลัพธ์เป็นขั้นตอนการทำงานอย่างง่ายกับลูกเรือเพื่อหลีกเลี่ยงปัญหาความล่าช้าที่จะเกิดขึ้น เพื่อทำให้ผู้โดยสารของเที่ยวบินถัดไปมีความพึงพอใจ
บริษัทฯสามารถทำการวิเคราะห์ซ้ำตามช่วงเวลาเพื่อค้นหาสาเหตุที่สำคัญที่ทำให้เกิดความล่าช้า จากแนวความคิดนี้ทำให้องค์กรได้วิธีการตัดสินใจแบบใหม่ที่ใช้สาระจากข้อมูลที่ได้มาแทนแบบวิธีเก่า
การใช้ประโยชน์จากข้อมูลเพื่อสิ่งที่ดีขึ้นไม่จำกัดอยู่ในการทำงานขององค์กรแต่อาจจะหมายถึงการบริหารในส่วนรัฐบาลที่มีฐานข้อมูลจำนวนมากและเป็นแบบเปิดที่สามารถเข้าถึงข้อมูลของทุกคนได้อย่างสะดวก
บทความต้นฉบับ : http://blog.minitab.com/blog/applying-statistics-in-quality-projects/creating-value-from-your-data
เนื้อหาบทความโดยบริษัท Minitab Inc. ประเทศสหรัฐอเมริกา
แปลและเรียบเรียงโดยสุวดี นําพาเจริญ และ ชลทิขา จํารัสพร, บริษัท โซลูชั่น เซ็นเตอร์ จํากัด webadmin@solutioncenterminitab.com
บทความนี้เกิดจากการเขียนและส่งขึ้นมาสู่ระบบแบบอัตโนมัติ สมาคมฯไม่รับผิดชอบต่อบทความหรือข้อความใดๆ ทั้งสิ้น เพราะไม่สามารถระบุได้ว่าเป็นความจริงหรือไม่ ผู้อ่านจึงควรใช้วิจารณญาณในการกลั่นกรอง และหากท่านพบเห็นข้อความใดที่ขัดต่อกฎหมายและศีลธรรม หรือทำให้เกิดความเสียหาย หรือละเมิดสิทธิใดๆ กรุณาแจ้งมาที่ ht.ro.apt@ecivres-bew เพื่อทีมงานจะได้ดำเนินการลบออกจากระบบในทันที