Big Data Analytics หรือที่เรารู้จักกันในรูปแบบ data analytic คือศาสตร์การวิเคราะห์ข้อมูล Big Data เป็นการนำข้อมูลดิบมาวิเคราะห์ มีประโยชน์อย่างมากในเชิงธุรกิจ เพราะทำให้ผู้ประกอบการสามารถนำข้อมูลไปใช้ต่อยอดได้ ทั้งเพื่อกลยุทธ์การตลาด กลยุทธ์การผลิต และการหาผลกำไร โดยจะใช้เครื่องมือต่อไปนี้ในการวิเคราะห์ข้อมูล ได้แก่ data mining, predictive analysis และ machine learning
Big Data คือฐานข้อมูลขนาดใหญ่ที่ยังไม่ได้ทำการวิเคราะห์ใดๆ โดยทั่วไปมักหมายถึงข้อมูลจำนวนมากที่ซับซ้อน แต่บริษัทวิจัย Gartner ที่ปรึกษาทางธุรกิจของทางอเมริกา ได้ให้คำนิยามของ Big Data ไว้ว่า Big Data นั้นมี 3 คุณสมบัติหลักคือ ขนาดใหญ่ (Volume), เปลี่ยนแปลงเร็ว (Velocity) และหลากหลาย (Variety) ซึ่งส่วนมาก Big Data จะถูกใช้ควบคู่ไปกับ อัลกอริทึม (Algorithms)
Data Analytics คือศาสตร์การวิเคราะห์ที่จะนำข้อมูลดิบมาวิเคราะห์เพื่อหาข้อสรุป ซึ่งข้อมูลจะเป็นข้อมูลจากอดีตจนถึงปัจจุบัน เพื่อนำไปต่อยอดตามวัตถุประสงค์ต่างๆ ในอนาคต หากเป็น data analytic ที่เรารู้จักจะเป็น big data analytics หรือก็คือการวิเคราะห์เพื่อวัตถุประสงค์ทางด้านธุรกิจโดยเฉพาะ
หลายท่านอาจจะสงสัยว่าทั้งสองอย่างนี้คืออย่างเดียวกันหรือไม่ คำตอบคือ ไม่เชิงเป็นอย่างเดียวกันซะทีเดียว Data analysis คือส่วนย่อยของ Data Analytics อีกที ถ้าจะเปรียบเทียบให้เห็นง่ายๆ ก็คือ
Data Analytics เป็นศาสตร์การวิเคราะห์ ซึ่งจะใช้เครื่องมือ วิธีการประมวลผลต่างๆ ประกอบด้วยเทคโนโลยี ซอฟต์แวร์ นักวิทยาศาสตร์ นักวิศวกรรม ที่ถูกสร้าง ออกแบบ หรือเชี่ยวชาญโดยเฉพาะมาใช้ในการวิเคราะห์ข้อมูลเข้าด้วยกัน
ตัวอย่างการใช้งาน Data Analytics
Walmart เป็นบริษัทที่เริ่มต้นจากการเป็นร้านค้าปลีกที่มักจัดโปรโมชั่นส่วนลดให้กับลูกค้าบ่อยครั้ง แต่เมื่อเริ่มต้นทำ eCommerce กำไรสุทธิในปี 2564 ของ Walmart กลับเพิ่มสูงถึง 35 พันล้านดอลลาร์ ซึ่ง Walmart อาศัยแผนกวิจัยและแผนกวิเคราะห์ข้อมูลที่รู้จักกันดีในชื่อ Walmart Labs (Data Analytics) ในการทำวิเคราะห์ข้อมูล
การวิเคราะห์ข้อมูลมีหลายวิธี แต่วิธีนี้ถือเป็นพื้นฐานสำหรับการวิเคราะห์ที่จะช่วยให้การทำ data analytics นั้นง่ายขึ้นมีหลากหลายเทคนิค แต่เทคนิคที่เป็นที่รู้จักจะได้แก่ 5 รูปแบบนี้
เป็นการวิเคราะข้อความ ซึ่งเรียกอีกอย่างว่าการทำเหมืองข้อมูล (Data Mining) โดยวิธีนี้จะใช้การค้นหาและนำข้อมูลขนาดใหญ่จากฐานข้อมูล (data bases) หรือเหมืองข้อมูลอื่นๆ เช่น ระบบคลังข้อมูล (data warehousing) มาวิเคราะห์
การวิเคราะห์ข้อมูลเชิงวินิจฉัยช่วยตอบคำถามว่า “ทำไม” ปัญหาหรือผลลัพธ์นี้ถึงเกิดขึ้น โดยค้นหาสาเหตุจากข้อมูลเชิงลึกที่พบจากการวิเคราะห์ทางสถิติ ซึ่งจะมีประโยชน์มากในการระบุรูปแบบพฤติกรรมของข้อมูล
การวิเคราะห์นี้จะใช้ข้อมูลก่อนหน้านี้ มาวิเคราะห์ปัญหาหรือผลลัพธ์ที่ “จะ” เกิดขึ้นในอนาคต
การวิเคราะห์ชนิดนี้จะเป็นการรวบรวมข้อมูลเชิงลึกจากการวิเคราะห์เชิงข้อความ สถิติ วินิจฉัย และพยากรณ์เพื่อ “แก้” ปัญหาหรือ “โน้มน้าว” การตัดสินใจ
ก่อนจะไปทำความรู้จักกับรูปแบบของ Data Analytics เราควรทบทวนจุดประสงค์หลักอีกครั้ง โดย Data Analytics มีไว้
ใน Big Data Analytics มักจะใช้การวิเคราะห์หรือเครื่องมือเหล่านี้ในการทำงาน
ค้นหารูปแบบข้อมูลขนาดใหญ่จากฐานข้อมูล (data bases) หรือเหมืองข้อมูลอื่นๆ เช่น ระบบคลังข้อมูล (data warehousing)
เมื่อได้ข้อมูลมาแล้วสิ่งที่ทำต่อมาคือการคาดการณ์ถึงผลลัพธ์ที่จะเกิดขึ้นในอนาคตจากข้อมูลที่มี โดยวิเคราะห์จากสถิติ (Statistics)
ช่วยประหยัดเวลาในการให้ผู้เชี่ยวชาญมานั่งวิเคราะห์ข้อมูล ใช้ปัญญาประดิษฐ์หรือที่รู้จักกันในชื่อ AI ในการรับรู้และวิเคราะห์ข้อมูลเพื่อแก้ไขปัญหา และทำให้หาทางออกได้
โดยปกติแล้วขั้นตอนการวิเคราะห์ข้อมูลจะออกมาในรูปแบบของ Data Pipeline เพราะเป็นการวิเคราะห์ข้อมูล ซึ่งข้อมูลจะถูกลำเลียงไปตามช่องทางต่างๆ ลักษณะเหมือนท่อลำเลียงน้ำมัน มีขั้นตอนดังต่อไปนี้
รวบรวม (Collect) > ปรับแต่ง (Refined) > จัดเก็บ (Store) > วิเคราะห์ (Analyze) > ส่งออก (Deliver)
โปรแกรมหรือเครื่องมือที่นิยมในการใช้วิเคราะห์ข้อมูลได้แก่
Q: เครื่องมือที่ใช้ในการวิเคราะห์ข้อมูลมีอะไรบ้าง
A: Crunching Numbers, Spreadsheets Microsoft Excel, Raw Programming Languages, Manipulate Databases, Python, Tableau, Power BI, SAS, Apache Spark
Q: อาชีพที่เกี่ยวข้องกับสายงานนี้คืออะไรบ้าง
A: Data Scientist, Data Engineer, Data Analyst
บทความนี้เกิดจากการเขียนและส่งขึ้นมาสู่ระบบแบบอัตโนมัติ สมาคมฯไม่รับผิดชอบต่อบทความหรือข้อความใดๆ ทั้งสิ้น เพราะไม่สามารถระบุได้ว่าเป็นความจริงหรือไม่ ผู้อ่านจึงควรใช้วิจารณญาณในการกลั่นกรอง และหากท่านพบเห็นข้อความใดที่ขัดต่อกฎหมายและศีลธรรม หรือทำให้เกิดความเสียหาย หรือละเมิดสิทธิใดๆ กรุณาแจ้งมาที่ ht.ro.apt@ecivres-bew เพื่อทีมงานจะได้ดำเนินการลบออกจากระบบในทันที