Analytics หรือการวิเคราะห์ข้อมูล มีบทบาทสำคัญเพิ่มขึ้นเรื่อยๆ ตามกระแสความนิยมของ Big Data ที่เพิ่มขึ้นอย่างต่อเนื่อง เหล่า CIO หรือผู้นำฝ่ายไอทีในองค์กร จำเป็นต้องมีความรู้เกี่ยวกับ Analytics พอสมควร อาจไม่จำเป็นต้องรู้ลึกซึ้งในระดับเดียวกับนักวิทยาการข้อมูล (data scientist) แต่ก็ต้องรู้มากเพียงพอที่จะนำมาใช้ให้เกิดประโยชน์กับองค์กรได้
ความสำคัญของ Analytics
ประเด็นแรกที่ผู้นำไอทีต้องเข้าใจ คือความสำคัญของ analytics นี่คือเหตุผล หรือสาเหตุว่าทำไมผู้นำองค์กรที่มีวิสัยทัศน์ถึงให้ความสนใจที่จะลงทุนใน Big Data
นิยามของ Big Data จาก Gartner ระบุว่า “Big data” is high-volume, -velocity and -variety information assets that demand cost-effective, innovative forms of information processing for enhanced insight and decision making. โดยสามารถแยกส่วนนิยามข้างต้นได้เป็น 3 องค์ประกอบใหญ่ๆ คือ
● WHAT – high-volume, -velocity and -variety information assets นี่คือลักษณะของข้อมูลแบบ 3Vs ที่ท่านอาจรู้จักกันอยู่แล้ว
● HOW – cost-effective, innovative forms of information processing นี่คือเทคโนโลยี หรือวิธีการใหม่ๆ ที่จะจัดการกับข้อมูลเหล่านั้น
● WHY – for enhanced insight and decision making สาเหตุหลักคือต้องการ insights และการตัดสินใจที่ดีขึ้น และการวิเคราะห์ข้อมูลหรือ Analytics คือเครื่องมือดังกล่าว
ประโยชน์ของ Big Data ไม่ได้ถูกวัดกันด้วยปริมาณความเร็วข้อมูลที่ใช้ หรือว่าใช้เทคโนโลยีล้ำสมัยอย่าง Hadoop หรือ Spark ในการเก็บหรือประมวลผลข้อมูล แต่อยู่ที่การทำการวิเคราะห์ข้อมูล จนได้ความรู้ความเข้าใจใหม่ๆ อันจะส่งผลให้เกิดการตัดสินใจ เพื่อนำธุรกิจไปสู่เป้าหมายที่ต้องการได้ ไม่สำคัญว่าคุณเก็บข้อมูลไว้มากขนาดไหน แต่สำคัญว่าองค์กรคุณนำข้อมูลเหล่านั้นไปก่อให้เกิดประโยชน์ได้อย่างไรมากกว่า
รู้จักกับ Business Analytics แบบต่างๆ
ทั้งนี้สามารถแบ่งรูปแบบการวิเคราะห์ข้อมูลแบบกว้างๆ ได้เป็น 4 แบบ ตั้งแต่แบบง่ายๆ และยากขึ้นไปเรื่อยๆ แต่ประโยชน์ที่ได้จากการวิเคราะห์ข้อมูลที่ยากขึ้น ก็มีคุณค่าเพิ่มมากขึ้นตามไปด้วย
Descriptive Analytics
เป็นรูปแบบของการวิเคราะห์ข้อมูลแบบพื้นฐานที่สุด โดยจะเน้นไปที่ความสามารถในการ “อธิบาย” ว่าเกิดอะไรขึ้นกับธุรกิจของคุณในช่วงที่ผ่านมา (หรือกำลังเกิดอะไรขึ้น ถ้าได้ข้อมูลที่ปัจจุบันเพียงพอ)
ระบบสารสนเทศจำพวก รายงานทางธุรกิจ รายงานการขาย ผลประกอบการ ผลการดำเนินงาน รวมถึงระบบ business intelligence โดยส่วนใหญ่ต่างก็ถือเป็น Descriptive Analytics ทั้งสิ้น
ถึงแม้ว่าจะเป็นความสามารถที่สำคัญ แต่การวิเคราะห์แบบนี้ก็ไม่เพียงพออีกต่อไป เพราะสิ่งที่ได้ก็เพียงแค่ได้รู้ว่าอะไรเกิดขึ้นแล้วบ้าง ไม่ต่างจากการขับรถไปข้างหน้าโดยมองเห็นได้แค่เพียงกระจกมองหลังเพียงอย่างเดียว
Diagnostic Analytics
การวิเคราะห์ข้อมูลแบบนี้ จะเป็นเชิง “วินิจฉัย” คือพยายามอธิบายถึงสาเหตุของสิ่งที่กำลังเกิดขึ้น โดยพิจารณาจากความสัมพันธ์ของตัวแปรต่างๆ ที่มีต่อกัน อาทิ ความสัมพันธ์ของยอดขายต่อความถี่ในการโฆษณา หรือผลกระทบของฤดูกาลและกิจกรรมทางการตลาดของคู่แข่ง เป็นต้น
ก่อนยุคของ Big Data การวิเคราะห์ข้อมูลในลักษณะนี้ จำเป็นต้องพึ่งพาประสบการณ์และความเข้าใจในธุรกิจของนักวิเคราะห์เป็นหลัก และมีหลายตัวแปรที่อาจจะไม่สามารถวัดหรือประเมินผลกระทบได้อย่างชัดเจน จนกว่าจะผ่านการลองผิดลองถูกมายาวนานจนสรุปเป็นประสบการณ์ได้
เมื่อข้อมูลมีจำนวนมากขึ้น และอัลกอริทึมในการคำนวณหาความสัมพันธ์ระหว่างตัวแปรต่างๆ มีประสิทธิภาพสูงขึ้น ทำให้การวิเคราะห์ข้อมูลในเชิงวินิจฉัยมีความเป็นไปได้มากขึ้น
Predictive Analytics
รูปแบบการวิเคราะห์ข้อมูลที่ก้าวหน้าขึ้นมาอีกขั้นหนึ่ง โดยเป็นการพยายาม “พยากรณ์” สิ่งที่กำลังจะเกิดขึ้นในอนาคต โดยใช้ข้อมูลของสิ่งที่เกิดขึ้นในอดีต เข้ามาวิเคราะห์ร่วมกับโมเดลทางสถิติ หรืออาจจะใช้ร่วมกับอัลกอริทึมที่ซับซ้อนมากขึ้นอีกอย่างเช่น Machine Learning หรือ Data Mining ก็ได้
สิ่งที่ predictive analytic มอบให้ก็คือ ความสามารถในการวิเคราะห์หาโอกาส และความเสี่ยงของสิ่งที่จะเกิดขึ้นในอนาคต ตัวอย่างหนึ่งของ predictive analytic คือการคำนวณ credit rating score ที่มักใช้โดยสถาบันการเงินต่างๆ เพื่อพิจารณาอนุมัติสินเชื่อ โดยใช้ข้อมูลตัวแปรต่างๆ นับสิบตัว รวมถึงประวัติความสามารถในการชำระเงินในอดีต มาใช้เพื่อคำนวณ “ความน่าจะเป็น” ที่บุคคลจะสามารถชำระหนี้ได้ในอนาคต
Prescriptive Analytics
รูปแบบการวิเคราะห์ข้อมูลแบบนี้ ถือว่าก้าวหน้าที่สุด เพราะไม่เพียงแต่จะพยากรณ์ว่าจะเกิดอะไรขึ้น สาเหตุ และระยะเวลาที่จะเกิดขึ้น แต่ยังสามารถให้คำแนะนำเกี่ยวกับทางเลือกที่มี รวมถึงผลที่จะตามมาของแต่ละทางเลือกด้วย
อีกหนึ่งองค์ประกอบหนึ่งที่ Prescriptive Analytic คือความสามารถในการปรับเปลี่ยนการวิเคราะห์ เมื่อได้รับข้อมูลเพิ่มเติมเพิ่มมากขึ้น หรืออาจกล่าวได้ว่า มีความสามารถที่จะเรียนรู้ปรับโมเดลการพยากรณ์ให้มีความแม่นยำเพิ่มมากขึ้นเมื่อเวลาผ่านไป
เทคนิคที่หลากหลายและเพิ่มเติมขึ้นเรื่อยๆ
แนวทางการแบ่ง Analytics เป็น 4 กลุ่มข้างต้น เป็นเพียงแนวทางกว้างๆ เท่านั้น ความจริงแล้ว เทคนิควิธีการ หรือ “อัลกอริทึม” ในการวิเคราะห์ข้อมูล มีหลากหลายรูปแบบ ตั้งแต่เทคนิคพื้นฐานที่เราเคยเรียนกันมาในสมัยมัธยม อย่าง Simple Linear Regression ที่มีรูปแบบไม่ซับซ้อน ใช้เครื่องมือคำนวณอย่าง Excel ก็เพียงพอ ไปจนถึงเทคนิคการวิเคราะห์ทางสถิติขั้นสูง ที่มีพื้นฐานมาจากงานวิจัยในระดับปริญญาเอกยุคใหม่ไม่เกินสิบปีที่ผ่านมานี้เอง แล้วแถมยังมีชื่อเรียกแต่ละกลุ่มแยกย่อยกันไปอีก ไม่ว่าจะเป็น Data Mining, Machine Learning หรือ Deep Learning ผลงานวิจัยอัลกอริทึมใหม่ๆ ก็มีการตีพิมพ์เพิ่มเติมออกมาอย่างสม่ำเสมอ และดูเหมือนจะเพิ่มมากขึ้นเรื่อยๆ
ในฐานะ CIO หรือผู้บริหารที่ดูแลด้านเทคโนโลยี คุณไม่จำเป็นต้องรอบรู้เชี่ยวชาญถึงขั้นอธิบายการทำงานของอัลกอริทึมเหล่านี้ได้ นั่นเป็นหน้าที่ของ data scientists แต่อย่างน้อยคุณควรจะรู้มากพอที่จะเข้าใจประเด็น อย่างเช่น
● ความสามารถรู้ว่าอัลกอริทึมเหล่านั้นทำอะไรได้
● ความต้องการในด้านข้อมูล และพลังการประมวลผล
● สมมติฐานหรือข้อจำกัดของแต่ละวิธีการ
ความเข้าใจเหล่านี้ จะช่วยให้คุณเล่นบทบาทที่สำคัญได้สามประการคือ 1) การเลือกปัญหาทางธุรกิจที่จะใช้ Analytics เข้าช่วยและเลือกอัลกอริทึมที่เหมาะสม 2) การเตรียมความพร้อม และ 3) การหลีกเลี่ยงหรือบรรเทาปัญหาที่อาจจะเกิดจากการใช้ Analytics ไม่เหมาะสม
เลือก Analytics ที่เหมาะกับธุรกิจคุณ
การกำหนดลำดับความสำคัญของการวิเคราะห์ข้อมูล มีความท้าทายไม่แตกต่างจากการจัด priority ของโครงการ IT ทั่วๆ ไป ในสถานการณ์ที่ทรัพยากรจำกัด ทั้งงบประมาณ บุคลากร และเวลา การเลือกว่าจะทำ Analytics เรื่องอะไร อาจกลายเป็นสิ่งท้าทายได้
หน้าที่การสร้างอัลกอริทึม ปรับแต่งโมเดลการวิเคราะห์ หรือจัดเตรียมข้อมูล เป็นหน้าที่ของทีมงาน data scientists พวกเขามีหน้าที่แก้ปัญหาทางธุรกิจด้วยโซลูชัน Analytics แต่สำหรับ CIO หน้าที่สำคัญก่อนหน้านั้นคือ กำหนดปัญหาที่ “เหมาะสมที่จะแก้” หรือคุ้มค่าที่จะแก้ ด้วยการพิจารณาปัจจัยเหล่านี้
● Fit – ความเหมาะสมสอดคล้องกับทิศทางและยุทธศาสตร์ของธุรกิจ โครงการ Big Data Analytics โดยท้ายที่สุดแล้ว ก็ยังมีวัตถุประสงค์เพื่อตอบสนองความต้องการทางธุรกิจ
● Feasibility – ความเป็นไปได้ หลายอัลกอริทึมที่อาจสอดคล้องกับเป้าหมายยุทธศาสตร์ของบริษัท แต่หากมันจำเป็นต้องใช้ข้อมูลที่ยังหาไม่ได้ ณ เวลานี้ หรืออาจต้องใช้เวลาและเงินทุนในการจัดเก็บข้อมูล หรือสภาพคุณภาพของข้อมูลปัจจุบันยังไม่ดีพอที่จะใช้งานได้ ปัจจัยเหล่านี้ ทำให้ “ความเป็นไปได้” ที่โครงการจะสำเร็จ ลดต่ำลง
● Attractiveness – ความน่าสนใจ หรือผลที่คาดว่าจะได้รับ บางทีเราอาจเรียกมันว่า Size of the prize ก็เป็นอีกปัจจัยที่มีผล หลายโครงการอาจไม่สามารถคำนวณ ROI ได้โดยตรง ก็อาจจำเป็นต้องใช้วิธีประเมินแทน
หากหน่วยงานของคุณเพิ่งเริ่มต้น ในการทดลองทำโครงการเกี่ยวกับ Analytics กลยุทธ์อย่างหนึ่งที่น่าสนใจ คือการเลือก Low hanging fruits หรือ Quick Win คือเลือกโครงการนำร่องที่ทำได้ง่าย เห็นผล และได้ประโยชน์อย่างรวดเร็ว เพื่อให้องค์กรมีประสบการณ์ในการเรียนรู้การนำ analytics เข้ามาใช้ในองค์กร
โครงการนำร่องจะมีประโยชน์สูงสุด หากสามารถนำมาช่วยเพิ่มประสิทธิภาพในการตัดสินใจได้ โดยเฉพาะอย่างยิ่ง การตัดสินใจที่ต้องทำซ้ำๆ เป็นประจำ และมีเกณฑ์การตัดสินใจที่ชัดเจน โดยมากมักเป็นการตัดสินใจในงานระดับปฏิบัติการ
องค์กรชั้นนำที่ประสบความสำเร็จในการใช้ Big Data Analytics สามารถเพิ่มประสิทธิภาพการทำงานได้โดยการปรับการทำงานบางส่วนให้เป็นอัตโนมัติ ตามอัลกอริทึมที่ได้ออกแบบไว้ ไม่ว่าจะเป็นการตั้งโปรแกรมซื้อขายหุ้นอัตโนมัติตามสภาพตลาดที่เปลี่ยนไป การวางแผนการจัดส่งสินค้าในแต่ละวันแต่ละเส้นทางให้ประหยัดที่สุด หรือการออกใบสั่งซื้อวัตถุดิบ โดยไม่เพียงแต่ดูแค่แผนการผลิต แต่ยังรวมไปถึงการคาดการณ์ปริมาณความต้องการสินค้าเพิ่มเติมขึ้นด้วย
เตรียมสภาพแวดล้อมให้พร้อม
เมื่อเลือกปัญหาและโซลูชันที่่ต้องการได้แล้ว บทบาทของผู้นำไอทีในองค์กร จะเปลี่ยนไปเป็นผู้ให้การสนับสนุนทีมงาน โดยการเตรียมสภาพแวดล้อมให้พร้อมเพื่อรองรับการวิเคราะห์ข้อมูล ทั้งในด้านข้อมูล โครงสร้างพื้นฐาน หรือ intrastructure และในด้านความพร้อมขององค์กร
● ความพร้อมด้านข้อมูล ลักษณะของข้อมูลที่จำเป็นต้องใช้ในอัลกอริทึมหรือเทคนิคการวิเคราะห์ข้อมูลแต่ละรูปแบบ จะมีความต้องการที่แตกต่างกัน เทคนิคการวิเคราะห์ข้อมูลบางอย่างไม่เหมาะกับข้อมูลที่มี outlier หรือข้อมูลสุดโต่ง จำเป็นต้องมีการขจัดข้อมูลเหล่านั้นออกไปก่อน โดยภาพรวมแล้ว จำเป็นต้องมีข้อมูลที่ clean, current และ available เพื่อให้การวิเคราะห์ได้ผลลัพธ์ที่ต้องการ
● โครงสร้างพื้นฐาน ในแง่ของพลังการประมวลผล และความสามารถในการจัดเก็บข้อมูล ถ้าทีมงาน Analytics ต้องนั่งคอยเป็นชั่วโมงๆ ในการวิเคราะห์ข้อมูลแต่ละรอบ หรือการประมวลผลแต่ละครั้งส่งผลกระทบต่อผู้ใช้งานระบบอื่นๆ ให้ทำงานได้ช้าลง ก็แสดงว่าโครงสร้างพื้นฐานมีไม่เพียงพอที่จะสนับสนุนการวิเคราะห์ที่ต้องการ
● ความพร้อมในองค์กร หลายองค์กรยังประสบปัญหาการปรับตัวเข้ากับเทคโนโลยีใหม่ๆ โดยเฉพาะอย่างยิ่งถ้าเทคโนโลยีนั้น “ท้าทาย” สิ่งที่พวกเขาเคยทำมาตลอด ถ้าผลของ Analytics จะทำให้รูปแบบการทำงานของคนในองค์กรเปลี่ยนแปลงไป จำเป็นต้องมีการเตรียมความพร้อมให้กับบุคลากรในองค์กร มิฉะนั้นเราก็เสี่ยงที่จะสร้างโซลูชันชั้นดีที่ไม่มีใครอยากใช้
หลบหลีกหลุมพรางและปัญหาที่อาจเกิด
บทบาทสำคัญประการสุดท้าย ที่ทำให้เหล่า CIO จำเป็นต้องรู้และเข้าใจอัลกอริทึมของ Analytics ที่ใช้งานอยู่ เป็นเรื่องของการเตรียมความพร้อมเพื่อป้องกันปัญหาที่อาจเกิดขึ้นได้ หากอัลกอริทึมเหล่านั้นทำงานได้ “ดีเกินไป”
ในต่างประเทศที่มีการนำ analytics ไปใช้งานอย่างกว้างขวางและมีประสิทธิภาพสูงในงานหลายๆ อย่าง ส่งผลให้หลายธุรกิจปล่อยการตัดสินใจเหล่านั้นให้เป็นไปโดยอัตโนมัติ และก็เกิดประเด็นที่ทำให้เกิดคำถาม ทั้งจากผู้บริโภค หน่วยงานที่กำกับดูแล และสังคมโดยทั่วไป ถึงความเหมาะสมและรับผิดชอบขององค์กรต่อการตัดสินใจที่ทำลงไปโดยอัลกอริทึมอัตโนมัติ
● กรณีที่หลายคนอาจเคยได้ยิน คือการที่ห้าง Target ในอเมริกา สามารถรู้ได้ว่าเด็กสาววัยรุ่นกำลังตั้งครรภ์อยู่ ก่อนที่พ่อของเธอจะรู้เสียด้วยซ้ำ
● UBER ใช้อัลกอริทึมอัตโนมัติเพื่อปรับราคาค่าโดยสารแบบ dynamic pricing โดยปัจจัยหนึ่งคือ หากมีความต้องการสูง ค่าโดยสารก็จะสูงตามไปด้วย และเมื่อเกิดเหตุจับตัวประกัน 14 คนกลางกรุงซิดนีย์ออสเตรเลียเมื่อปลายปี 2014 อัตราค่าโดยสารของ UBER ในละแวกดังกล่าวพุ่งสูงขึ้นถึง 4 เท่าเทียบกับอัตราปกติ
● บริษัท Athena Capital Research ซึ่งเป็นนายหน้าค้าหลักทรัพย์ในตลาด NASDAQ ใช้อัลกอริทึมที่พัฒนาขึ้นโดยเฉพาะ เพื่อส่งคำสั่งซื้อหรือขายหุ้นล็อตใหญ่ เพียงแค่ชั่วเสี้ยววินาทีก่อนตลาดจะปิดทำการ เพื่อให้ราคาหุ้นสูงขึ้นหรือต่ำลงเอื้อประโยชน์ต่อตัวเอง ทาง SEC หรือ กลต.ได้เข้ามาสอบสวน (รวมถึงเรียก CTO ของ Athena มาให้การด้วย) ก่อนจะตัดสินว่าเป็นการกระทำที่ผิดกฎหมาย และทางบริษัทต้องเสียค่าปรับ
ยังมีกรณีศึกษาหรือกรณีฟ้องร้องอีกหลายเรื่อง ที่เกิดจากการใช้เทคโนโลยีวิเคราะห์ข้อมูลในการตัดสินใจขององค์กร ทั้งในด้านการให้บริการสาธารณสุข การประกันภัย หรือแม้แต่กระทั่งการชดเชยการเลิกจ้าง ประเด็นหลักๆ 3 ข้อที่องค์กรธุรกิจถูกตั้งคำถามคือเรื่องความเป็นส่วนตัว (privacy) การปฏิบัติตามกฎหมาย และหลักจริยธรรม (Ethical)
เริ่มมีการพูดถึง Algorithmic Accountability หรือความรับผิดชอบด้านอัลกอริทึม องค์กรจะต้องสามารถตอบได้ว่า อัลกอริทึมที่สร้างและใช้ใน analytics แบบต่างๆ นั้นถูกกฎหมาย ไม่ละเมิดความเป็นส่วนตัว และไม่กีดกันหรือสร้างความไม่เป็นธรรมอย่างหนึ่งอย่างใดให้กับสังคม
แน่นอนว่า ผู้บริหารด้านไอที ไม่ว่าจะเป็น CIO, CTO, หรือ CDO (อาจรวมกับทีมกฎหมายด้วย) ต่างก็ถูกคาดหมายจากทั้งภายในและภายนอกองค์กร ให้เป็นผู้ตอบคำถามต่างๆ เกี่ยวกับอัลกอริทึมที่ใช้งานอยู่ ว่าได้พิจารณาอย่างถี่ถ้วนรอบคอบแล้วถึงประเด็นทั้งทางด้านกฎหมายและด้านศีลธรรม
สรุป
ด้วยความสำคัญของ Analytics ที่เพิ่มมากขึ้น ความคาดหวังและผลกระทบจากการใช้งาน ทำให้ผู้นำด้านไอทีจำเป็นที่จะต้องเรียนรู้และทำความเข้าใจกับเทคนิค รวมถึงอัลกอริทึมแบบต่างๆ เพื่อสนับสนุนให้องค์กรสามารถใช้ประโยชน์จากการวิเคราะห์ข้อมูลที่เพิ่มจำนวนขึ้นเรื่อยๆ ได้อย่างเต็มศักยภาพ
อ้างอิง:
CIOs Have to Learn the New Math of Analytics
http://www.cio.com/article/2888471/business-analytics/cios-have-to-learn-the-new-math-of-analytics.html