กระแสเรื่อง Big Data เป็นเรื่องที่เราหลีกเลี่ยงไม่ได้ เพราะ Big Data ไม่ใช่แค่เรื่องของไอที ไม่ใช่แค่มองเรื่องของการเก็บข้อมูล แต่เป็นเรื่องของทางด้านธุรกิจและผู้ใช้ที่จะมองวิธีการในการนำข้อมูลมาวิเคราะห์และคาดการณ์ต่างๆ เพื่อให้ได้ประโยชน์ จึงไม่แปลกใจที่เห็นบริษัท E-Commerce รายใหญ่ๆ ในโลกสามารถวิเคราะห์ข้อมูลคาดการณ์นำเสนอขายสินค้าให้กับลูกค้าได้ ธนาคารบางแห่งสามารถใช้ Big Data มาช่วยในการวิเคราะห์เครดิตของลูกค้าที่จะขอสินเชื่อ หรือแม้แต่บริษัทผู้ให้บริการมือถือก็สามารถใช้ Big Data มาช่วยในการแบ่งกลุ่มลูกค้า (Customer Segmentation)
IDC ได้คาดการณ์มูลค่าตลาดของ Big Data ในปี 2014 ว่าสูงถึง 16.1 พันล้านดอลลาร์ และคาดการณ์ตลาดของ Big Data ในภูมิภาคเอเชียแปซิฟิกโดยไม่รวมประเทศญี่ปุ่นในปีนี้ไว้ที่ 1.61 พันล้านดอลลาร์ ซึ่งโตกว่าปีที่แล้วถึง 34.7% นอกจากนี้ยังมีการคาดการณ์จากบริษัทวิจัยอย่าง Researchbeam ระบุว่ามูลค่าตลาดของ Hadoop หนึ่งในเทคโนโลยีที่ใช้ในการทำ Big Data จะโตจาก 1.5 พันล้านดอลลาร์ ในปี 2012 เป็น 50.2 พันล้านดอลลาร์ ในปี 2020
3 ปัจจัยเกี่ยวข้องกับ Big Data
Data Source องค์กรจะต้องคำนึงถึงข้อมูลที่จะมีความหลากหลายมากขึ้น ข้อมูลที่จะนำมาใช้จะมีทั้ง structure และ unstructure ซึ่งในอนาคตข้อมูลกว่า 85% จะเป็นแบบ unstructure นอกจากนี้องค์กรก็อาจจะต้องมีการนำข้อมูลภายนอกองค์กรมาใช้ เช่น ข้อมูลจาก Social Networks หรือข้อมูลจากคู่ค้า (partner) ซึ่งทางการ์ตเนอร์ได้ชี้ให้เห็นว่า แนวโน้มที่องค์กรต่างๆ จะนำข้อมูลมาใช้งานเมื่อเทียบกับข้อมูลที่มีอยู่ทั้งหมดมีสัดส่วนจำนวนน้อยลงเรื่อยๆ
Information Infrastructure องค์กรจำเป็นจะต้องมีการโครงสร้างพื้นฐานด้านข้อมูลเพื่อให้รองรับข้อมูลที่เป็น Big Data ซึ่งนอกจากฐานข้อมูลแบบเดิมที่เป็น SQL แล้ว อาจต้องนำเทคโนโลยีใหม่ๆ อย่าง Hadoop, NoSQL หรือ MPP เข้ามาใช้ในองค์กร ซึ่งผมเองเคยเขียนบทความแนะนำเทคโนโลยีต่างๆ ไว้คร่าวๆ ในเรื่องเทคโนโลยี Big Data: Hadoop, NoSQL, NewSQL และ MPP
Analytics องค์ประกอบสำคัญอีกเรื่องคือ การนำข้อมูลที่เป็น Big Data มาประมวลผลและวิเคราะห์เพื่อเพิ่มประสิทธิภาพในการทำงาน ซึ่งอาจเป็นการทำ Business Intelligence หรือ Predictive Analytics
สิ่งแรกองค์กรควรคำนึงถึงในการทำ Big Data คือมองกลยุทธ์ทางธุรกิจว่าต้องการอะไรไม่ใช่เรื่องของเทคโนโลยี เมื่อทราบวัตถุประสงค์ทางธุรกิจแล้วทีมทางด้านไอทีก็คงต้องมาพิจารณาดูว่ามี Data Source อะไรที่ต้องใช้ และต้องใช้เทคโนโลยีอะไรเพื่อให้บรรลุวัตถุประสงค์ เพื่อให้เห็นภาพของการวางกลยุทธ์ด้าน Big Data ผมขอยกตัวอย่างเทมเพลตที่ผมนำมาจากหนังสือเรื่อง Big Data: Understanding How Data Powers Big Business
จากเทมเพลตนี้จะเห็นได้ว่า เราควรจะเริ่มจากการกำหนด Business Initiatives ของการจะนำข้อมูลมาใช้ จากนั้นคงต้องพิจารณาว่าอะไรคือผลลัพธ์ที่คาดว่าจะได้และอะไรคือปัจจัยสู่ความสำเร็จ จากนั้นถึงจะกำหนดงาน (Task) ที่ต้องทำ และระบุถึงข้อมูลที่จะนำมาใช้ซึ่งเมื่อเรากำหนดกลยุทธ์ทางด้าน Big Data โดยเริ่มจากมุมมองธุรกิจเช่นนี้แล้ว เราค่อยมาคำนึงถึงเทคโนโลยีที่จะต้องนำมาใช้งาน จะเห็นได้ว่า เทคโนโลยีแต่ละแบบจะมีความเหมาะสมกับข้อมูลที่แตกต่างกัน เช่น
ภาพเปรียบเทียบเทคโนโลยีการเก็บข้อมูลแบบต่างๆ [Source: Amazon Web Services]
Traditional Database คือเทคโนโลยีฐานข้อมูล SQL แบบเดิมสำหรับข้อมูลที่เป็น structure ในระดับ GByte ถึง TByte และมีความเร็วในการประมวลผลไม่มากนัก
MPP Database คือเทคโนโลยีสำหรับข้อมูลขนาดใหญ่หลาย TByte ที่เป็น structure โดยมีความสามารถในการประมวลผลข้อมูลขนาดใหญ่ได้อย่างรวดเร็ว ตัวอย่างของ MPP เช่น Oracle Exadata. SAP HANA, Amazon Redshift หรือ Datawarehouse อย่าง Teredata หรือ Greenplum
NoSQL คือเทคโนโลยีในการเก็บข้อมูล semi-structure ขนาดใหญ่ โดยไม่ได้ใช้คำสั่งในการประมวลผลที่เป็น SQL ตัวอย่างเช่น Mongo DB, Cassendra หรือ Dynamo DB Hadoop คือเทคโนโลยีในการเก็บข้อมูลที่เป็น unstructure ซึ่งสามารถจะเก็บข้อมูลขนาดใหญ่ได้เป็น PByte
องค์กรจะต้องเตรียมโครงสร้างพื้นฐานเพื่อที่จะรองรับ Big Data โดยจะต้องใช้เทคโนโลยีเหล่านี้ผสมผสานกัน องค์กรคงยังต้องมี SQL Database แต่ขนาดเดียวกันอาจต้องมี Hadoop สำหรับเก็บข้อมูลขนาดใหญ่ที่เป็น unstructure และอาจต้องมี MPP Database ที่อาจเป็น DatawareHouse หรือ Large Scale Database อย่าง Oracle ExaData, SAP HANA
แต่ปัญหาที่หน่วยงานต่างๆ จะเจอในเรื่องของ Big Data คือ การขาดบุคลากรและขาดข้อมูล การ์ตเนอร์เองระบุว่า ในปีนี้จะมีตำแหน่งงานที่เกี่ยวข้องกับ Big Data ทั่วโลกถึง 4.4 ล้านตำแหน่ง แต่คงสามารถที่จะหาคนเข้าทำงานได้เพียง 1 ใน 3 ของตำแหน่งงาน และทาง IDC ก็ระบุถึงตำแหน่งงานทางด้าน Analytics ในสหรัฐอเมริกาว่า จะมีถึงสองแสนตำแหน่งในปี 2018 นอกจากนี้ยังพบว่าในปัจจุบันองค์กรใหญ่ๆ เกือบ 70% ต้องซื้อข้อมูลจากภายนอกมาวิเคราะห์ และคาดว่าในปี 2019 ทุกองค์กรใหญ่ๆ คงต้องซื้อข้อมูล
กลยุทธ์ Big Data ระดับประเทศ
เรื่อง Big Data ก็เป็นเรื่องที่ประเทศในอาเซียนให้ความสำคัญ รัฐบาลสิงคโปร์ตั้งเป้าตั้งแต่ปลายปี 2013 ว่าจะเป็นฮับทางด้านนี้โดยเฉพาะการทำ Big Data Analytics โดยมีการตั้ง Big Data Innovation Center ส่วนทางนายกรัฐมนตรีของมาเลเซีย Najib Razak ก็ได้ประกาศนโยบาย Big Data Analytics (BDA) ในปลายปี 2014 โดยวางแผนการทำ Pilot Project ในปีนี้ 4 เรื่อง และวางแผนระยะยาว 7 ปีดังรูป
สำหรับประเทศไทยคควรต้องมีนโยบายอยู่สามด้านคือ กลยุทธ์สำหรับภาครัฐและเอกชน
Big Data ยังเป็นตลาดใหม่มีการแข่งขันไม่สูงนัก (Blue Ocean) ทุกองค์กรทั้งภาครัฐและเอกชนต้องรีบวางกลยุทธ์เรื่องนี้โดยเร็ว มิฉะนั้นแล้วเราจะเสียเปรียบคู่แข่งเชิงธุรกิจ
Big Data จะช่วยสร้างความได้เปรียบทางธุรกิจให้กับคู่แข่งในภูมิภาค ต้องเอาเรื่องนี้เดินควบคู่กับนโยบาย Digital Economy เรื่องข้อมูลจะเป็นเรื่องจำเป็น จึงต้องเร่งส่งเสริมให้มีการทำ Open Data เพื่อให้เกิดการต่อยอดนำข้อมูลไปใช้งาน
กลยุทธ์ด้านเทคโนโลยี
เทคโนโลยีด้านนี้จะมีการลงทุนที่ค่อนข้างสูง ภาครัฐเองควรจะส่งเสริมให้มีการใช้ทรัพยากรร่วมกัน เพื่อลดค่าใช้จ่ายในการลงทุนด้านฮาร์ดแวร์ซอฟต์แวร์ การตั้ง Cloud Platform สำหรับ Big Data Technology เช่น Hadoop as a Service เป็นเรื่องจำเป็น ภาครัฐอาจต้องหาหน่วยงานเช่น สำนักงานรัฐบาลอิเล็กทรอนิกส์ (สรอ.) มาช่วยดำเนินงาน หน่วยงานในภาครัฐหรือบริษัทขนาดกลางและเล็กจะได้สามารถใช้งานได้โดยมีค่าบริการที่ถูกลง
กลยุทธ์ด้านการพัฒนาบุคลากร
ต้องเร่งพัฒนาบุคลากรทางด้านนี้ โดยเฉพาะผู้ที่จะมีความเชี่ยวชาญด้านการวิเคราะห์ข้อมูล
ระยะเริ่มต้นอาจต้องนำผู้เชี่ยวชาญจากต่างประเทศมาทำ Pilot Project ในลักษณะ On the job training
ความสำคัญของการทำ Big Data โดยสรุปในภาพรวมนอกจากการเก็บข้อมูล การเตรียมข้อมูลเพื่อการนำไปวิเคราะห์ ไปจนถึงการเลือกเครื่องมือเพื่อมาใช้ในการวอเคราะห์ ซึ่งควรจะต้องตอบความต้องการขององค์กรให้ด็ ซึ่งที่สุดแล้วจึงจะได้ข้อมูลที่มีประสิทธิภาพ