Open Data

เมื่อโลกอยู่ในยุคของการใช้ข้อมูล การเปิดข้อมูลเปิด (Open Data) จะช่วยให้นักพัฒนาโปรแกรม และนักวิทยาศาสตร์ข้อมูล ก้าวข้ามข้อจำกัดแบบเดิมๆ ได้อย่างไร? คงเป็นเรื่องที่หลาย ๆ ท่าน อยากทราบไม่น้อย…

วันนี้นักพัฒนาโปรแกรม (Application Developers) และนักวิทยาศาสตร์ข้อมูล (Data Scientists) ที่ถือเป็น “กุญแจสำคัญ” ของการช่วยองค์กรในหลาย ๆ อุตสาหกรรม ก้าวข้ามผ่านข้อจำกัดแบบเดิม ๆ แต่เรื่องดังกล่าวจะเกิดไม่ได้ หรือหากเป็นไปได้ก็จะต้องใช้เวลาในการเขียนโค้ต และรวบร่วมข้อมูล

เป็นระยะเวลานาน ซึ่งในยุคของเรื่องการแข่งขันที่รุนแรง อย่างเช่นทุกวันนี้ ความล่าช้าข่อมหมายถึง โอกาสที่หลุดลอยไป ของธุรกิจ และองค์กร เพราะไม่สามารถขับเคลื่อนได้ทันต่อคู่แข่งที่มีอยู่ในตลาด ซึ่งในท้ายที่สุดอาจหมายถึงความล่มสลายของธุรกิจเลยก็เป็นได้ เรื่องที่กล่าวอาจจะฟังดูเกินจริง

แต่ผู้เขียนอยากบอกว่าเรื่องดังกล่าว ไม่ใช่เรื่องที่กล่าวเกินจริง แต่อย่างใด เพราะมีตัวอย่างเกิดแล้วในหลายแวดวงธุรกิจที่ไม่สามารถปรับตัวทันต่อการเปลี่ยนแปลง

อย่างไรก็ดีล่าสุดจากนโยบายในการเปิดเผยข้อมูลของภาครัฐ ก็ถือว่าเป็นโอกาสที่ดีที่ภาคธุรกิจจะหลุดกับดักแบบเดิม ด้วยการเชื่อมโยง หรือใช้ข้อมูล ที่เปิดเผยของภาครัฐ ซึ่งผู้เขียนพบที่ข้อมูลที่น่าสนใจในเรื่องของช่องทางการใช้ข้อมูลเปิด จึงอยากมาหยิบยกมาเล่าให้ฟังกัน

โอกาสใหม่ของการเปลี่ยนแปลงด้วยการใช้ Open-D หรือ Open Data

โดยทาง เนคเทค (NECTEC) ได้พัฒนา เว็บไซต์ Open-D (Beta) : http://open-d.openservice.in.th ขึ้น โดยมีวัตถุประสงค์ให้คนไทยได้มีแหล่งรวมชุดข้อมูลแบบเปิด (open dataset)

ที่เป็นประโยชน์ต่อการนำไปใช้ประโยชน์โดยนักพัฒนาโปรแกรม (Application Developers) และนักวิทยาศาสตร์ข้อมูล (Data Scientists) โดย “ข้อมูลเปิด” (Open Data) คือ ข้อมูลในแบบที่เครื่องคอมพิวเตอร์สามารถประมวลผลได้ (Machine-readable Data) ที่เปิดให้นำไปใช้ประโยชน์ได้

โดยไม่คิดมูลค่า (Open License) ซึ่งจะเป็นประโยชน์ต่อการนำไปพัฒนาต่อยอดเพื่อสร้างนวัตกรรมได้อย่างไม่มีที่สิ้นสุด (Open Innovation) ซึ่งในประเทศไทยมีเว็บไซต์ศูนย์กลางข้อมูลเปิดภาครัฐ หรือ Data.go.th

ซึ่งริเริ่มโดยสำนักงานพัฒนารัฐบาลดิจิทัล (Digital Government Agency: DGA) ตั้งแต่ปี 2558 จากความตระหนักในความสำคัญของข้อมูลแบบเปิดที่มีมากขึ้น เนคเทคจึงพัฒนาเว็บ Open-D (Beta) เพื่อให้ผู้สนใจในการเผยแพร่ข้อมูลแบบเปิดทั้งจากภาครัฐและภาคเอกชน

ได้มีช่องทางที่จะเผยแพร่ชุดข้อมูลแบบเปิด (publish) มากขึ้น โดยเว็บ Open-D มีจุดเด่นคือ

  • ชุดข้อมูลที่เผยแพร่ผ่านเว็บไซต์นี้ จะถูกแปลงเป็น API (Application Programming Interface) ชนิด RESTFul API ให้อย่างอัตโนมัติ

โดย API ของเนคเทคนี้เป็นรูปแบบการเข้าถึงข้อมูลที่มีความยืดหยุ่น และช่วยให้นักพัฒนาโปรแกรม (Application Developers) สามารถนำข้อมูลไปใช้ประโยชน์ได้อย่างสะดวกมากที่สุด ตัวอย่างเช่น นำข้อมูลพิกัดที่ตั้งของสถานที่ไปใช้ใน Mobile App

หรือ นำข้อมูลแบบตัวเลขไปวิเคราะห์ทางสถิติ (Data analysis) หรือ นำข้อมูลจากหลายๆ แหล่งข้อมูลมาใช้งานร่วมกัน เพื่อสร้างสรรค์แอพพลิเคชันใหม่ ๆ เป็นต้น (Data mash-up) นอกจาก API แล้ว เว็บ Open-D (Beta) ยังเน้นให้ผู้สนใจด้านวิทยาการข้อมูล (Data Science)

ได้มีเครื่องมือสนับสนุนการวิเคราะห์ข้อมูลและสร้างรายงานในแบบกราฟชนิดต่างๆ (Data visualization tools) จากข้อมูลแบบเปิด เช่น การสร้างกราฟสำหรับข้อมูลในแบบเวลา (time-series)

และสำหรับข้อมูลสถิติเชิงพื้นที่ (heatmap) ในระดับจังหวัด อำเภอ และตำบลของประเทศไทย การเข้าถึงข้อมูลโดยวิธีการ drill-down ในแบบแผนที่แบบลำดับชั้น (treemap) เป็นต้น

ข้อดีของการมีเว็บไซต์ Open-D (Beta)

การทำให้มีปริมาณข้อมูลที่เติบโตขึ้น และกลายเป็นแหล่งรวบรวมข้อมูลเปิดอีกแหล่งหนึ่งของประเทศไทย ที่จะช่วยจุดประกายความคิดสร้างสรรค์ให้กับ

นิสิต นักศึกษา นักวิจัย นักพัฒนา และผู้สนใจ สามารถนำข้อมูลไปพัฒนาต่อยอดใช้ประโยชน์อย่างไม่มีที่สิ้นสุด ตามเจตนารมณ์ของการสร้างนวัตกรรมแบบเปิด (Open Innovation) ได้ใช้

Open Data
เว็บไซต์ Open-D (Beta)

Open Data

จุดเด่น  3 ประการ ที่แตกต่างจากแพลตฟอร์มเปิดเผยข้อมูล อื่นๆ

  1. เน้นให้ผู้ใช้ที่เป็นนักพัฒนาแอปพลิเคชัน สามารถเข้าถึงข้อมูลในแต่ละชุดข้อมูลได้ผ่าน API (data API) ซึ่งจะช่วยให้นักพัฒนาแอปพลิเคชันสามารถเข้าถึงข้อมูลได้อย่างยืดหยุ่นยิ่งขึ้น เมื่อเทียบการเปิดเผยข้อมูลในแบบไฟล์ตารางคำนวณแบบ excel หรือ CSV ที่นักพัฒนาแอปพลิเคชันต้องดาวน์โหลดแต่ละไฟล์ไปประมวลผลด้วยตนเอง
  2. เน้นให้ผู้ใช้ที่เป็นนักวิจัยหรือนักวิเคราะห์ข้อมูล (researcher/ data analyst) สามารถวิเคราะห์และแสดงผลข้อมูล (data analysis and visualization) ชุดข้อมูลเปิดได้อย่างยืดหยุ่นผ่านเว็บไซต์ และสามารถนำผลการวิเคราะห์ในแบบกราฟไปเผยแพร่ผ่านสื่อออนไลน์ (data visualization sharing) หรือ นำไปประกอบบทความในหน้าเว็บต่างๆ ได้ (data visualization embedding) อย่างยืดหยุ่นมากกว่า เมื่อเทียบการเปิดเผยข้อมูลในแบบไฟล์ตารางคำนวณแบบ excel หรือ CSV ที่นักวิจัยหรือนักวิเคราะห์ข้อมูลต้องดาวน์โหลดแต่ละไฟล์ไปวิเคราะห์ข้อมูลด้วยตนเองผ่านโปรแกรมภายนอก
  3. เน้นให้ผู้ใช้ที่เป็นผู้เผยแพร่ข้อมูล สามารถเปิดเผยข้อมูลในแบบที่สามารถนำไปใช้ประโยชน์และต่อยอดได้ง่ายยิ่งขึ้น (improved data accessibility) โดยผู้เผยแพร่ข้อมูลสามารถเตรียมข้อมูลในแบบไฟล์ตารางคำนวณชนิด CSV โดยระบบจะทำการแปลงข้อมูลให้ผู้ใช้สามารถเข้าถึงในแบบที่กล่าวมาในข้อ 1 และ 2 ได้อย่างอัตโนมัติ ทั้งนี้ไฟล์ข้อมูล CSV จะถูกตรวจสอบว่าอยู่ในแบบข้อมูลตาราง (dataset validation) ที่เหมาะสมหรือไม่ ซึ่งหากตรวจสอบผ่านหมายความว่าชุดข้อมูลดังกล่าว อยู่ในแบบที่เครื่องคอมพิวเตอร์ประมวลผลได้ (machine-readable data) หากไม่อยู่ในแบบที่เหมาะสมก็จะไม่สามารถนำเข้าสู่ระบบได้ จึงทำให้ข้อมูลเปิดที่ให้บริการมีคุณภาพมากกว่า เมื่อเทียบการเปิดเผยข้อมูลในแบบไฟล์ตารางคำนวณแบบ excel หรือ CSV ที่ปกติจะไม่มีการตรวจสอบคุณภาพของไฟล์ชุดข้อมูลว่าเป็นแบบที่เครื่องคอมพิวเตอร์ประมวลผลได้จริงหรือไม่

Open Data

ส่วนขยาย

* บทความนี้เรียบเรียงขึ้นเพื่อวิเคราะห์ในแง่มุมที่น่าสนใจ ไม่มีวัตถุมุ่งเพื่อโจมตี 
  หน่วยงานใดหน่วยงานหนึ่ง 
** Compose : ชลัมพ์ ศุภวาที (Editors and Reporters)
*** ที่มาของข้อมูล : ดร.มารุต บูรณรัช
                  ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค)
                  (National Electronics and Computer Technology:Nectec)
**** ขอขอบคุณภาพบางส่วนจาก www.pexels.com

สามารถกดติดตาม ข่าวสาร และบทความทางด้านเทคโนโลยี ของเราได้ที่