พูดคุยกับผู้พัฒนาแป้นพิมพ์ “มนูญชัย” ที่สร้างทางเลือกใหม่ในการพิมพ์บน Windows และ Mac ด้วย AI และ Dataset จำนวนมาก ซึ่งจะช่วยให้การพิมพ์ “ง่าย” ขึ้น และช่วยให้ “ไม่ปวดมือ”
ปัจจุบัน เมื่อทุกคนต้องใช้คอมพิวเตอร์และคีย์บอร์ดเป็นอุปกรณ์หลักในการพิมพ์แล้ว สิ่งหนึ่งที่หลายคนอาจสงสัยและไม่กล้าตั้งคำถามคือ แป้นพิมพ์ที่เราใช้อยู่นั้นมีโครงสร้างที่้เหมาะกับการพิมพ์จริงๆ หรือยัง เพราะบางครั้งการกดตัวพยัญชนะ สระ และอักขระบางตัว ก็ช่างกดยาก แถมยังหายากเสียเหลือเกิน
แรกเริ่มเดิมทีแป้นพิมพ์ 2 อันที่ถูกคิดค้นขึ้นมา ประกอบด้วย แป้นพิมพ์ “เกษมณี” คิดค้นโดย คุณสุวรรณประเสริฐ เกษมณี ออกแบบเพื่อให้กับเครื่องพิมพ์ดีดเป็นหลัก แต่ต่อมากลายเป็นแป้นพิมพ์ที่ได้รับความนิยมสำหรับการพิมพ์บนระบบคอมพิวเตอร์
ต่อมาจึงมีแป้นพิมพ์ “ปัตตะโชติ” เป็นผังแป้นพิมพ์ภาษาไทยอีกอันที่คิดค้นโดยคุณสฤษดิ์ ปัตตะโชติ แม้ถูกทางการกำหนดให้เป็นแป้นพิมพ์มาตรฐาน แต่ก็ไม่ได้รับความนิยมจากผู้ใช้พอสมควร
วันนี้เราจึงมาพูดคุยกับ คุณมนัสศานติ์ มนูญชัย ผู้พัฒนาแป้นพิมพ์ “มนูญชัย” ที่สร้างทางเลือกใหม่ในการพิมพ์บน Windows และ Mac ซึ่งจะช่วยให้การพิมพ์ “เร็ว” ขึ้น และช่วยให้ “ไม่ปวดมือ” ได้ไม่มากก็น้อย
ต้องการสร้างแป้นพิมพ์ใหม่ที่ “ทันยุคทันสมัย”
คุณมนัสศานติ์ เริ่มบอกกับเราถึงจุดประสงค์ในการสร้างแป้นพิมพ์นี้ขึ้นมาว่า เกิดจากความเปลี่ยนแปลงของสภาพสังคม ความก้าวหน้าของเทคโนโลยี รวมถึงตัวภาษาไทยเองนั้นมีความเปลี่ยนแปลงไปมาก จึงทำให้เขาอยากลองสร้างแป้นพิมพ์ไทยตัวใหม่ที่ “ทันยุคทันสมัย” ขึ้นมา
ประกอบกับเห็นว่า ในวงการแป้นพิมพ์ภาษาอังกฤษก็มีการพัฒนาแป้นพิมพ์ทางเลือกที่นอกเหนือจาก QWERTY ขึ้นมา เช่น Colemak และ Dvorak เป็นต้น ดังนั้นคงไม่เสียหายอะไรหากจะมีการพัฒนาแป้นพิมพ์ไทยแบบใหม่ขึ้นมา เพื่อเป็นทางเลือกให้กับผู้ใช้ชาวไทย
ส่วนคุณสมบัติที่ควรมีในแป้นพิมพ์ใหม่ มีด้วยกัน 5 ข้อ คือ
1. ใช้เลขอารบิก (0–9) แทนเลขไทย (๐-๙) : การใช้เลขอารบิกแทนเลขไทยเป็นหลัก จะทำให้ลดการเปลี่ยนภาษาสลับไปมาในการพิมพ์ ลดการใช้แป้นพิมพ์แบบ Numpad (โซนแป้นพิมพ์ที่มีแต่ตัวเลข) การปรับครั้งนี้ยังทำเพื่อให้รองรับ คีย์บอร์ดยุคใหม่และแลปทอปที่ไม่มี Numpad เป็นหลักแล้ว
2. ไม่มีตัวอักษรไทยบนแถวตัวเลข : ในแป้นพิมพ์เกษมณี จะมีตัว ภ, ถ, สระอุ, สระอู, ค, ต, จ, ข, ช บนแถวตัวเลข ซึ่งทำให้ต้องขยับมือไปไกล มีโอกาสทำให้พิมพ์ผิดได้มากกว่า
3. เอาตัวอักษรที่ไม่ใช้แล้วออก เอาตัวที่ไม่ใช้บ่อยไปไว้ไกลๆ : การนำตัวอักษรลงมาจากแถวตัวเลข ทำให้เราต้องนำตัวที่ไม่ใช้แล้วออกไป เช่น ฃ, ฅ, ฦ, ๏ และนำตัวที่ใช้ไม่บ่อยไปไว้ในตำแหน่งขวามือสุดเหนือปุ่ม Enter เช่น ฑ, ฬ, ฌ, ฯ
4. ใช้ Dataset ที่ทันสมัยจำนวนมาก : ปัจจุบันเรามี Dataset จำนวนมากแล้ว ทำให้เรามีข้อมูลในการพัฒนาแป้นพิมพ์แบบใหม่มากขึ้น เมื่อเราใช้ข้อมูลจำนวนที่มากพอจะทำให้ลดความเอนเอียง (Bias) ในการพัฒนาได้ ส่งผลให้แป้นพิมพ์นี้เหมาะกับการใช้ทั่วไป มากกว่าการพิมพ์แค่บทความหรือนิยายโดยเฉพาะ ในอดีตแป้นพิมพ์ปัตตะโชติ พัฒนาจากบทความเพียง 50 บทความ ซึ่งแต่ละบทความละ 1,000 ตัวอักษร เท่านั้นเอง
5. ใช้โค้ดในการจัดวางแป้นพิมพ์ : การประมวลผลข้อมูลจำนวนมาก จำเป็นต้องใช้โค้ดและ Algorithm ในการประมวลผลแป้นพิมพ์ที่ Optimized และมี Bias ต่ำออกมา โดย Algorithm ที่ใช้จะดัดแปลงจากโปรเจกต์ Carpalx เพื่อให้เข้ากับบริบทของแป้นพิมพ์ภาษาไทย
เริ่มกระบวนการสร้างแป้นพิมพ์ใหม่ด้วยการใช้ AI และ Dataset จำนวนมากเข้ามาช่วย
สุ่มยังกับหาเลขหวย pic.twitter.com/zqkuYHnRQh
— narze (@narze) April 28, 2021
ขั้นตอนในการพัฒนา คุณมนัสศานติ์ เปิดเผยว่า ขั้นตอนแรก คือ การสร้าง Model เพื่อนำชุดคำไปประมวลผล โดยคำนวณความพิมพ์ง่ายของแป้นพิมพ์ โดยมีหลักการสำคัญๆ อย่างเช่น ลดการใช้งานนิ้วที่ไม่แข็งแรง, เน้นการใช้งานแป้นเหย้า, ลดการใช้นิ้วซ้ำกันในการพิมพ์, เฉลี่ยการพิมพ์มือซ้ายขวาให้เท่ากับ และการทำให้แป้นพิมพ์สร้างการสลับมือในการพิมพ์คำ และนำมาประมวลผลร่วมกับตัวชุดคำภาษาไทยในเงื่อนไขต่างๆ
ต่อมาก็ทำการกำหนดคะแนนความยากและง่ายในการพิมพ์แต่ละตัวอักขระบนแป้นพิมพ์เกษมณี โดยกำหนดคะแนนความยากและง่ายได้ดังนี้
- ถ้าไม่มีการกด Shift เลย : 0 คะแนน (พิมพ์ง่ายที่สุด)
- กด Shift 1 ใน 3 ตัวอักษร : 1 คะแนน
- กด Shift ทั้ง 3 ตัวอักษร : 2 คะแนน
- กด Shift 2 ใน 3 ตัวอักษร แบบ Monotonic (sSS หรือ SSs) : 2 คะแนน
- กด Shift 2 ใน 3 ตัวอักษร แบบ Non-monotonic (SsS) : 3 คะแนน (พิมพ์ยากที่สุด เพราะต้องปล่อยและกด Shift ใหม่)
เมื่อมีโมเดลแล้ว ขั้นตอนที่ 2 คือ การหาคลังคำและบทความเพื่อมาใช้เป็นส่วนหนึ่งในการสร้างแป้นพิมพ์ โดยข้อความจากหลายๆ แหล่งมาใช้ ลดความ Bias ของข้อมูล แหล่งของคลังคำมีดังนี้
- 5,000 คำที่ใช้บ่อย จากคลังข้อมูลภาษาไทยแห่งชาติ ภาควิชาภาษาศาสตร์คณะอักษรศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย
- Wongnai Corpus จากแอปรีวิวร้านอาหารชื่อดัง
- Wisesight Sentiment Corpus จากกลุ่ม PyThaiNLP
- ThaiSum ชุดข้อมูลจากเว็บไซต์ไทยรัฐ, ไทยพีบีเอส, ประชาไท และ เดอะแสตนดาร์ด
- ข้อความบนทวิตเตอร์ที่เป็นภาษาไทย ซึ่งมีขนาดรวมแล้วมากกว่า 10 GB
เมื่อทุกอย่างพร้อมแล้ว ก็เริ่มทำการรันโค้ดเพื่อ Optimize แป้นพิมพ์เพื่อให้เกิดแป้นพิมพ์ใหม่ที่เหมาะสมกันได้เลย และเมื่อการประมวลผลเสร็จสิ้นเราก็จะได้แป้นคีย์บอร์ดแบบใหม่ที่เหมาะสมแก่การพิมพ์ภาษาไทยมาแล้ว
ข้อดีที่ได้ประเมินและเปรียบเทียบกับแป้นพิมพ์เกษมณีและปัตตะโชติ
- ตัวอักษรไทยบนแป้นพิมพ์เกษมณีมีความไม่สมดุล โดยหนักไปทางมือขวาถึง 70% แต่แป้นพิมพ์มนูญชัยจะมีน้ำหนักโดยสัดส่วน มือซ้าย:มือขวา อยู่ที่ 47%:53% ทำให้ช่วยให้การพิมพ์ไม่เมื่อยจนเกินไป
- แป้นพิมพ์มนูญชัย พิมพ์ง่ายกว่าแป้นพิมพ์เกษมณีถึง 45% ขณะที่แป้นพิมพ์ปัตตโชติ พิมพ์ง่ายกว่าแป้มพิมพ์เกษมณีเพียง 18.68%
ย้ำเป็น “แป้นพิมม์ทางเลือก” เท่านั้น
คุณมนัสศานติ์ ขอบคุณทุกคนที่ให้สนใจกับแป้นพิมพ์มนูญชัยเป็นอย่างมาก โดนตอนนี้ชุมชนสำหรับพูดคุยแลกเปลี่ยนเกี่ยวกับแป้นพิมพ์มนูญชัย บน Discord มีสมาชิกประมาณ 200-300 คนแล้ว ถือว่าเกินความคาดหมายไปไกลมาก และทำให้ได้ความเห็นใหม่ๆ ที่น่าสนใจ เช่น การพัฒนาให้รองรับกับสมาร์ตโฟน หรือพบว่าบางคนใช้ สระอือ เป็นประจำแต่แป้นพิมพ์กลับนำไปไว้ที่นิ้วก้อย ซึ่งเขาไม่สะดวกพิมพ์ จึงเปิดให้เขาลองย้ายปุ่มบางปุ่มด้วยตนเอง เป็นต้น
อย่างไรก็ดี หากพูดถึงอนาคตของ “แป้นพิมพ์มนูญชัย” สัก 5 ปีหลังจากนี้ คุณมนัสศานติ์มองว่าอาจจะยังไม่เปลี่ยนโครงแป้นพิมพ์นี้ไปอีกสักพักใหญ่ ยกเว้นว่าจะมีการเปลี่ยนแปลงทางด้านภาษาอย่างนัยสำคัญ เช่น ตัว ฃ และ ฅ มีการใช้มากขึ้น อาจจะต้องย้ายออกมาอยู่แป้นพิมพ์หลัก ก็อาจจะเปลี่ยนแปลงได้หากเป็นแบบนั้นจริงๆ
“หลายคนไปมองว่า ผมต้องการให้ทุกคนเปลี่ยนจากแป้นพิมพ์เกษมณีมาใช้มนูญชัย แต่จริงๆ แล้วผมไม่ได้คิดแบบนั้น และก็ไม่คิดว่าจะมีโอกาสได้ด้วย เพราะว่าทุกคนก็ยังคงใช้ Qwerty (แป้นพิมพ์หลักของภาษาอังกฤษ) อยู่ แต่ QWERTY ก็ยังอยู่มาจนทุกวันนี้ และแป้นพิมพ์มนูญชัยก็คงไปอยู่ในจุดที่เป็นทางเลือกเท่านั้น”