2006/May/01

จากงานสัมมนา Blognone Tech Day

ลิ่วได้แสดงความประทับใจในการใช้งานอักขระ ZWSP (Zero Width Space) ซึ่งนอกจากจะทำให้เว็บเบราว์เซอร์ตัดคำได้ถูกต้องเป็นที่น่าพอใจแล้ว ยังสามารถทำให้ search engine เข้ามาทำ index กับเนื้อหาภาษาไทย และสามารถค้นหาข้อมูลได้ถูกต้อง


แต่ผมเพิ่งนึกอะไรออกเกี่ยวกับ search engine ก็เลยลองทดสอบดู ด้วยคำค้นหาต่อไปนี้
  • แบบที่ 1: มากที่สุด site:lewcpe.com
  • แบบที่ 2: มาก ที่ สุด site:lewcpe.com

โดยใช้ search engine สามตัว คือ Google, MSN Search, และ Yahoo! Search


Google
http://www.google.com/









MSN Search
http://search.msn.com/









Yahoo! Search
http://search.yahoo.com/








โดยธรรมชาติของภาษาไทย คำ ๆ หนึ่งมักจะประกอบขึ้นจากคำหลายคำ ซึ่งทั้งคำเต็มและคำย่อยนั้นควรจะค้นหาได้ทั้งคู่ แต่อัลกอริทึมของ search engine ยังไม่รู้จักหลักการนี้ของภาษาไทยอย่างเห็นได้ชัด ผมไม่รู้ว่าอย่างภาษาจีนหรือญี่ปุ่นที่มีลักษณะใกล้เคียงกัน search engine จะสามารถค้นหาทั้งคำเต็มและคำย่อยภายในคำ ๆ เดียวกันได้หรือไม่ ซึ่งถ้าทำได้อยู่แล้ว ภาษาไทยก็น่าจะเพิ่มเข้าไปได้เช่นกัน


ไปอ่านเรื่องลิ่ว ๆ กับ ZWSP ได้ที่นี่ครับ


ป.ล. สังเกตไหมว่า MSN Search ไม่มีโลโก้ให้เห็น เพราะดันเอาไปไว้มุมขวาบน :-P

เรื่องพวกนี้เป็นเรื่องที่ช่วยไม่ได้ครับ แต่การใช้ ZWSP จะเพิ่มโอกาสให้มาก เมื่อมันได้รับความนิยม คนค้นหาจะเริ่มค้โดยตัดคำตอนค้นเอง

แต่การค้นแบบคีย์เวิร์ดสำคัญอย่างเช่น คอมพิวเตอร์ อินเทอร์เน็ต อะไรพวกนั้นจะให้ความสำเร็จที่สูงทีเดียว
#1  by  ลิ่ว At 2006-05-01 20:38, 
เป็นระบบที่ดีมากครับ ช่วยทุนแรงได้หลายอย่างแรง

จะลองนำระบบนี้ไปใช้นะครับ
#2  by  ~กวงคุง~ watashi wa HS-TAC desu At 2006-05-01 20:40, 
ยังไม่เคยใช้ แต่ก็รู้สึกว่าเจ๋งดี คงต้องหาเวลามาลองมั่ง

มันจะมีปัญหาตอนตัดคำเอง ไม่ตรงกับ ZWSP แล้วหาไม่เจอปะ? จะมีแบบ plug-in ใส่ firefox ตัดคำให้แล้วค่อยไป search มะ

ตัดคำที่คนสร้างเอกสารก็ดี อาจจะมีโอกาสเลือกการตัดที่ถูกก่อนด้วย?
#3  by  veer At 2006-05-01 21:11, 
อ่าวปัญหาเป้ ก็เขียนให้ดูแล้ว
ทำ plug-in ตัดคำก่อน search อีกตัวน่าจะแก้ได้เลย? ไม่ต้องยุงกะ search engine ด้วย
#4  by  veer At 2006-05-01 21:13, 
คือจากที่ผมได้ฟังจากที่พี่ลิ่วพูดวันโน้นนนน ที่บล็อกนั้น แล้วกลับมาอ่านซ้ำอีกรอบ ก็ยังไม่ค่อยเข้าใจสักเท่าไหร่

zwsp กับการตัดคำภาษาไทย คือการอาศัยฟ้อนท์ที่ได้ built-in, hack มาแล้วยังงั้นหรือ ?

แล้วถ้าเราไม่ใช้ฟ้อนท์ที่พี่ลิ่วแนะนำ ยกตัวอย่างมาล่ะครับ เราจะสามารถใช้การตัดคำ โดย zwsp ได้โดยวิธีใด ?
#5  by  Compman At 2006-05-01 21:40, 
> Compman
ZWSP เป็นอักขระตัวนึงที่มีการกำหนดไว้แล้ว แต่การ implement นั้นไม่สมบูรณ์ ทำให้การนำมาใช้งานจริงยังมีปัญหาอยู่

ลองอ่านในเว็บบล็อกของลิ่วดูนะครับ (ลองเปิดดูโค้ด HTML ของแต่ละอันดูด้วย)

http://lewcpe.com/blog/archives/33
http://lewcpe.com/blog/archives/34
http://lewcpe.com/blog/archives/35
#6  by  PaePae At 2006-05-01 21:55, 
paepae: เปิดดูซอร์สโค้ด HTML แล้วถึงกับเช็ดโด้ ร้องจ๊ากเลย
#7  by  Compman At 2006-05-02 22:19, 
เขียนเรื่อพวกนี้ในบล็อกตัวเองมานาน ไม่ค่อยมีใครสน

แต่มีคนมาคุยกันในบล็อกพี่เป้แฮะ

บล็อกผมมีคนตอบแต่ตอนเขียนเรื่องเปลี่ยวๆ
#8  by  ลิ่ว At 2006-05-08 22:37, 

<< Home