โซเวนคอร์สเบ้าสี่ที่อาจจะได้เรียนรู้ไป
เนื่องจากอยากรู้อยากเห็น ฉันก็เริ่มสงสัยเกี่ยวกับสิ่งที่ GPT อาจจะได้ศึกษามา การค้นหาข้อมูลและประเภทที่เรียนรู้อย่างเรียบง่ายดูน่าเบื่อเล็กน้อย ดังนั้นฉันจึงไปค้นหาว่าประเภทของปัญหาชนิดใดกำลังถูกพูดถึงในสาขาการวิจัยด้านการประมวลผลภาษาธรรมชาติ
เว็บไซต์ Papers with Code จัดประเภท 583 หัวข้อการวิจัยด้านการประมวลผลภาษาธรรมชาติ แต่ละหัวข้อหมายถึง “นักวิจัยทั่วโลกกำลังศึกษาคำถามเดียวกัน” น่าจะเป็นประเภทปัญหาที่รวมอยู่ในหลักสูตรเล็กน้อยของสิ่งที่ GPT เรียนรู้ด้วยเนื้อหาขนาดใหญ่ของมัน
ในนั้นฉันเลือกเอาเจ็ดหัวข้อที่เกี่ยวข้องกับชีวิตประจำวันมา
การสร้างข้อความจากข้อมูล (Data to-Text Generation)
หัวข้อการวิจัยนี้เกี่ยวข้องกับการสร้างข้อความที่เป็นลักษณะของข้อมูล “ตาราง” ที่พบเห็นบ่อย นี่เป็นการศึกษาที่จำเป็นสำหรับผู้วิเคราะห์ข้อมูลเช่นฉันเอง ในเวลาเดียวกันเป็นการศึกษาที่มีผลต่องาน (GPT ไม่ใช่สิ่งเดียวที่มีผลต่องาน ใช่ไหมล่ะ?).
การอธิบายและแปลความของข้อมูลอาจเป็นเรื่องยากสำหรับเครื่องจักรถ้าถูกให้ความอิสระมากเกินไปที่จะจินตนาการหรือฉีกตัวเอง เกินกว่านั้นยังต้องถูกแสดงอย่างถูกต้องด้วย และการอธิบายนี้ไม่ง่ายแน่นอน ต้องแก้ไขหลายปัญหาย่อยพร้อมกัน เช่นว่าจะอธิบายอะไร ให้ให้ความสำคัญกับสิ่งใดและใช้นิพจน์ใดเพื่อเพิ่มความชัดเจน
การเปลี่ยนสไตล์ข้อความ (Text Style Transfer)
ถ้าการศึกษาด้านการพูดด้วยเสียงมี “การเลียนแบบเสียงพูด” ในการศึกษา แล้วในการประมวลผลภาษาธรรมชาติก็มี “การเปลี่ยนสไตล์” ตัวอย่างเช่นเทคนิคการเปลี่ยนสไตล์ของประโยคให้อยู่ในสไตล์ของคนพูดที่ต่างกัน พวกเราสามารถเปลี่ยน “ลักษณะเสียงสบายๆ” เป็น “พูดด้วยความโกรธ” หรือ “สไตล์ชายเป็นสไตล์ผู้หญิง” หรือ “คำและประโยคเหมือนเด็ก” เป็น “ไวยากรณ์ของผู้ใหญ่”
ตัวอย่างเช่นการแปลงคำอธิบายเทคนิคของ Elon Musk เกี่ยวกับ SpaceX ให้เป็นสไตล์ของการพูดของ Harry Potter นี่คือเทคนิคในการเปลี่ยนสไตล์ของผู้พูดที่แตกต่างกันในขณะที่ยังคงความหมายเดิมของประโยค
การแปลภาษาทางคลินิก (Clinical Language Translation)
เมื่ออาการของเราเกินไปเมื่อเทียบกับโรคหวัดที่เบาๆ แม้ว่าเราจะได้ยินการวินิจฉัยของแพทย์ในภาษาเกิดจากตนเอง แต่อาจจะรู้สึกเหมือนภาษาต่างดาว สำหรับการแก้ไขปัญหานี้จึงมีสาขาวิชาการวิจัยที่แปลงแปลงข้อความทางการแพทย์ที่มีคำศัพท์ทางคลินิกเต็มไปด้วยความเข้าใจของประชาชนทั่วไป
การจัดหมวดหมู่เจตนา (Intent Classification)
ง่ายๆ คือการศึกษาเกี่ยวกับวิธีการเข้าใจว่าคนหนึ่งหมายถึงอะไร แม้ว่าเขาจะไม่พูดออกมาอย่างชัดเจน เช่นในบริการการค้ามันสามารถช่วยระบุได้ว่าใครบางคนต้องการที่จะซื้อสินค้า อัปเกรดไปยังการสมัครสมาชิกระดับสูงกว่า หรือยกเลิกการสมัครสมาชิก เมื่อเป็นแชทบอทก็สามารถระบุหัวข้อที่เกี่ยวข้องจากคำไม่กี่คำที่ผู้ใช้ทิ้งไว้ และแนะนำข้อมูลที่ผู้ใช้อาจพบประโยชน์
การสมบูรณ์เรื่องราว (Story Completion)
การวิจัยนี้มุ่งเน้นในการเติมส่วนที่ขาดหายไปของเรื่องราว แม้ว่าเรื่องราวจะไม่สมบูรณ์อย่างสมบูรณ์ สิ่งที่รวมอยู่ในการวิจัยนี้จะเป็นการคาดเดาและเชื่อมโยงส่วนที่ขาดหายไปของข้อความหลัก ไม่ใช่เพียงส่วนสรุป ถ้าเรื่องราวมีคำศัพท์ทางเทคนิคมากเกินไปหรือต้องการความรู้พื้นฐานมากมายอาจจะต้องให้คำอธิบายเพิ่มเติมเพื่อช่วยให้อ่านได้อย่างราบรื่น
ความเป็นประโยชน์ของการวิจัยนี้ไม่เพียงแค่ในนวนิยายเท่านั้น แต่ยังสามารถนำไปใช้ในชีวิตประจำวันได้อีกด้วย ผู้คนมักถูก “คำสาปของความรู้” คาดหวังว่าผู้อ่านคงรู้สึกช่วยเหลือมากๆ หากโมเดลการสมบูรณ์เรื่องราวสามารถเป็นกลางในการสื่อสารความรู้ระหว่างผู้คน
การเล่าเรื่องผ่านภาพ (Visual Storytelling)
ถ้ามีภาพถ่ายของคนวิ่งออกจากสถานีแมนฮัตตัน สามารถเขียนอธิบายเป็นเวอร์ชันสองแบบได้ดังนี้
- “มีคนวิ่งที่ทางออกที่สองของสถานีแมนฮัตตัน มีต้นไม้ เส้นทาง และรถยนต์อยู่ข้างๆ”
- “มาสายอีกแล้ววันนี้”
ผู้คนสามารถเข้าใจบริบทและสร้างเรื่องราวจากภาพเดียวแบบนี้ แต่มันเป็นงานที่ยากลำบากสำหรับปัญญาประดิษฐ์ และการให้บริบทเพื่อเชื่อมต่อภาพหลายๆ ภาพเข้าด้วยกันเพื่อสร้างเรื่องราวที่สอดคล้องกัน และสุดท้ายก็สร้างประโยคออกมา นั่นเป็นระดับอื่นของการศึกษาเรื่องการเล่าเรื่องผ่านภาพ
การสร้างข้อความจากแนวความคิด (Concept-To-Text Generation)
“การสร้างข้อความจากแนวความคิด” นั้นเล็กน้อยต่างจาก “การสมบูรณ์เรื่องราว” ที่ถูกกล่าวถึงไปก่อนหน้านี้ ในขณะที่การศึกษาเรื่องการสมบูรณ์เรื่องราวนั้นจะเติมส่วนที่ว่างเปล่า การศึกษาที่นำเสนอในครั้งนี้จะสร้างประโยคที่น่าจะเป็นไปได้ด้วยคำให้เพียงไม่กี่คำ
ครั้งนี้ฉันก็ได้มอบหมายงานให้กับ GPT4 โดยถามให้สร้างประโยคด้วยคำสี่คำ: “เช้า, กาแฟ, ขนมปัง, รถไฟใต้ดิน” ดูเหมือนง่ายสำหรับ GPT ในขณะนี้
เขาตื่นขึ้นตรู้สติเช้าในเช้าวันพรุ่งนี้, เทิดทูนตัวเองกับกาแฟแก้วเดียว, กินขนมปังอบอุ่นหนึ่งคำ, แล้วก็ไปสถานีรถไฟใต้ดินเพื่อทำงาน
เนื้อหาที่เลือกมาจากบทความนี้เป็นเพียงเล็กน้อยในหลายๆ หัวข้อการวิจัยต่างๆ นอกจากการประมวลผลภาษาธรรมชาติ สาขาวิจัยด้านปัญญาประดิษฐ์ยังรวมถึงการรู้จำเสียงพูด การสร้างภาพ/วิดีโอ และอื่นๆ ที่ไม่มีที่สิ้นสุด คุณยังสามารถคิดค้นไอเดียอื่นๆ ได้โดยการเรียกดูหัวข้อที่ได้รับการศึกษาจนถึงตอนนี้และคิดว่า “ฉันได้เรียนรู้ประเภทเหล่านี้แล้ว ดังนั้นฉันสามารถขยายด้วยประเภทของคำถามเหล่านั้น” โปรดเยี่ยมชมเว็บไซต์นี้เพื่อสำรวจความคิดที่ยอดเยี่ยมบางอย่างด้วย