โซเวนคอร์สเบ้าสี่ที่อาจจะได้เรียนรู้ไป

ChatGPT's Seven-Curriculum That It May Have Learned

เนื่องจากอยากรู้อยากเห็น ฉันก็เริ่มสงสัยเกี่ยวกับสิ่งที่ GPT อาจจะได้ศึกษามา การค้นหาข้อมูลและประเภทที่เรียนรู้อย่างเรียบง่ายดูน่าเบื่อเล็กน้อย ดังนั้นฉันจึงไปค้นหาว่าประเภทของปัญหาชนิดใดกำลังถูกพูดถึงในสาขาการวิจัยด้านการประมวลผลภาษาธรรมชาติ

เว็บไซต์ Papers with Code จัดประเภท 583 หัวข้อการวิจัยด้านการประมวลผลภาษาธรรมชาติ แต่ละหัวข้อหมายถึง “นักวิจัยทั่วโลกกำลังศึกษาคำถามเดียวกัน” น่าจะเป็นประเภทปัญหาที่รวมอยู่ในหลักสูตรเล็กน้อยของสิ่งที่ GPT เรียนรู้ด้วยเนื้อหาขนาดใหญ่ของมัน

ในนั้นฉันเลือกเอาเจ็ดหัวข้อที่เกี่ยวข้องกับชีวิตประจำวันมา

การสร้างข้อความจากข้อมูล (Data to-Text Generation)

ChatGPT's Seven-Curriculum That It May Have Learned - Data to Text Generation

หัวข้อการวิจัยนี้เกี่ยวข้องกับการสร้างข้อความที่เป็นลักษณะของข้อมูล “ตาราง” ที่พบเห็นบ่อย นี่เป็นการศึกษาที่จำเป็นสำหรับผู้วิเคราะห์ข้อมูลเช่นฉันเอง ในเวลาเดียวกันเป็นการศึกษาที่มีผลต่องาน (GPT ไม่ใช่สิ่งเดียวที่มีผลต่องาน ใช่ไหมล่ะ?).

การอธิบายและแปลความของข้อมูลอาจเป็นเรื่องยากสำหรับเครื่องจักรถ้าถูกให้ความอิสระมากเกินไปที่จะจินตนาการหรือฉีกตัวเอง เกินกว่านั้นยังต้องถูกแสดงอย่างถูกต้องด้วย และการอธิบายนี้ไม่ง่ายแน่นอน ต้องแก้ไขหลายปัญหาย่อยพร้อมกัน เช่นว่าจะอธิบายอะไร ให้ให้ความสำคัญกับสิ่งใดและใช้นิพจน์ใดเพื่อเพิ่มความชัดเจน

การเปลี่ยนสไตล์ข้อความ (Text Style Transfer)

ChatGPT's Seven-Curriculum That It May Have Learned - Text Style Transfer

ถ้าการศึกษาด้านการพูดด้วยเสียงมี “การเลียนแบบเสียงพูด” ในการศึกษา แล้วในการประมวลผลภาษาธรรมชาติก็มี “การเปลี่ยนสไตล์” ตัวอย่างเช่นเทคนิคการเปลี่ยนสไตล์ของประโยคให้อยู่ในสไตล์ของคนพูดที่ต่างกัน พวกเราสามารถเปลี่ยน “ลักษณะเสียงสบายๆ” เป็น “พูดด้วยความโกรธ” หรือ “สไตล์ชายเป็นสไตล์ผู้หญิง” หรือ “คำและประโยคเหมือนเด็ก” เป็น “ไวยากรณ์ของผู้ใหญ่”

ตัวอย่างเช่นการแปลงคำอธิบายเทคนิคของ Elon Musk เกี่ยวกับ SpaceX ให้เป็นสไตล์ของการพูดของ Harry Potter นี่คือเทคนิคในการเปลี่ยนสไตล์ของผู้พูดที่แตกต่างกันในขณะที่ยังคงความหมายเดิมของประโยค

การแปลภาษาทางคลินิก (Clinical Language Translation)

ChatGPT's Seven-Curriculum That It May Have Learned - Clinical Language Translation

เมื่ออาการของเราเกินไปเมื่อเทียบกับโรคหวัดที่เบาๆ แม้ว่าเราจะได้ยินการวินิจฉัยของแพทย์ในภาษาเกิดจากตนเอง แต่อาจจะรู้สึกเหมือนภาษาต่างดาว สำหรับการแก้ไขปัญหานี้จึงมีสาขาวิชาการวิจัยที่แปลงแปลงข้อความทางการแพทย์ที่มีคำศัพท์ทางคลินิกเต็มไปด้วยความเข้าใจของประชาชนทั่วไป

การจัดหมวดหมู่เจตนา (Intent Classification)

ChatGPT's Seven-Curriculum That It May Have Learned - Intent Classification

ง่ายๆ คือการศึกษาเกี่ยวกับวิธีการเข้าใจว่าคนหนึ่งหมายถึงอะไร แม้ว่าเขาจะไม่พูดออกมาอย่างชัดเจน เช่นในบริการการค้ามันสามารถช่วยระบุได้ว่าใครบางคนต้องการที่จะซื้อสินค้า อัปเกรดไปยังการสมัครสมาชิกระดับสูงกว่า หรือยกเลิกการสมัครสมาชิก เมื่อเป็นแชทบอทก็สามารถระบุหัวข้อที่เกี่ยวข้องจากคำไม่กี่คำที่ผู้ใช้ทิ้งไว้ และแนะนำข้อมูลที่ผู้ใช้อาจพบประโยชน์

การสมบูรณ์เรื่องราว (Story Completion)

ChatGPT's Seven-Curriculum That It May Have Learned - Story Completion

การวิจัยนี้มุ่งเน้นในการเติมส่วนที่ขาดหายไปของเรื่องราว แม้ว่าเรื่องราวจะไม่สมบูรณ์อย่างสมบูรณ์ สิ่งที่รวมอยู่ในการวิจัยนี้จะเป็นการคาดเดาและเชื่อมโยงส่วนที่ขาดหายไปของข้อความหลัก ไม่ใช่เพียงส่วนสรุป ถ้าเรื่องราวมีคำศัพท์ทางเทคนิคมากเกินไปหรือต้องการความรู้พื้นฐานมากมายอาจจะต้องให้คำอธิบายเพิ่มเติมเพื่อช่วยให้อ่านได้อย่างราบรื่น

ความเป็นประโยชน์ของการวิจัยนี้ไม่เพียงแค่ในนวนิยายเท่านั้น แต่ยังสามารถนำไปใช้ในชีวิตประจำวันได้อีกด้วย ผู้คนมักถูก “คำสาปของความรู้” คาดหวังว่าผู้อ่านคงรู้สึกช่วยเหลือมากๆ หากโมเดลการสมบูรณ์เรื่องราวสามารถเป็นกลางในการสื่อสารความรู้ระหว่างผู้คน

การเล่าเรื่องผ่านภาพ (Visual Storytelling)

ChatGPT's Seven-Curriculum That It May Have Learned - Visual Storytelling_01

ถ้ามีภาพถ่ายของคนวิ่งออกจากสถานีแมนฮัตตัน สามารถเขียนอธิบายเป็นเวอร์ชันสองแบบได้ดังนี้

ChatGPT's Seven-Curriculum That It May Have Learned - Visual Storytelling_02
  1. “มีคนวิ่งที่ทางออกที่สองของสถานีแมนฮัตตัน มีต้นไม้ เส้นทาง และรถยนต์อยู่ข้างๆ”
  2. “มาสายอีกแล้ววันนี้”

ผู้คนสามารถเข้าใจบริบทและสร้างเรื่องราวจากภาพเดียวแบบนี้ แต่มันเป็นงานที่ยากลำบากสำหรับปัญญาประดิษฐ์ และการให้บริบทเพื่อเชื่อมต่อภาพหลายๆ ภาพเข้าด้วยกันเพื่อสร้างเรื่องราวที่สอดคล้องกัน และสุดท้ายก็สร้างประโยคออกมา นั่นเป็นระดับอื่นของการศึกษาเรื่องการเล่าเรื่องผ่านภาพ

การสร้างข้อความจากแนวความคิด (Concept-To-Text Generation)

ChatGPT's Seven-Curriculum That It May Have Learned - Concept-To-Text Generation

“การสร้างข้อความจากแนวความคิด” นั้นเล็กน้อยต่างจาก “การสมบูรณ์เรื่องราว” ที่ถูกกล่าวถึงไปก่อนหน้านี้ ในขณะที่การศึกษาเรื่องการสมบูรณ์เรื่องราวนั้นจะเติมส่วนที่ว่างเปล่า การศึกษาที่นำเสนอในครั้งนี้จะสร้างประโยคที่น่าจะเป็นไปได้ด้วยคำให้เพียงไม่กี่คำ

ครั้งนี้ฉันก็ได้มอบหมายงานให้กับ GPT4 โดยถามให้สร้างประโยคด้วยคำสี่คำ: “เช้า, กาแฟ, ขนมปัง, รถไฟใต้ดิน” ดูเหมือนง่ายสำหรับ GPT ในขณะนี้

เขาตื่นขึ้นตรู้สติเช้าในเช้าวันพรุ่งนี้, เทิดทูนตัวเองกับกาแฟแก้วเดียว, กินขนมปังอบอุ่นหนึ่งคำ, แล้วก็ไปสถานีรถไฟใต้ดินเพื่อทำงาน


เนื้อหาที่เลือกมาจากบทความนี้เป็นเพียงเล็กน้อยในหลายๆ หัวข้อการวิจัยต่างๆ นอกจากการประมวลผลภาษาธรรมชาติ สาขาวิจัยด้านปัญญาประดิษฐ์ยังรวมถึงการรู้จำเสียงพูด การสร้างภาพ/วิดีโอ และอื่นๆ ที่ไม่มีที่สิ้นสุด คุณยังสามารถคิดค้นไอเดียอื่นๆ ได้โดยการเรียกดูหัวข้อที่ได้รับการศึกษาจนถึงตอนนี้และคิดว่า “ฉันได้เรียนรู้ประเภทเหล่านี้แล้ว ดังนั้นฉันสามารถขยายด้วยประเภทของคำถามเหล่านั้น” โปรดเยี่ยมชมเว็บไซต์นี้เพื่อสำรวจความคิดที่ยอดเยี่ยมบางอย่างด้วย

Leave a Comment

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *

Scroll to Top