Home » Amazon สอน Alexa ให้พูดใน Brogue ชาวไอริชได้อย่างไร

Amazon สอน Alexa ให้พูดใน Brogue ชาวไอริชได้อย่างไร

โดย admin
0 ความคิดเห็น

เช่นเดียวกับ Henry Higgins นักสัทศาสตร์จากบทละครของ George Bernard Shaw เรื่อง “Pygmalion” Marius Cotescu และ Georgi Tinchev เพิ่งแสดงให้เห็นว่านักเรียนของพวกเขาพยายามเอาชนะความยากลำบากในการออกเสียงอย่างไร

นักวิทยาศาสตร์ข้อมูลสองคนที่ทำงานให้กับ Amazon ในยุโรปกำลังสอน Alexa ซึ่งเป็นผู้ช่วยดิจิทัลของบริษัท หน้าที่ของพวกเขาคือช่วยให้ Alexa เชี่ยวชาญภาษาอังกฤษสำเนียงไอริชด้วยความช่วยเหลือของปัญญาประดิษฐ์และการบันทึกจากเจ้าของภาษา

ในระหว่างการสาธิต Alexa พูดถึงค่ำคืนที่น่าจดจำ “ปาร์ตี้เมื่อคืนนี้ช่างบ้าบอสิ้นดี” อเล็กซาพูดเสียงเบาโดยใช้คำภาษาไอริชเพื่อความสนุกสนาน “เราได้ไอศกรีมระหว่างทางกลับบ้าน และเรามีความสุขมาก”

นาย Tinchev ส่ายหัว Alexa ทิ้ง “r” ใน “ปาร์ตี้” ทำให้คำนี้ฟังดูเรียบๆ เหมือนปะ-ตี อังกฤษเกินไป เขาสรุป

นักเทคโนโลยีเหล่านี้เป็นส่วนหนึ่งของทีมที่ Amazon ที่ทำงานด้านวิทยาการข้อมูลที่ท้าทายซึ่งเรียกว่าการแยกเสียง เป็นปัญหายุ่งยากที่ได้รับความเกี่ยวข้องใหม่ท่ามกลางคลื่นของการพัฒนา AI โดยนักวิจัยเชื่อว่าปริศนาคำพูดและเทคโนโลยีสามารถช่วยทำให้อุปกรณ์ที่ขับเคลื่อนด้วย AI, บอทและเครื่องสังเคราะห์เสียงพูดสามารถสนทนาได้มากขึ้น นั่นคือสามารถดึงความหลากหลายจากภูมิภาคต่างๆ สำเนียง

การแก้ปัญหาความไม่ชัดเจนของเสียงเกี่ยวข้องกับมากกว่าการเข้าใจคำศัพท์และไวยากรณ์ ระดับเสียง เสียงต่ำ และสำเนียงของผู้พูดมักจะให้คำที่มีความหมายเหมาะสมและมีน้ำหนักทางอารมณ์ นักภาษาศาสตร์เรียกคุณสมบัติภาษานี้ว่า “ฉันทลักษณ์” ซึ่งเป็นสิ่งที่เครื่องจักรมีช่วงเวลาที่ยากลำบากในการเรียนรู้

ในช่วงไม่กี่ปีที่ผ่านมา ต้องขอบคุณความก้าวหน้าของ AI, ชิปคอมพิวเตอร์ และฮาร์ดแวร์อื่นๆ ทำให้นักวิจัยก้าวไปอีกขั้นในการไขปัญหาการแยกเสียงออกจากกัน โดยเปลี่ยนคำพูดที่สร้างจากคอมพิวเตอร์ให้กลายเป็นสิ่งที่น่าฟังยิ่งขึ้น

ในที่สุดงานดังกล่าวอาจมาบรรจบกันพร้อมกับการระเบิดของ “เจเนอเรทีฟเอไอ” ซึ่งเป็นเทคโนโลยีที่ช่วยให้แชทบอทสามารถสร้างการตอบสนองของตนเองได้ นักวิจัยกล่าว Chatbot เช่น ChatGPT และ Bard สักวันหนึ่งอาจดำเนินการตามคำสั่งเสียงของผู้ใช้อย่างเต็มที่และตอบกลับด้วยวาจา ในขณะเดียวกัน ผู้ช่วยด้านเสียงอย่าง Alexa และ Siri ของ Apple จะกลายเป็นผู้สื่อสารมากขึ้น ซึ่งอาจกระตุ้นความสนใจของผู้บริโภคในกลุ่มเทคโนโลยีที่ดูเหมือนจะหยุดชะงักลงอีกครั้ง นักวิเคราะห์กล่าว

การให้ผู้ช่วยเสียงเช่น Alexa, Siri และ Google Assistant พูดได้หลายภาษานั้นเป็นกระบวนการที่มีราคาแพงและยืดเยื้อ บริษัทด้านเทคโนโลยีจ้างนักพากย์มาบันทึกเสียงพูดหลายร้อยชั่วโมง ซึ่งช่วยสร้างเสียงสังเคราะห์สำหรับผู้ช่วยดิจิทัล ระบบ AI ขั้นสูงที่เรียกว่า “โมเดลการอ่านออกเสียงข้อความ” — เนื่องจากพวกมันแปลงข้อความเป็นเสียงสังเคราะห์ที่ฟังดูเป็นธรรมชาติ — เป็นเพียงการเริ่มต้นในการปรับปรุง กระบวนการนี้

เทคโนโลยี “ตอนนี้สามารถสร้างเสียงของมนุษย์และเสียงสังเคราะห์ตามการป้อนข้อความในภาษา สำเนียง และภาษาถิ่นต่างๆ” Marion Labour นักยุทธศาสตร์อาวุโสจาก Deutsche Bank Research กล่าว

Amazon ถูกกดดันให้ไล่ตามคู่แข่งอย่าง Microsoft และ Google ในการแข่งขัน AI ในเดือนเมษายน Andy Jassy ผู้บริหารระดับสูงของ Amazon กล่าวกับนักวิเคราะห์ของวอลล์สตรีท ว่าบริษัทวางแผนที่จะทำให้ Alexa “เชิงรุกและสนทนาได้มากขึ้น” ด้วยความช่วยเหลือของ AI เชิงกำเนิดที่ซับซ้อน และ Rohit Prasad หัวหน้านักวิทยาศาสตร์ของ Amazon สำหรับ Alexa บอกกับ CNBC ในเดือนพฤษภาคมที่เขาเห็นผู้ช่วยเสียงเป็นเสียงที่เปิดใช้งาน “AI ส่วนบุคคลพร้อมใช้งานทันที”

Irish Alexa เปิดตัวเชิงพาณิชย์ในเดือนพฤศจิกายน หลังจากฝึกฝนเก้าเดือนในการเข้าใจสำเนียงไอริชแล้วจึงพูดได้

“สำเนียงแตกต่างจากภาษา” คุณปราสให้สัมภาษณ์ เทคโนโลยี AI ต้องเรียนรู้ที่จะแยกสำเนียงออกจากส่วนอื่นๆ ของคำพูด เช่น น้ำเสียงและความถี่ ก่อนที่พวกมันจะสามารถเลียนแบบลักษณะเฉพาะของภาษาถิ่นนั้นๆ ได้ ตัวอย่างเช่น บางที “a” อาจจะดูเรียบกว่า และ “t’s” จะออกเสียงแบบบังคับมากกว่า

ระบบเหล่านี้ต้องหารูปแบบเหล่านี้ “เพื่อให้คุณสังเคราะห์สำเนียงใหม่ทั้งหมดได้” เขากล่าว “นั่นเป็นเรื่องยาก”

Harder ยังคงพยายามหาเทคโนโลยีเพื่อเรียนรู้สำเนียงใหม่ด้วยตัวเองเป็นส่วนใหญ่ จากรูปแบบการพูดที่มีเสียงแตกต่างกัน นั่นคือสิ่งที่ทีมของ Mr. Cotescu พยายามสร้าง Irish Alexa พวกเขาพึ่งพารูปแบบการพูดที่มีอยู่ซึ่งเน้นสำเนียงอังกฤษ-อังกฤษเป็นหลัก โดยมีสำเนียงอเมริกัน แคนาดา และออสเตรเลียที่เล็กกว่ามาก เพื่อฝึกให้พูดภาษาอังกฤษแบบไอริชได้

ทีมงานต้องต่อสู้กับความท้าทายด้านภาษาต่างๆ ของภาษาอังกฤษแบบไอริช ชาวไอริชมักจะลดเสียง “h” ใน “th” เช่น ออกเสียงตัวอักษรยาก “t” หรือ “d” ทำให้ “bath” ฟังดูเหมือน “bat” หรือแม้แต่ “bad” ภาษาอังกฤษแบบไอริชก็ออกเสียงแบบ rhotic เช่นกัน หมายความว่าตัว “r” ออกเสียงมากเกินไป นั่นหมายความว่า “r” ใน “ปาร์ตี้” จะแตกต่างกว่าสิ่งที่คุณอาจได้ยินจากปากของชาวลอนดอน Alexa ต้องเรียนรู้คุณสมบัติการพูดเหล่านี้และฝึกฝนให้เชี่ยวชาญ

ภาษาอังกฤษแบบไอริช Mr. Cotescu ซึ่งเป็นชาวโรมาเนียและเป็นนักวิจัยหลักในทีม Alexa ของไอร์แลนด์กล่าวว่า “เป็นเรื่องยาก”

รูปแบบการพูดที่เสริมทักษะการพูดของ Alexa นั้นก้าวหน้ามากขึ้นในช่วงไม่กี่ปีที่ผ่านมา ในปี 2020 นักวิจัยของ Amazon สอน Alexa พูดภาษาสเปนได้คล่อง จากโมเดลที่พูดภาษาอังกฤษได้

Mr. Cotescu และทีมเห็นว่าสำเนียงเป็นด่านต่อไปของความสามารถในการพูดของ Alexa พวกเขาออกแบบให้ Alexa ของชาวไอริชพึ่งพา AI มากกว่านักแสดงในการสร้างแบบจำลองคำพูด ผลที่ตามมาคือ Alexa ชาวไอริชได้รับการฝึกฝนในคลังข้อมูลที่มีขนาดค่อนข้างเล็ก – ประมาณ 24 ชั่วโมงในการบันทึกเสียงโดยนักพากย์ที่ท่อง 2,000 คำพูดในภาษาอังกฤษสำเนียงไอริช

ในตอนเริ่มต้น เมื่อนักวิจัยของ Amazon ป้อนไฟล์บันทึกเสียงของชาวไอริชให้กับ Alexa ชาวไอริชที่ยังเรียนรู้อยู่ สิ่งประหลาดบางอย่างก็เกิดขึ้น

ตัวอักษรและพยางค์หลุดออกจากการตอบกลับในบางครั้ง “S” บางครั้งก็ติดกัน คำหรือสองคำ ซึ่งบางครั้งเป็นคำสำคัญ ถูกพึมพำอย่างอธิบายไม่ถูกและเข้าใจยาก อย่างน้อยในกรณีหนึ่ง เสียงผู้หญิงของ Alexa ลดลงสองสามอ็อกเทฟ ทำให้ฟังดูเป็นผู้ชายมากขึ้น แย่กว่านั้น เสียงของผู้ชายฟังดูเป็นคนอังกฤษอย่างชัดเจน เป็นเรื่องงี่เง่าที่อาจทำให้ชาวไอริชบางบ้านต้องเลิกคิ้ว

“พวกมันคือกล่องดำขนาดใหญ่” นาย Tinchev ชาวบัลแกเรีย ซึ่งเป็นนักวิทยาศาสตร์หลักของ Amazon ในโครงการ กล่าวถึงแบบจำลองการพูด “คุณต้องมีการทดลองมากมายเพื่อปรับแต่งมัน”

นั่นคือสิ่งที่นักเทคโนโลยีทำเพื่อแก้ไขมารยาท “ปาร์ตี้” ของ Alexa พวกเขาแยกแยะคำพูด คำต่อคำ ฟอนิม (เสียงที่เล็กที่สุดของคำ) โดยใช้ฟอนิมเพื่อระบุตำแหน่งที่ Alexa ลื่นไถลและปรับแต่งอย่างละเอียด จากนั้นพวกเขาก็ป้อนข้อมูลเสียงที่บันทึกในรูปแบบคำพูดของ Alexa ของไอริชเพิ่มเติมเพื่อแก้ไขการออกเสียงผิด

ผลลัพธ์: ส่งคืน “r” ใน “ปาร์ตี้” แต่แล้ว “p” ก็หายไป

ดังนั้นนักวิทยาศาสตร์ข้อมูลจึงต้องผ่านขั้นตอนเดิมอีกครั้ง ในที่สุดพวกเขาก็มุ่งเน้นไปที่หน่วยเสียงที่มี “p” ที่ขาดหายไป จากนั้นพวกเขาก็ปรับแต่งโมเดลเพิ่มเติมเพื่อให้เสียง “p” กลับมาและ “r” ไม่หายไป ในที่สุด Alexa ก็เรียนรู้ที่จะพูดแบบชาวดับลิน

นักภาษาศาสตร์ชาวไอริช 2 คน ได้แก่ Elaine Vaughan ผู้สอนที่มหาวิทยาลัย Limerick และ Kate Tallon นักศึกษาปริญญาเอกที่ทำงานในห้องปฏิบัติการ Phonetics and Speech ที่ Trinity College Dublin ได้ให้คะแนนสำเนียงของ Alexa แก่ชาวไอริชตั้งแต่นั้นเป็นต้นมา พวกเขากล่าวว่าวิธีที่ Alexa ชาวไอริชเน้นเสียง “r” และ “t’s” ที่อ่อนลง และ Amazon ก็ออกเสียงสำเนียงได้ถูกต้องทั้งหมด

“ฟังดูเป็นเรื่องจริงสำหรับฉัน” นางทาลลอนกล่าว

นักวิจัยของ Amazon กล่าวว่าพวกเขาพอใจกับผลตอบรับเชิงบวกอย่างมาก แบบจำลองการพูดของพวกเขาทำให้สำเนียงไอริชแยกออกจากกันได้อย่างรวดเร็ว ทำให้พวกเขามีความหวังว่าพวกเขาจะสามารถทำซ้ำสำเนียงที่อื่นได้

“เรายังวางแผนที่จะขยายวิธีการของเราไปยังสำเนียงของภาษาอื่นที่ไม่ใช่ภาษาอังกฤษ” พวกเขาเขียนไว้ใน a เอกสารวิจัยเดือนมกราคม เกี่ยวกับโครงการไอริช อเล็กซ่า

You may also like

ทิ้งข้อความไว้

Copyright ©️ All rights reserved. | Best of Thailand