การใช้ AI เพื่อถอดรหัสเสียงสุนัข

ช่วยมนุษย์เข้าใจเพื่อน 4 ขามากขึ้น

 

Rada Mihalcea เจ้าหน้าที่ Janice M. Jenkins ศาสตราจารย์วิทยาลัย สาขาวิทยาการคอมพิวเตอร์ และวิศวกรรมศาสตร์ และผู้อำนวยการห้องปฏิบัติการ AI ของ UM กล่าวว่า คุณเคยคิดไหมว่าคุณจะเข้าใจสิ่งที่สุนัขของคุณพยายามจะพูดกับคุณ? นักวิจัยกำลังสำรวจความเป็นไปได้ของ AI โดยพัฒนาเครื่องมือที่สามารถระบุได้ว่าสุนัขต้องการสื่อสานอย่างไร โดยแบบจำลอง AI ที่ได้รับการฝึกมาแต่เดิมเกี่ยวกับคำพูดของมนุษย์ สามารถใช้เป็นจุดเริ่มต้นในการฝึกระบบใหม่ๆ ที่กำหนดเป้าหมายการสื่อสารกับสัตว์ได้

 

“การใช้โมเดลการประมวลผลคำพูดที่ได้รับการฝึกเบื้องต้นเกี่ยวกับคำพูดของมนุษย์ การวิจัยของเราเปิดหน้าต่างใหม่ว่าเราสามารถใช้ประโยชน์จากสิ่งที่เราสร้างขึ้นมาในการประมวลผลคำพูดเพื่อเริ่มทำความเข้าใจความแตกต่างของเสียงเห่าของสุนัขได้อย่างไร”

 

“ยังมีอีกมากที่เรายังไม่รู้เกี่ยวกับสัตว์ที่อยู่ร่วมโลกนี้กับเรา ความก้าวหน้าใน AI สามารถใช้เพื่อปฏิวัติความเข้าใจของเราเกี่ยวกับการสื่อสารกับสัตว์ได้ และการค้นพบของเราชี้ให้เห็นว่าเราอาจไม่จำเป็นต้องเริ่มต้นใหม่ทั้งหมด”

 

สำหรับ อุปสรรคสำคัญอย่างหนึ่งในการพัฒนาโมเดล AI ที่สามารถวิเคราะห์เสียงร้องของสัตว์ได้ ก็คือการขาดข้อมูล ดังนั้น เทคนิคในการวิเคราะห์เสียงร้องของสุนัขจึงพัฒนาได้ยาก และที่มีอยู่ก็ถูกจำกัดเนื่องจากขาดสื่อการฝึกอบรม AI แต่นักวิจัยเอาชนะความท้าทายเหล่านี้ ด้วยการนำแบบจำลองที่มีอยู่ซึ่งเดิมออกแบบมาเพื่อวิเคราะห์คำพูดของมนุษย์มาใช้ใหม่

 

แนวทางนี้ช่วยให้นักวิจัยใช้ประโยชน์จากโมเดลที่แข็งแกร่งซึ่งเป็นแกนหลักของเทคโนโลยีที่ใช้เสียงต่างๆ ที่เราใช้อยู่ในปัจจุบัน รวมถึงการแปลด้วยเสียงเป็นข้อความและการแปลภาษา แบบจำลองเหล่านี้ได้รับการฝึกฝนให้แยกแยะความแตกต่างของคำพูดของมนุษย์ เช่น น้ำเสียง ระดับเสียงสูงต่ำ และสำเนียง และแปลงข้อมูลนี้ให้อยู่ในรูปแบบที่คอมพิวเตอร์สามารถใช้เพื่อระบุคำพูดที่กำลังพูด จดจำคำพูดของแต่ละคน และอื่นๆ

 

“แบบจำลองเหล่านี้สามารถเรียนรู้และเข้ารหัสรูปแบบภาษาและคำพูดของมนุษย์ที่ซับซ้อนอย่างไม่น่าเชื่อ” Abzaliev กล่าว “เราต้องการดูว่าเราสามารถใช้ประโยชน์จากความสามารถนี้ในการแยกแยะและตีความเสียงเห่าของสุนัขได้หรือไม่”

 

นักวิจัยใช้ชุดข้อมูลเสียงร้องของสุนัขที่บันทึกจากสุนัข 74 ตัวที่มีสายพันธุ์ อายุ และเพศต่างกัน ในบริบทที่หลากหลาย Humberto Pérez-Espinosa ผู้ทำงานร่วมกันของ INAOE เป็นผู้นำทีมที่รวบรวมชุดข้อมูล จากนั้น Abzaliev ใช้การบันทึกเพื่อปรับเปลี่ยนโมเดลการเรียนรู้ของเครื่อง ซึ่งเป็นอัลกอริทึมคอมพิวเตอร์ประเภทหนึ่งที่ระบุรูปแบบในชุดข้อมูลขนาดใหญ่ ทีมงานเลือกโมเดลการแสดงคำพูดที่เรียกว่า Wav2Vec2 ซึ่งแต่เดิมได้รับการฝึกฝนเกี่ยวกับข้อมูลคำพูดของมนุษย์

 

ด้วยแบบจำลองนี้ นักวิจัยสามารถสร้างการนำเสนอข้อมูลเสียงที่รวบรวมจากสุนัขและตีความการนำเสนอเหล่านี้ได้ โดยมีประสิทธิภาพเหนือกว่ารุ่นอื่นๆ ที่ได้รับการฝึกอบรมเกี่ยวกับข้อมูลเสียงสุนัขโดยเฉพาะ โดยมีตัวเลขที่แม่นยำถึง 70%

 

“นี่เป็นครั้งแรกที่มีการสร้างเทคนิคที่ปรับให้เหมาะสมที่สุดสำหรับคำพูดของมนุษย์ เพื่อช่วยในการถอดรหัสการสื่อสารกับสัตว์” มิฮาลเซียกล่าว “ผลลัพธ์ของเราแสดงให้เห็นว่าเสียงและรูปแบบที่ได้มาจากคำพูดของมนุษย์สามารถใช้เป็นรากฐานสำหรับการวิเคราะห์และทำความเข้าใจรูปแบบเสียงของเสียงอื่นๆ เช่น การเปล่งเสียงของสัตว์”

 

นอกจากการสร้างแบบจำลองคำพูดของมนุษย์เป็นเครื่องมือที่มีประโยชน์ในการวิเคราะห์การสื่อสารระหว่างสัตว์ ซึ่งอาจเป็นประโยชน์ต่อนักชีววิทยา นักพฤติกรรมสัตว์ และอื่นๆ อีกมากมาย งานวิจัยนี้ยังมีความหมายที่สำคัญต่อสวัสดิภาพสัตว์อีกด้วย การทำความเข้าใจความแตกต่างของเสียงร้องของสุนัขสามารถปรับปรุงวิธีที่มนุษย์ตีความและตอบสนองต่อความต้องการทางอารมณ์และทางกายภาพของสุนัขได้อย่างมาก ซึ่งจะช่วยปรับปรุงการดูแลและป้องกันสถานการณ์ที่อาจเป็นอันตรายได้

 

ที่มา : https://www.sciencedaily.com/releases/2024/06/240604132204.htm

สามารถติดตาม THE DIMENSION ได้ตามช่องทางต่าง ๆ

related news

LATEST NEWS