Microsoft VASA สร้าง Deepfakes ได้โดยใช้เพียงภาพถ่ายและแทร็กเสียงเดียว

Microsoft VASA สร้าง Deepfakes ได้โดยใช้เพียงภาพถ่ายและแทร็กเสียงเดียว

Microsoft Research Asia ได้เปิดตัวเอกสาร White Paper เกี่ยวกับแอปพลิเคชัน AI ที่บริษัทกำลังพัฒนา โปรแกรมนี้เรียกว่า VASA-1 และสามารถสร้างวิดีโอที่สมจริงมาก (Deepfakes) จากภาพใบหน้าและเสียงเพลงประกอบเพียงภาพเดียว ไม่เพียงเท่านั้นซอฟต์แวร์ยังสามารถสร้างวิดีโอและสลับใบหน้าได้แบบเรียลไทม์อีกด้วย

Visual Affective Skills Animator หรือ VASA เป็นเฟรมเวิร์กแมชชีนเลิร์นนิง (Machine Learning) ที่วิเคราะห์ภาพถ่ายใบหน้าแล้วทำให้เคลื่อนไหวเป็นเสียง โดยประสานการเคลื่อนไหวของริมฝีปากและปากกับเสียง นอกจากนี้ยังจำลองการแสดงออกทางสีหน้า การเคลื่อนไหวของศีรษะ และแม้กระทั่งการเคลื่อนไหวของร่างกายที่มองไม่เห็นอีกด้วย

อย่างไรก็ตาม มันยังทำงานได้ไม่สมบูรณ์ โดยเฉพาะรายละเอียดเล็กๆ น้อยๆ เช่น นิ้ว และ ฟัน หากสังเกตอย่างใกล้ชิตก็จะพบว่ายังเคลื่อนไหวแบบไม่เป็นธรรมชาติ

สำหรับเทคโนโลยี Deepfakes ปัจจุบันยังมีความกังวลว่าจะถูกมิจฉาชีพนำไปใช้เพื่อหลอกลวงคนโดยปลอมเป็นคนในครอบครัว หรือเพื่อน ผ่านโซเชียลมีเดีย เพราะในวันนี้ทุกคนต่างโพสต์รูปและคลิปตัวเองลงบนโซเชียล จึงเป็นเรื่องที่ง่ายมากๆ หากมิจฉาชีพจะเซฟรูปภาพและเสียงจากคลิปไปทำ Deepfakes

ทั้งนี้ ทีมวิจัยของ Microsoft ทราบถึงความเป็นไปได้ที่จะเกิดการละเมิด โดยกล่าวว่า “เราไม่มีแผนจะเผยแพร่การสาธิตออนไลน์, API, ผลิตภัณฑ์, รายละเอียดการใช้งานเพิ่มเติม หรือข้อเสนอใดๆ ที่เกี่ยวข้อง จนกว่าเราจะแน่ใจว่าเทคโนโลยีนั้นจะถูกใช้งานอย่างรับผิดชอบและสอดคล้องกับกฎระเบียบที่เหมาะสม”

ที่มา techspot.com

กองทัพอากาศสหรัฐฯ ประสบความสำเร็จ การทดสอบให้ AI ควบคุมเครื่องบินรบ สู้กับนักบินมนุษย์

Scroll to Top