ยักษ์ใหญ่แห่งวงการเทคโนโลยี Google ประกาศเปิดตัว “Whisk” เครื่องมือ AI สุดล้ำ ที่ให้ผู้ใช้สร้างสรรค์ภาพจากภาพได้ โดยไม่ต้องพิมพ์ข้อความสั่งงาน ชูจุดเด่น “สร้างแรงบันดาลใจ” เน้น “รวดเร็ว” และ “ใช้งานง่าย” หวังนำ Gemini ผงาดในตลาด AI แข่งกับ OpenAI
ในยุคที่เทคโนโลยี AI กำลังพัฒนาไปอย่างก้าวกระโดด Google ไม่รอช้า เปิดตัว “Whisk” เครื่องมือ AI ที่ให้ผู้ใช้สามารถสร้างสรรค์ภาพจากภาพได้อย่างง่ายดาย โดยไม่จำเป็นต้องพิมพ์ Text Prompt หรือข้อความสั่งงานให้ยุ่งยากอีกต่อไป เพียงแค่ลากและวางรูปภาพที่ต้องการลงในเครื่องมือ Whisk ก็จะทำการประมวลผลและสร้างภาพใหม่ขึ้นมาให้โดยอัตโนมัติ
Whisk ทำงานอย่างไร?
Whisk ถูกออกแบบมาให้เป็น “เครื่องมือสร้างสรรค์” ที่ช่วยจุดประกายไอเดียใหม่ ๆ ให้กับผู้ใช้งาน โดย Whisk ไม่ใช่ “โปรแกรมแต่งภาพแบบเดิม ๆ” แต่เป็นเครื่องมือ AI ที่เน้นความสนุกสนาน และความรวดเร็วในการสร้างภาพ มากกว่าการสร้างผลงานระดับมืออาชีพ
ผู้ใช้สามารถอัปโหลดภาพที่ต้องการ ไม่ว่าจะเป็นภาพบุคคล ภาพสถานที่ หรือภาพสไตล์ที่ต้องการ จากนั้น Whisk จะนำภาพทั้งหมดมาผสมผสานกัน และสร้างเป็นภาพใหม่ขึ้นมา ผู้ใช้สามารถ “รีมิกซ์” ภาพที่ได้ โดยการแก้ไข หรือสลับหมวดหมู่ของภาพที่ป้อนเข้าไป เพื่อสร้างภาพที่แตกต่างออกไป เช่น ตุ๊กตา เข็มกลัด หรือสติกเกอร์ นอกจากนี้ ผู้ใช้ยังสามารถเพิ่มข้อความกำกับ เพื่อควบคุมรายละเอียดของภาพ แต่ไม่ใช่สิ่งจำเป็นในการสร้างภาพ
เบื้องหลังการทำงานของ Whisk คือการผสานพลังของ Gemini AI ตัวหลักของ Google ที่เปิดตัวไปเมื่อเดือนธันวาคม 2023 เข้ากับ Imagen 3 ซึ่งเป็น AI สร้างภาพจากข้อความรุ่นล่าสุดจาก DeepMind เมื่อผู้ใช้อัปโหลดภาพ Gemini จะสร้างคำบรรยายภาพ และส่งต่อไปยัง Imagen 3 เพื่อสร้างภาพตามคำบรรยายนั้น ๆ กระบวนการนี้จะจับ “สาระสำคัญ” ของภาพต้นแบบ มากกว่าการคัดลอกแบบเป๊ะ ๆ ซึ่งทำให้สามารถรีมิกซ์ภาพได้หลากหลาย แต่ก็อาจทำให้ภาพที่ได้แตกต่างจากภาพต้นแบบบ้างเล็กน้อย เช่น ความสูง ทรงผม หรือสีผิว ซึ่ง Google ระบุว่าเป็นข้อจำกัดที่เกิดจากการตีความของ AI
การเปิดตัว Whisk ของ Google ในครั้งนี้ ถือเป็นอีกหนึ่งก้าวสำคัญ ในการแข่งขันด้าน AI กับ OpenAI ซึ่งก่อนหน้านี้ได้เปิดตัว Dall-E เครื่องมือสร้างภาพจากข้อความ ที่ได้รับความนิยมอย่างล้นหลาม และ Sora เครื่องมือสร้างวิดีโอจากข้อความที่เพิ่งเปิดตัวไปล่าสุด แสดงให้เห็นถึงความมุ่งมั่นของ Google ในการเป็นผู้นำด้าน AI และการนำเสนอผลิตภัณฑ์ที่ตอบโจทย์ผู้ใช้งานในยุคปัจจุบัน
Dan Ives กรรมการผู้จัดการ และนักวิเคราะห์หลักทรัพย์อาวุโสของ Wedbush Securities มองว่า Whisk เป็นการ “โชว์ศักยภาพ” อีกครั้งของ Google ในด้าน AI โดย DeepMind ถือเป็นทรัพย์สินสำคัญของ Google และผลิตภัณฑ์ AI ต่างๆ เป็นส่วนหนึ่งของ “ขุมทรัพย์” ผลิตภัณฑ์ใหม่ ที่ Google วางแผนจะเปิดตัวในปี 2025 ซึ่งรวมถึงระบบปฏิบัติการ Android รุ่นใหม่ ที่พัฒนาร่วมกับ Samsung และ Qualcomm ด้วย
สำหรับผู้ที่สนใจ สามารถทดลองใช้ Whisk ได้แล้ววันนี้ ผ่านเว็บไซต์ Google Labs (สำหรับผู้ใช้ในสหรัฐอเมริกา) โดยมีขั้นตอนง่าย ๆ ดังนี้
ข้อดี
ข้อจำกัด
แม้ Whisk จะยังอยู่ในช่วงเริ่มต้นของการพัฒนา แต่ด้วยศักยภาพของ Gemini และ Imagen 3 ที่เป็นหัวใจสำคัญ เชื่อว่า Whisk จะกลายเป็นเครื่องมือ AI ที่ได้รับความนิยม และมีบทบาทสำคัญในการสร้างสรรค์ผลงาน และต่อยอดไอเดียใหม่ ๆ ให้กับผู้คนในอนาคต โดยเฉพาะอย่างยิ่งในวงการศิลปะ การออกแบบ และการโฆษณา ที่ต้องการความรวดเร็ว และความคิดสร้างสรรค์
#Whisk #GoogleAI #Gemini #Imagen3 #AIสร้างภาพ #AI #GoogleLabs #DeepMind #เทคโนโลยี
ที่มา edition.cnn.com , zdnet.com , petapixel.com
–Meta ยกระดับแว่นตาอัจฉริยะด้วย AI, แปลภาษาเรียลไทม์ และ ฟีเจอร์ Shazam
นายวิทการ จันทวิมล รองกรรมการผู้อำนวยการ สายงานกลยุทธ์องค์กรและการสร้างสรรค์ บมจ. เอพี ไทยแลนด์ กล่าวถึงภาพรวมผลการดำเนินงานที่แข็งแกร่งของเอพีในปี 2567 กับการครองตำแหน่งบริษัทอสังหาฯ อันดับ 1 ของไทยว่า บริษัทฯ สามารถรักษาการเติบโตที่ยั่งยืนในทุกมิติสำคัญ…
ฮอนด้า (Honda) และ นิสสัน (Nissan) สองยักษ์ใหญ่แห่งวงการรถยนต์ญี่ปุ่น กำลังอยู่ในระหว่างการเจรจาควบรวมกิจการ โดยมีเป้าหมายเพื่อเสริมสร้างความแข็งแกร่งในการแข่งขันกับผู้ผลิตรถยนต์ไฟฟ้า (EV) โดยเฉพาะในตลาดจีน ซึ่งเป็นตลาดยานยนต์ไฟฟ้าที่ใหญ่ที่สุดในโลก รายงานข่าวจาก Nikkei ระบุว่า ทั้งสองบริษัทกำลังพิจารณาการดำเนินงานภายใต้บริษัทโฮลดิ้งเดียวกัน…
Samsung เตรียมจัดงาน Galaxy Unpacked ในวันที่ 22 มกราคม 2025 โดยคาดว่าจะเปิดตัวสมาร์ทโฟนเรือธงรุ่นใหม่ Galaxy S25 series ซึ่งประกอบด้วย Galaxy S25,…
Meta บริษัทเทคโนโลยียักษ์ใหญ่ ประกาศเปิดตัวฟีเจอร์ใหม่สามรายการสำหรับแว่นตาอัจฉริยะ Ray-Ban ได้แก่ Live AI, การแปลภาษาแบบเรียลไทม์ และ Shazam โดยฟีเจอร์ Live AI และการแปลภาษาแบบเรียลไทม์จะจำกัดเฉพาะสมาชิกของโปรแกรม Early…
Apple Maps ได้เปิดให้บริการ Look Around ซึ่งเป็นฟีเจอร์ที่ช่วยให้ผู้ใช้สามารถสำรวจสถานที่ต่าง ๆ ผ่านภาพ 360 องศาแบบเดียวกับ Google Street View ก่อนหน้านี้ Apple…
LINE TODAY เผยอินไซต์พฤติกรรมการเสพคอนเทนต์ของผู้ใช้ชาวไทยตลอดปี 2567 ผ่าน "A YEAR IN REVIEW 2024" รายงานสรุปประจำปีที่รวบรวมประเด็นข่าวเด่น เทรนด์ฮิต และปรากฏการณ์สำคัญที่ได้รับความสนใจสูงสุดจากผู้อ่าน พร้อมผลสำรวจ "LINE…