کد خبر: ۳۹۶۲۵
تاریخ انتشار: ۰۲ ارديبهشت ۱۴۰۳ - ۱۰:۵۶

هوش مصنوعی تصاویر را به حرف می‌آورد؟

هوش مصنوعی جدید مایکروسافت VASA-A می‌تواند یک عکس ثابت را متحرک کرده و به شما اجازه دهد با چهره خود یا هر شخصیتی که دوست دارید صحبت کنید.
هوش مصنوعی تصاویر را به حرف می‌آورد؟

مخاطب۲۴- پژوهشگران شرکت مایکروسافت در آسیا از یک ابزار هوش مصنوعی جدید به نام “VASA-۱” رونمایی کرده‌اند. این ابزار نوآورانه می‌تواند با استفاده از یک تصویر ثابت یا حتی طرحی از فرد و یک فایل صوتی موجود، به صورت لحظه‌ای چهره‌ای متحرک و بسیار واقعی بسازد. هوش مصنوعی جدید مایکروسافت قادر است براساس فایل صوتی، مانند سخنرانی یا آهنگ، حرکات لب، حالات چهره و چرخش سر را برای تصویر یا طرح اولیه تولید کند. پژوهشگران نمونه‌های فراوانی را در صفحه پروژه به اشتراک گذاشته‌اند که چنان طبیعی به نظر می‌رسند که می‌توانند به راحتی مخاطب را فریب دهند.

بیشتر بخوانید

شاید اگر با دقت زیادی نمونه‌های منتشر شده را بررسی کنید متوجه کمی مصنوعی یا نامتناسب بودن حرکات لب و سر شوید، اما همچنان واضح است که این فناوری می‌تواند به‌سادگی و سرعت برای ساخت ویدیو‌های دیپ فیک افراد واقعی مورد سوءاستفاده قرار بگیرد. خود پژوهشگران نیز از این پتانسیل آگاه هستند و تصمیم گرفته‌اند تا زمانی که از «استفاده مسئولانه و مطابق با قوانین» این فناوری اطمینان حاصل نکنند، از عرضه «دموی آنلاین، رابط برنامه‌نویسی کاربردی، محصول نهایی، جزئیات بیشتر در مورد پیاده‌سازی، یا هرگونه خدمات مرتبط» خودداری کنند. با این حال، آن‌ها نگفتند که آیا قصد دارند اقدامات حفاظتی خاصی را برای جلوگیری از سوءاستفاده افراد، مانند ساخت پور-نوگرافی جعلی یا راه‌اندازی کمپین‌های اطلاعات غلط، در نظر گرفته‌اند.
پژوهشگران بر این باورند که این فناوری هوش مصنوعی، فراتر از پتانسیل‌های مخرب خود، مزایای فراوانی دارد. آن‌ها گفته‌اند که VASA-۱ می‌تواند برای ارتقای برابری آموزشی و همچنین بهبود دسترسی افراد با چالش‌های ارتباطی مفید باشد؛ برای مثال، آن‌ها می‌توانند آواتاری را داشته باشند به جای آن‌ها صحبت کند. آن‌ها همچنین اشاره کرده‌اند که این فناوری می‌تواند برای کسانی که نیاز به همراهی و حمایت درمانی دارند، مؤثر باشد و این نشان می‌دهد که VASA-۱ می‌تواند در برنامه‌هایی که امکان برقراری ارتباط با شخصیت‌های هوش مصنوعی را فراهم می‌کنند، به کار گرفته شود.

طبق مقاله منتشر شده همراه با معرفی این ابزار، VASA-۱ با استفاده از مجموعه داده VoxCeleb۲ آموزش دیده است. این مجموعه شامل «بیش از یک میلیون جمله صوتی برای ۶ هزار و ۱۱۲ فرد مشهور» است که از ویدیو‌های یوتیوب استخراج شده‌اند. جالب اینجاست که این ابزار با وجود آموزش روی چهره‌های واقعی، روی تصاویر هنری مانند نقاشی چهره مونالیزا نیز کار می‌کند. پژوهشگران برای نمایش قابلیت‌های VASA-۱، آن را با فایل صوتی اجرای معروف و وایرال آن Hathaway از آهنگ Paparazzi اثر Lil Wayne نیز ترکیب کرده‌اند. این خروجی چنان سرگرم‌کننده است که حتی اگر درباره فواید چنین فناوری تردید داشته باشید، ارزش دیدن دارد. این ویدیو را در زیر ببینید.

برچسب ها: هوش مصنوعی
آخرین اخبار
پربازدید ها
اخبار داغ
گوشی تاشو سه تکه هواوی معرفی شد گوشی تاشو سه تکه هواوی معرفی شد
گوشی تاشو سه تکه هواوی میت XTs با پردازنده Kirin ۹۰۲۰ و دوربین فوق عریض ۴۰ مگاپیکسلی به‌روزرسانی شده، معرفی شد.
افزایش چشمگیر قیمت بلیت‌های جام جهانی ۲۰۲۶ افزایش چشمگیر قیمت بلیت‌های جام جهانی ۲۰۲۶
فیفا از آغاز پیش‌فروش بلیت‌های جام جهانی ۲۰۲۶ خبر داد و هشدار داد قیمت‌ها با سیستم پویا متغیر است و هواداران بهتر است زودتر خرید کنند.
مکالمه خصوصی شی و پوتین فاش شد مکالمه خصوصی شی و پوتین فاش شد
میکروفون‌های باز در رژه «روز پیروزی» پکن، گفت‌وگوی خصوصی شی جین‌پینگ و ولادیمیر پوتین درباره طول عمر انسان و امکان زندگی تا ۱۵۰ سال را ضبط کردند.
آمریکا مدعی نفوذ ایران در پنتاگون شد آمریکا مدعی نفوذ ایران در پنتاگون شد
تام کاتن سناتور جمهوری‌خواه آمریکا خواستار تحقیق درباره نفوذ احتمالی ایران در جامعه اطلاعاتی و پنتاگون شد؛ دولت بایدن این اتهامات را رد کرده است.
افشای بیماری خطرناک سلنا گومز افشای بیماری خطرناک سلنا گومز
سلنا گومز سال‌ها پیش با اعلام ابتلایش به بیماری لوپوس توجه جهانیان را جلب کرد؛ بیماری‌ای خودایمنی که زندگی میلیون‌ها نفر را تحت‌تأثیر قرار می‌دهد و درمان قطعی ندارد.
قیمت اپل واچ اولترا ۳ درست قبل از رونمایی رسمی لو رفت قیمت اپل واچ اولترا ۳ درست قبل از رونمایی رسمی لو رفت
قیمت اپل واچ اولترا ۳ مشخص شد؛ اپل تصمیم دراد که این ساعت پرچمدار مقاوم خود را بدون هیچگونه افزایش قیمتی نسبت به نسل قبل عرضه کند.
تصاویری از رژه پکن که ترامپ طاقت دیدن آن را نداشت تصاویری از رژه پکن که ترامپ طاقت دیدن آن را نداشت
رژه نظامی باشکوه چین با حضور رهبران روسیه، کره شمالی و ایران، به‌گفته آکسیوس، پیامی روشن به واشنگتن درباره تغییر توازن قدرت جهانی ارسال کرد.
برگزیده
معوقه بازنشستگان فرهنگی سال ۱۴۰۰ با حقوق مرداد پرداخت شد معوقه بازنشستگان فرهنگی سال ۱۴۰۰ با حقوق مرداد پرداخت شد
وزارت آموزش و پرورش اعلام کرد معوقه بازنشستگان فرهنگی مربوط به سال ۱۴۰۰ همزمان با حقوق مردادماه واریز شد و در حساب آنان قرار گرفت.
طارمی در آستانه پیوستن به NFC طارمی در آستانه پیوستن به NFC
در حالی که رسانه‌های ایتالیایی توجه ویژه‌ای به مهدی طارمی دارند، گزارش‌ها حاکی از آن است که اون تصمیم خود را برای فصل آینده اش گرفته است.
صفحه خبر بالای تصاویر