هوش مصنوعی تصاویر را به حرف میآورد؟
هوش مصنوعی جدید مایکروسافت VASA-A میتواند یک عکس ثابت را متحرک کرده و به شما اجازه دهد با چهره خود یا هر شخصیتی که دوست دارید صحبت کنید.
مخاطب۲۴- پژوهشگران شرکت مایکروسافت در آسیا از یک ابزار هوش مصنوعی جدید به نام “VASA-۱” رونمایی کردهاند. این ابزار نوآورانه میتواند با استفاده از یک تصویر ثابت یا حتی طرحی از فرد و یک فایل صوتی موجود، به صورت لحظهای چهرهای متحرک و بسیار واقعی بسازد. هوش مصنوعی جدید مایکروسافت قادر است براساس فایل صوتی، مانند سخنرانی یا آهنگ، حرکات لب، حالات چهره و چرخش سر را برای تصویر یا طرح اولیه تولید کند. پژوهشگران نمونههای فراوانی را در صفحه پروژه به اشتراک گذاشتهاند که چنان طبیعی به نظر میرسند که میتوانند به راحتی مخاطب را فریب دهند.
بیشتر بخوانید
شاید اگر با دقت زیادی نمونههای منتشر شده را بررسی کنید متوجه کمی مصنوعی یا نامتناسب بودن حرکات لب و سر شوید، اما همچنان واضح است که این فناوری میتواند بهسادگی و سرعت برای ساخت ویدیوهای دیپ فیک افراد واقعی مورد سوءاستفاده قرار بگیرد. خود پژوهشگران نیز از این پتانسیل آگاه هستند و تصمیم گرفتهاند تا زمانی که از «استفاده مسئولانه و مطابق با قوانین» این فناوری اطمینان حاصل نکنند، از عرضه «دموی آنلاین، رابط برنامهنویسی کاربردی، محصول نهایی، جزئیات بیشتر در مورد پیادهسازی، یا هرگونه خدمات مرتبط» خودداری کنند. با این حال، آنها نگفتند که آیا قصد دارند اقدامات حفاظتی خاصی را برای جلوگیری از سوءاستفاده افراد، مانند ساخت پور-نوگرافی جعلی یا راهاندازی کمپینهای اطلاعات غلط، در نظر گرفتهاند.
پژوهشگران بر این باورند که این فناوری هوش مصنوعی، فراتر از پتانسیلهای مخرب خود، مزایای فراوانی دارد. آنها گفتهاند که VASA-۱ میتواند برای ارتقای برابری آموزشی و همچنین بهبود دسترسی افراد با چالشهای ارتباطی مفید باشد؛ برای مثال، آنها میتوانند آواتاری را داشته باشند به جای آنها صحبت کند. آنها همچنین اشاره کردهاند که این فناوری میتواند برای کسانی که نیاز به همراهی و حمایت درمانی دارند، مؤثر باشد و این نشان میدهد که VASA-۱ میتواند در برنامههایی که امکان برقراری ارتباط با شخصیتهای هوش مصنوعی را فراهم میکنند، به کار گرفته شود.
طبق مقاله منتشر شده همراه با معرفی این ابزار، VASA-۱ با استفاده از مجموعه داده VoxCeleb۲ آموزش دیده است. این مجموعه شامل «بیش از یک میلیون جمله صوتی برای ۶ هزار و ۱۱۲ فرد مشهور» است که از ویدیوهای یوتیوب استخراج شدهاند. جالب اینجاست که این ابزار با وجود آموزش روی چهرههای واقعی، روی تصاویر هنری مانند نقاشی چهره مونالیزا نیز کار میکند. پژوهشگران برای نمایش قابلیتهای VASA-۱، آن را با فایل صوتی اجرای معروف و وایرال آن Hathaway از آهنگ Paparazzi اثر Lil Wayne نیز ترکیب کردهاند. این خروجی چنان سرگرمکننده است که حتی اگر درباره فواید چنین فناوری تردید داشته باشید، ارزش دیدن دارد. این ویدیو را در زیر ببینید.
0
آخرین اخبار
پربازدید ها
بیانیه مشترک درباره تقویت همکاریهای دوجانبه تهران و آستانه
«مسعود پزشکیان» روز پنجشنبه در نشست خبری مشترک با قاسم ژومارت توکایف با بیان اینکه ایران در چارچوب سیاست همسایگی اهمیت ویژهای برای منطقه آسیای مرکزی قائل است، قزاقستان را «شریک مهم ایران در منطقه و همسایه مؤثر در حوزه دریای خزر» توصیف کرد
ویدیو+ عملیات تصرف بزرگترین نفتکش ونزوئلا توسط سربازان آمریکایی را ببینید
ونزوئلا توقیف یک نفتکش توسط آمریکا در سواحل خود را محکوم و آن را «دزدی دریایی بینالمللی» خواند و ایالات متحده را به طراحی یک «برنامه عمدی» برای غارت منابع انرژی این کشور متهم کرد
نیوکاسل در واپسین دقایق پیروزی را از دست داد
تیم نیوکاسل که تا لحظات پایانی در آستانه کسب سه امتیاز بود، تنها دو دقیقه مانده به پایان مسابقه برابر حریف خود غافلگیر شد و نتیجه برد را از دست داد.
ببینید: فرود اضطراری هواپیما در اتوبان
هواپیما در این فرود اضطراری با آسیب جدی مواجه شده است. مقامهای محلی اعلام کردند که خلبان پیش از فرود، با نقص فنی در موتور روبهرو شده بود و به همین دلیل ناچار شد روی جاده بنشیند
نمایش پیانیست؛ در باب میوهگانی زیادی انسانی
نمایش «پیانیست» با خلق جهانی استعاری و بدنمند، تماشاگر را به فضایی میبرد که در آن مرز میان انسان و میوه محو میشود و مفاهیم قدرت، آگاهی، فرسودگی و حقیقت در قالب شکلهای تازهای از زیست به صحنه درمیآیند. این اثر، نه صرفاً یک نمایش فانتزی، بلکه دستگاهی مفهومی است که از طریق دفرمهگی بدنها و زبان، به ساختارهای سلطه و میل در جهان انسانی طعنه میزند. کارگردان در این نمایش تلاش میکند اقتداری را که بیدلیل یا با دلیل مشکوک بر زندگی روزمره سایه انداخته، در قالب میوههایی مجسم کند که در ظاهر شاداباند، اما از درون گرفتار جبرهای هستیشناسانه هستند.
اوسمار: جادوگری! من کاتولیک هستم
اوسمار ویهرا سرمربی پرسپولیس امروز در نشست خبری خود با سوالی در مورد لحظه عجیب دربی پایتخت مواجه شد.
بخشنامه تغییر ساعات کار ادارات + جزئیات
بر اساس بخشنامه سراسری معاون وزیر کشور خطاب به تمامی استانداران ساعات کار ادارات دولتی، شهرداریها، بانکها و ارگانهای عمومی از اول دیماه ۱۴۰۴ لغایت ۲۹ اسفند ۱۴۰۴ از ساعت ۸ صبح تا ۱۴ ظهر تعیین شده است.
برگزیده
هفته دیزاین تهران با دخالت بسیج دانشجویی متوقف شد!
با چند توییت، یک برنامه مورد توجه جوانان تعطیل شد؛ این اتفاقی است که برای رویداد «هفته دیزاین تهران» در دانشکده هنرهای زیبای دانشگاه تهران رخ داد.
مهاجرت از کابل مسی به فیبرنوری، زیرساخت زندگی دیجیتال ایرانیان
در سالهای اخیر، با رشد فناوریهای نوین مانند هوش مصنوعی و اینترنت اشیا، نیاز به اتصال پرسرعت و پایدار به اینترنت بیش از پیش احساس میشود. پروژه مهاجرت از کابل مسی به فیبر نوری (سوآپ)، پاسخ به این نیازهاست و با اجرای آن، زیرساختهای ارتباطی کشور بهطور اساسی بهروز خواهد شد
کاهش کشفیات تریاک، شرکت های دارویی را با مشکل مواجه کرده
مدیرکل درمان ستاد مبارزه با مواد مخدر با اشاره به کاهش منابع تأمین مواد اولیه داروهای مخدر، از جمله داروهای مورد استفاده در درمان سرطان، دردهای مزمن و اعتیاد، اعلام کرد که شرکتهای دارویی با مشکلات جدی مواجه شدهاند
