کد خبر: ۳۹۶۲۵
تاریخ انتشار: ۰۲ ارديبهشت ۱۴۰۳ - ۱۰:۵۶

هوش مصنوعی تصاویر را به حرف می‌آورد؟

هوش مصنوعی جدید مایکروسافت VASA-A می‌تواند یک عکس ثابت را متحرک کرده و به شما اجازه دهد با چهره خود یا هر شخصیتی که دوست دارید صحبت کنید.
هوش مصنوعی تصاویر را به حرف می‌آورد؟

مخاطب۲۴- پژوهشگران شرکت مایکروسافت در آسیا از یک ابزار هوش مصنوعی جدید به نام “VASA-۱” رونمایی کرده‌اند. این ابزار نوآورانه می‌تواند با استفاده از یک تصویر ثابت یا حتی طرحی از فرد و یک فایل صوتی موجود، به صورت لحظه‌ای چهره‌ای متحرک و بسیار واقعی بسازد. هوش مصنوعی جدید مایکروسافت قادر است براساس فایل صوتی، مانند سخنرانی یا آهنگ، حرکات لب، حالات چهره و چرخش سر را برای تصویر یا طرح اولیه تولید کند. پژوهشگران نمونه‌های فراوانی را در صفحه پروژه به اشتراک گذاشته‌اند که چنان طبیعی به نظر می‌رسند که می‌توانند به راحتی مخاطب را فریب دهند.

بیشتر بخوانید

شاید اگر با دقت زیادی نمونه‌های منتشر شده را بررسی کنید متوجه کمی مصنوعی یا نامتناسب بودن حرکات لب و سر شوید، اما همچنان واضح است که این فناوری می‌تواند به‌سادگی و سرعت برای ساخت ویدیو‌های دیپ فیک افراد واقعی مورد سوءاستفاده قرار بگیرد. خود پژوهشگران نیز از این پتانسیل آگاه هستند و تصمیم گرفته‌اند تا زمانی که از «استفاده مسئولانه و مطابق با قوانین» این فناوری اطمینان حاصل نکنند، از عرضه «دموی آنلاین، رابط برنامه‌نویسی کاربردی، محصول نهایی، جزئیات بیشتر در مورد پیاده‌سازی، یا هرگونه خدمات مرتبط» خودداری کنند. با این حال، آن‌ها نگفتند که آیا قصد دارند اقدامات حفاظتی خاصی را برای جلوگیری از سوءاستفاده افراد، مانند ساخت پور-نوگرافی جعلی یا راه‌اندازی کمپین‌های اطلاعات غلط، در نظر گرفته‌اند.
پژوهشگران بر این باورند که این فناوری هوش مصنوعی، فراتر از پتانسیل‌های مخرب خود، مزایای فراوانی دارد. آن‌ها گفته‌اند که VASA-۱ می‌تواند برای ارتقای برابری آموزشی و همچنین بهبود دسترسی افراد با چالش‌های ارتباطی مفید باشد؛ برای مثال، آن‌ها می‌توانند آواتاری را داشته باشند به جای آن‌ها صحبت کند. آن‌ها همچنین اشاره کرده‌اند که این فناوری می‌تواند برای کسانی که نیاز به همراهی و حمایت درمانی دارند، مؤثر باشد و این نشان می‌دهد که VASA-۱ می‌تواند در برنامه‌هایی که امکان برقراری ارتباط با شخصیت‌های هوش مصنوعی را فراهم می‌کنند، به کار گرفته شود.

طبق مقاله منتشر شده همراه با معرفی این ابزار، VASA-۱ با استفاده از مجموعه داده VoxCeleb۲ آموزش دیده است. این مجموعه شامل «بیش از یک میلیون جمله صوتی برای ۶ هزار و ۱۱۲ فرد مشهور» است که از ویدیو‌های یوتیوب استخراج شده‌اند. جالب اینجاست که این ابزار با وجود آموزش روی چهره‌های واقعی، روی تصاویر هنری مانند نقاشی چهره مونالیزا نیز کار می‌کند. پژوهشگران برای نمایش قابلیت‌های VASA-۱، آن را با فایل صوتی اجرای معروف و وایرال آن Hathaway از آهنگ Paparazzi اثر Lil Wayne نیز ترکیب کرده‌اند. این خروجی چنان سرگرم‌کننده است که حتی اگر درباره فواید چنین فناوری تردید داشته باشید، ارزش دیدن دارد. این ویدیو را در زیر ببینید.

برچسب ها: هوش مصنوعی
آخرین اخبار
پربازدید ها
اخبار داغ
بیانیه مشترک درباره تقویت همکاری‌های دوجانبه تهران و آستانه بیانیه مشترک درباره تقویت همکاری‌های دوجانبه تهران و آستانه
«مسعود پزشکیان» روز پنجشنبه در نشست خبری مشترک با قاسم‌ ژومارت توکایف با بیان اینکه ایران در چارچوب سیاست همسایگی اهمیت ویژه‌ای برای منطقه آسیای مرکزی قائل است، قزاقستان را «شریک مهم ایران در منطقه و همسایه مؤثر در حوزه دریای خزر» توصیف کرد
ویدیو+ عملیات تصرف بزرگترین نفتکش ونزوئلا توسط سربازان آمریکایی را ببینید ویدیو+ عملیات تصرف بزرگترین نفتکش ونزوئلا توسط سربازان آمریکایی را ببینید
ونزوئلا توقیف یک نفتکش توسط آمریکا در سواحل خود را محکوم و آن را «دزدی دریایی بین‌المللی» خواند و ایالات متحده را به طراحی یک «برنامه عمدی» برای غارت منابع انرژی این کشور متهم کرد
نیوکاسل در واپسین دقایق پیروزی را از دست داد نیوکاسل در واپسین دقایق پیروزی را از دست داد
تیم نیوکاسل که تا لحظات پایانی در آستانه کسب سه امتیاز بود، تنها دو دقیقه مانده به پایان مسابقه برابر حریف خود غافلگیر شد و نتیجه برد را از دست داد.
ببینید: فرود اضطراری هواپیما در اتوبان ببینید: فرود اضطراری هواپیما در اتوبان
هواپیما در این فرود اضطراری با آسیب جدی مواجه شده است. مقام‌های محلی اعلام کردند که خلبان پیش از فرود، با نقص فنی در موتور روبه‌رو شده بود و به همین دلیل ناچار شد روی جاده بنشیند
نمایش پیانیست؛ در باب میوه‌گانی زیادی انسانی نمایش پیانیست؛ در باب میوه‌گانی زیادی انسانی
نمایش «پیانیست» با خلق جهانی استعاری و بدن‌مند، تماشاگر را به فضایی می‌برد که در آن مرز میان انسان و میوه محو می‌شود و مفاهیم قدرت، آگاهی، فرسودگی و حقیقت در قالب شکل‌های تازه‌ای از زیست به صحنه درمی‌آیند. این اثر، نه صرفاً یک نمایش فانتزی، بلکه دستگاهی مفهومی است که از طریق دفرمه‌گی بدن‌ها و زبان، به ساختار‌های سلطه و میل در جهان انسانی طعنه می‌زند. کارگردان در این نمایش تلاش می‌کند اقتداری را که بی‌دلیل یا با دلیل مشکوک بر زندگی روزمره سایه انداخته، در قالب میوه‌هایی مجسم کند که در ظاهر شاداب‌اند، اما از درون گرفتار جبر‌های هستی‌شناسانه هستند.
اوسمار: جادوگری! من کاتولیک هستم اوسمار: جادوگری! من کاتولیک هستم
اوسمار ویه‌را سرمربی پرسپولیس امروز در نشست خبری خود با سوالی در مورد لحظه عجیب دربی پایتخت مواجه شد.
بخشنامه تغییر ساعات کار ادارات + جزئیات بخشنامه تغییر ساعات کار ادارات + جزئیات
بر اساس بخشنامه سراسری معاون وزیر کشور خطاب به تمامی استانداران ساعات کار ادارات دولتی، شهرداری‌ها، بانک‌ها و ارگان‌های عمومی از اول دی‌ماه ۱۴۰۴ لغایت ۲۹ اسفند ۱۴۰۴ از ساعت ۸ صبح تا ۱۴ ظهر تعیین شده است.
برگزیده
هفته دیزاین تهران با دخالت بسیج دانشجویی متوقف شد! هفته دیزاین تهران با دخالت بسیج دانشجویی متوقف شد!
با چند توییت، یک برنامه مورد توجه جوانان تعطیل شد؛ این اتفاقی است که برای رویداد «هفته دیزاین تهران» در دانشکده هنر‌های زیبای دانشگاه تهران رخ داد.
مهاجرت از کابل مسی به فیبرنوری، زیرساخت زندگی دیجیتال ایرانیان مهاجرت از کابل مسی به فیبرنوری، زیرساخت زندگی دیجیتال ایرانیان
در سال‌های اخیر، با رشد فناوری‌های نوین مانند هوش مصنوعی و اینترنت اشیا، نیاز به اتصال پرسرعت و پایدار به اینترنت بیش از پیش احساس می‌شود. پروژه مهاجرت از کابل مسی به فیبر نوری (سوآپ)، پاسخ به این نیازهاست و با اجرای آن، زیرساخت‌های ارتباطی کشور به‌طور اساسی به‌روز خواهد شد
کاهش کشفیات تریاک، شرکت های دارویی را با مشکل مواجه کرده کاهش کشفیات تریاک، شرکت های دارویی را با مشکل مواجه کرده
مدیرکل درمان ستاد مبارزه با مواد مخدر با اشاره به کاهش منابع تأمین مواد اولیه دارو‌های مخدر، از جمله دارو‌های مورد استفاده در درمان سرطان، درد‌های مزمن و اعتیاد، اعلام کرد که شرکت‌های دارویی با مشکلات جدی مواجه شده‌اند
صفحه خبر بالای تصاویر