کد خبر: ۴۴۱۴۵
تاریخ انتشار: ۲۳ خرداد ۱۴۰۳ - ۱۱:۰۷

بر اساس نتایج یک مطالعه بررسی شد کمبود داده، رشد هوش مصنوعی را متوقف می‌کند؟

الگو‌های هوش مصنوعی به‌شدت تابع و وابسته به داده‌ها هستند. با این اوصاف است که تداوم رشد و نفوذ هوش مصنوعی به خصوص به کمک سیستم‌هایی مانند چت‌بات چت جی‌پی‌تی، با کاهش جدی و البته قریب‌الوقوع داده مواجه خواهد بود که به نظر می‌رسد این اتفاق تا حد زیادی به دلیل کاهش قابل توجه داده‌های متنی در دسترس عموم رخ خواهد داد.
بر اساس نتایج یک مطالعه بررسی شد کمبود داده، رشد هوش مصنوعی را متوقف می‌کند؟

به گزارش مخاطب۲۴ به نقل از اداره کل ارتباطات و امور بین الملل شرکت مخابرات ایران:مطالعه‌ای که اخیرا توسط موسسه تحقیقاتی Epoch AI در این زمینه انجام شده است، این موضوع را تایید می‌کند. بر این اساس، پیش‌بینی می‌شود که این کمبود داده در فاصله سال‌های ۲۰۲۶ تا ۲۰۳۲ اتفاق می‌افتد و در واقع انعکاسی از یک چالش مهم در حفظ روند سریع پیشرفت و توسعه هوش مصنوعی است. رشد هوش مصنوعی به میزان بسیار وسیع به داده‌های متنی تولید شده توسط انسان وابسته بوده است، اما این منبع محدود و متناهی به تدریج در حال کاهش است. در حال حاضر شرکت‌هایی از جمله اوپن ای‌آی و گوگل منابع داده با کیفیت بالا مانند محتوای Reddit و رسانه‌های خبری را خریداری می‌کنند تا بتوانند روند آموزش الگو‌های هوش مصنوعی خود را حفظ کنند. با این حال کمبود داده‌های جدید ممکن است به زودی این شرکت‌ها را مجبور به استفاده از داده‌های خصوصی حساس یا داده‌های ساختگی کند که کمتر قابل اعتماد خواهند بود.

در حقیقت بررسی اخیر موسسه Epoch AI تاکید می‌کند که ممکن است مقیاس و درجه‌بندی الگو‌های هوش مصنوعی که به قدرت محاسباتی بسیار زیاد و مجموعه داده‌های بزرگ نیاز دارند، با کاهش منابع داده غیرممکن شود. در حالی که روش‌های جدید تا حدودی این مشکل را کمتر کرده‌اند، اما نیاز اساسی به داده‌های با کیفیت تولید شده توسط انسان همچنان وجود دارد. برخی از کارشناسان و متخصصان پیشنهاد می‌کنند که برای رفع این معضل به جای الگو‌های هوش مصنوعی بزرگ‌تر، تمرکز روی الگو‌های تخصصی باشد. توسعه‌دهندگان هوش مصنوعی در واکنش به این چالش‌ها، در حال بررسی روش‌های جایگزینی از جمله تولید داده‌های مصنوعی و ساختگی هستند. با این حال، اما نگرانی‌ها در مورد کیفیت و کارآیی چنین داده‌هایی همچنان ادامه خواهد داشت و پیچیدگی روند حفظ پیشرفت‌های هوش مصنوعی، در مواجهه با منابع زبانی طبیعی و محدود را برجسته می‌کند.

این بررسی‌ها نشان می‌دهد که کل موجودی موثر داده‌های متنی عمومی تولید شده توسط انسان چیزی در حدود ۳۰۰ تریلیون توکن است که با فاصله اطمینان ۹۰ درصدی از ۱۰۰ تا هزار توکن تخمین زده می‌شود. البته این تخمین فقط شامل داده‌هایی است که به اندازه کافی کیفیت بالایی دارند تا برای آموزش الگو‌های هوش مصنوعی مورد استفاده قرار بگیرند و امکان به‌کارگیری در مدل‌های آموزشی در دوره‌های مختلف را فراهم می‌آورند.

با توجه به برآورد‌های انجام شده در این تحقیقات، پیش‌بینی می‌شود که چه زمانی این داده‌ها به‌طور کامل مورد استفاده قرار می‌گیرند. به این ترتیب مشخص شد با فاصله اطمینان ۸۰درصدی، می‌توان به سادگی گفت که ذخیره داده‌های باکیفیت در دسترس عموم و تولید شده توسط انسان، در مقطع زمانی بین سال‌های ۲۰۲۶ تا ۲۰۳۲ به‌طور کامل مورد استفاده قرار می‌گیرد و به پایان می‌رسد. با این حال، اما زمان دقیقی که این داده‌ها به‌طور کامل مورد استفاده قرار می‌گیرند، تا حد زیادی به نحوه و شکل مقیاس‌بندی الگو‌های هوش مصنوعی و روند رشد آن‌ها بستگی دارد. اگر این الگو‌های هوش مصنوعی به‌طور بهینه‌ای آموزش داده شوند، احتمال آن وجود دارد که تا سال ۲۰۲۸ داده‌های کافی برای آموزش آن‌ها وجود داشته باشد. اما واقعیت انکارناپذیری که وجود دارد، آن است که الگو‌های هوش مصنوعی اخیر مانند Llama ۳ متعلق به شرکت متا، اغلب با پارامتر‌های کمتر و در مقابل، داده‌های بیشتر آن هم بیش از حد آموزش داده می‌شوند تا در هنگام انجام فرآیند نتیجه‌گیری بتوانند کارآیی بیشتر از نظر محاسباتی داشته باشند.

آخرین اخبار
پربازدید ها
اخبار داغ
مانور خارق‌العاده J10 در نمایشگاه دبی ۲۰۲۵ مانور خارق‌العاده J10 در نمایشگاه دبی ۲۰۲۵
ویدیویی از مانور جنگنده j۱۰ چینی که در نمایشگاه هوایی دبی ۲۰۲۵ همه را متحیر کرد
بیفوما، در آب نمک دربی بیفوما، در آب نمک دربی
به احتمال فراوان وینگر کنگویی بازی با شمس آذر را از دست داده و استراحت خواهد کرد.
مهمان ویژه جشنواره جهانی فیلم فجر مهمان ویژه جشنواره جهانی فیلم فجر
آلفرد یعقوب‌زاده عکاس برجسته و مطرح در عرصه بین‌الملل، مهمان ویژه چهل‌وسومین جشنواره جهانی فیلم فجر است.
حضور ایران در سید ۲ جام جهانی ۲۰۲۶ قطعی شد حضور ایران در سید ۲ جام جهانی ۲۰۲۶ قطعی شد
در فاصله ۱۰ روز تا برگزاری مراسم قرعه‌کشی بیست‌وسومین دوره جام جهانی فوتبال فدراسیون بین‌المللی فوتبال سیدبندی تیم‌های حاضر در این رقابت‌ها را مشخص و اعلام کرد و همانطور که پیش‌بینی می‌شد تیم ملی فوتبال کشورمان در کنار تیم‌های ملی کرواسی، مراکش، کلمبیا، اروگوئه، سوئیس، ژاپن، سنگال، کره جنوبی، اکوادور، اتریش و استرالیا در سید دو قرار گرفت.  
نرخ بنزین اشخاص هیچ تغییری نکرده است + توضیحات سخنگوی دولت نرخ بنزین اشخاص هیچ تغییری نکرده است + توضیحات سخنگوی دولت
مهاجرانی تصریح کرد: سهمیه ۶۰ لیتری با نرخ ۱۵۰۰ تومان و سهمیه ۱۰۰ لیتری با نرخ ۳۰۰۰ تومان که از طریق کارت‌های شخصی استفاده می‌شود، هیچ تغییری نکرده است؛ نه در مقدار و نه در قیمت.
تهران در جمع ۱۰ شهر آلوده جهان تهران در جمع ۱۰ شهر آلوده جهان
داده‌های به‌روزشده در سایت رسمی «IQAIR» نشان می‌هد تهران در میان ۱۰ شهر آلوده جهان قرار دارد.
اتفاق نگران‌کننده هنگام یادگیری با ChatGPT اتفاق نگران‌کننده هنگام یادگیری با ChatGPT
پژوهش‌ها نشان می‌دهد سهولت استفاده از ChatGPT می‌تواند عمق یادگیری و مهارت‌های تفکر انتقادی کاربران را کاهش دهد و تبادل اطلاعات عمومی را محدود کند.
برگزیده
هفته دیزاین تهران با دخالت بسیج دانشجویی متوقف شد! هفته دیزاین تهران با دخالت بسیج دانشجویی متوقف شد!
با چند توییت، یک برنامه مورد توجه جوانان تعطیل شد؛ این اتفاقی است که برای رویداد «هفته دیزاین تهران» در دانشکده هنر‌های زیبای دانشگاه تهران رخ داد.
مهاجرت از کابل مسی به فیبرنوری، زیرساخت زندگی دیجیتال ایرانیان مهاجرت از کابل مسی به فیبرنوری، زیرساخت زندگی دیجیتال ایرانیان
در سال‌های اخیر، با رشد فناوری‌های نوین مانند هوش مصنوعی و اینترنت اشیا، نیاز به اتصال پرسرعت و پایدار به اینترنت بیش از پیش احساس می‌شود. پروژه مهاجرت از کابل مسی به فیبر نوری (سوآپ)، پاسخ به این نیازهاست و با اجرای آن، زیرساخت‌های ارتباطی کشور به‌طور اساسی به‌روز خواهد شد
کاهش کشفیات تریاک، شرکت های دارویی را با مشکل مواجه کرده کاهش کشفیات تریاک، شرکت های دارویی را با مشکل مواجه کرده
مدیرکل درمان ستاد مبارزه با مواد مخدر با اشاره به کاهش منابع تأمین مواد اولیه دارو‌های مخدر، از جمله دارو‌های مورد استفاده در درمان سرطان، درد‌های مزمن و اعتیاد، اعلام کرد که شرکت‌های دارویی با مشکلات جدی مواجه شده‌اند
صفحه خبر بالای تصاویر