کد خبر: ۶۰۲۸۱
تاریخ انتشار: ۲۶ فروردين ۱۴۰۴ - ۱۳:۲۹

همه چیز درباره هوش مصنوعی جدید «اوپن‌ای‌آی»

«اوپن‌ای‌آی» روز دوشنبه خانواده جدیدی از مدل‌های هوش مصنوعی خود را به نام «GPT-۴.۱» معرفی کرد که تمرکز آن بر کدنویسی است.
همه چیز درباره هوش مصنوعی جدید «اوپن‌ای‌آی»

مخاطب۲۴- هوش مصنوعی- «اوپن‌ای‌آی» (OpenAI) در حال حاضر مدل‌های «GPT-۴.۱»، «GPT-۴.۱ mini» و «GPT-۴.۱ nano» را دارد که برتری خود را در کدنویسی و دنبال کردن دستورالعمل‌ها نشان داده‌اند. مدل‌های چندوجهی که از طریق API اوپن‌ای‌آی در دسترس هستند، می‌توانند هر بار تقریبا یک میلیون توکن (۷۵۰ هزار کلمه) را دریافت کنند. این میزان کلمه، یک متن طولانی‌تر از رمان «جنگ و صلح» را تشکیل می‌دهد.

GPT-۴.۱ زمانی وارد شده است که رقبای اوپن‌ای‌آی مانند «گوگل» و «آنتروپیک» تلاش‌های خود را برای ساخت مدل‌های برنامه‌نویسی پیچیده افزایش می‌دهند. «جمینای ۲.۵ پرو» (Gemini ۲.۵ Pro) که اخیرا توسط گوگل منتشر شد و یک میلیون توکن را پوشش می‌دهد، رتبه بالایی را در معیار‌های محبوب کدنویسی دارد. «کلود ۳.۷ سونت» (Claude ۳.۷ Sonnet) و «V۳» ارتقاءیافته شرکت چینی «دیپ‌سیک» (DeepSeek) نیز همین طور هستند.

بیشتر بخوانید

هدف بسیاری از غول‌های فناوری از جمله اوپن‌ای‌آی، آموزش دادن مدل‌های کدنویسی هوش مصنوعی است که می‌توانند وظایف پیچیده مهندسی نرم‌افزار را انجام دهند. «سارا فریار» (Sarah Friar)، مدیر ارشد مالی اوپن‌ای‌آی ماه گذشته در نشست فناوری لندن گفت که جاه‌طلبی بزرگ این شرکت، ایجاد یک مهندس نرم‌افزار عاملی است. این شرکت ادعا می‌کند که مدل‌های آینده آن می‌توانند همه برنامه‌ها را به صورت سرتاسری برنامه‌ریزی کنند و بر جنبه‌هایی مانند تضمین کیفیت، آزمایش مشکل و نوشتن مستندات مدیریت داشته باشند.

مدل GPT-۴.۱ گامی در این مسیر است. یکی از سخن‌گویان اوپن‌ای‌آی در یک ایمیل به تک کرانچ، گفت: ما GPT-۴.۱ را برای استفاده در دنیای واقعی بر اساس بازخورد مستقیم تنظیم کرده‌ایم تا در زمینه‌هایی که توسعه‌دهندگان بیشتر به آنها اهمیت می‌دهند مانند برنامه‌نویسی فرانت‌اند، کاهش ویرایش‌های اضافی، فرمت‌های قابل اعتماد، رعایت ساختار پاسخ و سفارش، استفاده ثابت از فناوری و موارد دیگر بهبود پیدا کنیم. این پیشرفت‌ها توسعه‌دهندگان را قادر می‌سازند تا عواملی را ارائه دهند که در کار‌های مهندسی نرم‌افزار در دنیای واقعی به طور قابل توجهی بهتر باشند.

اوپن‌ای‌آی ادعا می‌کند که مدل کامل GPT-۴.۱ از مدل‌های GPT-۴o و GPT-۴o mini در معیار‌های کدنویسی مانند «SWE-bench» بهتر عمل می‌کند. گفته می‌شود که GPT-۴.۱ mini و nano با کمی دقت، کارآمدتر و سریع‌تر عمل می‌کنند و GPT-۴.۱ nano سریع‌ترین و ارزان‌ترین مدل آن است.

مدل GPT-۴.۱ برای هر میلیون توکن ورودی، دو دلار و برای هر میلیون توکن خروجی، هشت دلار هزینه دارد. هزینه GPT-۴.۱ mini برای هر میلیون توکن ورودی ۰.۴۰ دلار و برای میلیون توکن خروجی ۱.۶۰ دلار است و GPT-۴.۱ nano برای هر میلیون توکن ورودی ۰.۱۰ دلار و برای هر میلیون توکن خروجی ۰.۴۰ دلار هزینه دارد.

آزمایش داخلی اوپن‌ای‌آی نشان می‌دهد GPT-۴.۱ که می‌تواند هم‌زمان توکن‌های بیشتری را نسبت به GPT-۴o تولید کند (۳۲۷۶۸ در مقابل ۱۶۳۸۴)، امتیازی بین ۵۲ تا ۵۴.۶ درصد در پایگاه داده «SWE-bench Verified» کسب کرده است. اوپن‌ای‌آی در یک پست وبلاگ خاطرنشان کرد که برخی از راه‌حل‌ها برای مشکلات SWE-bench Verified را نمی‌توان در زیرساخت‌های آن اجرا کرد و به همین دلیل، این دامنه امتیاز‌ها وجود دارند. این ارقام کمی کمتر از امتیازات گزارش‌شده توسط گوگل و آنتروپیک برای جمینای ۲.۵ پرو (۶۳.۸ درصد) و کلود ۳.۷ سونت (۶۲.۳ درصد) هستند.

اوپن‌ای‌آی در یک ارزیابی جداگانه، GPT-۴.۱ را با استفاده از «Video-MME» بررسی کرد که برای ارزیابی توانایی یک مدل در درک محتوای ویدئو‌ها طراحی شده است. اوپن‌ای‌آی ادعا می‌کند که GPT-۴.۱ به دقت ۷۲ درصدی در مقوله ویدئو‌های طولانی و بدون زیرنویس رسیده است.

اگرچه GPT-۴.۱ امتیاز قابل قبولی را در معیار‌ها کسب کرده و دارای یک رکورد جدیدتر در آموزش داده است، اما به خاطر داشته باشید حتی برخی از بهترین مدل‌های امروزی در حال دست‌وپنجه نرم کردن با وظایفی هستند که متخصصان را غافلگیر نمی‌کنند. به عنوان مثال، بسیاری از پژوهش‌ها نشان داده‌اند که مدل‌های تولیدکننده کد اغلب در رفع و حتی معرفی آسیب‌پذیری‌ها و مشکلات امنیتی شکست می‌خورند.

همچنین، اوپن‌ای‌آی تصدیق می‌کند که GPT-۴.۱ هر چه توکن‌های ورودی بیشتری داشته باشد، کمتر قابل اعتماد می‌شود؛ یعنی احتمال بروز اشتباه افزایش می‌یابد. در یکی از آزمایش‌های خود اوپن‌ای‌آی موسوم به «OpenAI-MRCR»، دقت مدل از حدود ۸۴ درصد با ۸۰۰۰ توکن به ۵۰ درصد با یک میلیون توکن کاهش یافت. اوپن‌ای‌آی می‌گوید که GPT-۴.۱ نسبت به GPT-۴o به معنای واقعی کلمه دقیق‌تر است و گاهی اوقات به درخواست‌های مشخص‌تر و واضح‌تر نیاز دارد.

برچسب ها: هوش مصنوعی
آخرین اخبار
پربازدید ها
اخبار داغ
زمان بازی‌های تیم ملی فوتبال ایران در جام جهانی ۲۰۲۶ زمان بازی‌های تیم ملی فوتبال ایران در جام جهانی ۲۰۲۶
طبق برنامه اعلام‌شده، تیم ملی فوتبال ایران نخستین مسابقه خود را برابر نیوزیلند، سپس برابر بلژیک قرار و بعد از آن مقابل مصر قرار خواهد گرفت
زنده از مراسم قرعه‌کشی جام جهانی ۲۰۲۶؛ بزرگ‌ترین رویداد تاریخ فوتبال زنده از مراسم قرعه‌کشی جام جهانی ۲۰۲۶؛ بزرگ‌ترین رویداد تاریخ فوتبال
قرعه‌کشی جام جهانی ۲۰۲۶ نه تنها مسیر تیم‌ها را مشخص کرد، بلکه آغازگر شور و هیجان بی‌سابقه‌ای در فوتبال جهان شد. با حضور ۴۸ تیم، سه میزبان و ساختار تازه، این رقابت‌ها رکوردشکن خواهد بود و تجربه‌ای بی‌نظیر برای هواداران سراسر جهان رقم خواهد زد.
پرسپولیس استقلال؛ باز هم تساوی پرسپولیس استقلال؛ باز هم تساوی
این تساوی در حالی رقم خورد که برنده این بازی شانس مستقیم صدر جدول بود. البته استقلالی‌ها با همین تساوی هم رده اول را حفظ کردند اما فرصت تعمیق اختلاف با دیگر مدعیان را از دست دادند.
«زوج‌ و فرد» در تهران سراسری شد؛ حتی مجوز طرح هم جلوی جریمه را نمی‌گیرد «زوج‌ و فرد» در تهران سراسری شد؛ حتی مجوز طرح هم جلوی جریمه را نمی‌گیرد
معاون حمل‌ونقل شهرداری تهران اعلام کرد: در روزهای آلودگی شدید هوا، طرح زوج‌وفرد به‌صورت سراسری و از درب منازل اجرا می‌شود.
دوربین‌های پرچمدار جدید چینی ویوو X۳۰۰ پرو دوربین‌های پرچمدار جدید چینی ویوو X۳۰۰ پرو
نتایج بررسی دوربین ویوو X۳۰۰ پرو منتشر شد و دنیای موبایل را شگفت‌زده کرد. این پرچمدار جدید با ترکیب دوربین ۲۰۰ مگاپیکسلی زایس و یک باتری غول‌پیکر، عملاً استاندارد‌های سال ۲۰۲۶ را جابه‌جا کرده است.
ظاهر جدید ستاره پرسپولیس برای بازی دربی ظاهر جدید ستاره پرسپولیس برای بازی دربی
محمد عمری، مهاجم پرسپولیس که این فصل در پست جدید خود در کنار علی علیپور یکی از زوج‌های اصلی خط حمله سرخپوشان را تشکیل داده، با تغییر استایل ظاهری خود آماده نبرد حساس دربی برابر استقلال می‌شود.
پس گرفتن استعفا پژمان بازغی و سام درخشانی پس گرفتن استعفا پژمان بازغی و سام درخشانی
متن استعفای پژمان بازغی و سام درخشانی پس از پذیرفته نشدن کناره‌گیری‌شان حذف شد.
برگزیده
هفته دیزاین تهران با دخالت بسیج دانشجویی متوقف شد! هفته دیزاین تهران با دخالت بسیج دانشجویی متوقف شد!
با چند توییت، یک برنامه مورد توجه جوانان تعطیل شد؛ این اتفاقی است که برای رویداد «هفته دیزاین تهران» در دانشکده هنر‌های زیبای دانشگاه تهران رخ داد.
مهاجرت از کابل مسی به فیبرنوری، زیرساخت زندگی دیجیتال ایرانیان مهاجرت از کابل مسی به فیبرنوری، زیرساخت زندگی دیجیتال ایرانیان
در سال‌های اخیر، با رشد فناوری‌های نوین مانند هوش مصنوعی و اینترنت اشیا، نیاز به اتصال پرسرعت و پایدار به اینترنت بیش از پیش احساس می‌شود. پروژه مهاجرت از کابل مسی به فیبر نوری (سوآپ)، پاسخ به این نیازهاست و با اجرای آن، زیرساخت‌های ارتباطی کشور به‌طور اساسی به‌روز خواهد شد
کاهش کشفیات تریاک، شرکت های دارویی را با مشکل مواجه کرده کاهش کشفیات تریاک، شرکت های دارویی را با مشکل مواجه کرده
مدیرکل درمان ستاد مبارزه با مواد مخدر با اشاره به کاهش منابع تأمین مواد اولیه دارو‌های مخدر، از جمله دارو‌های مورد استفاده در درمان سرطان، درد‌های مزمن و اعتیاد، اعلام کرد که شرکت‌های دارویی با مشکلات جدی مواجه شده‌اند
صفحه خبر بالای تصاویر