کد خبر: ۶۰۲۸۱

تاریخ انتشار: ۲۶ فروردين ۱۴۰۴ - ۱۳:۲۹

اجتماعی » علم و فناوری اطلاعات

همه چیز درباره هوش مصنوعی جدید «اوپن‌ای‌آی»

«اوپن‌ای‌آی» روز دوشنبه خانواده جدیدی از مدل‌های هوش مصنوعی خود را به نام «GPT-۴.۱» معرفی کرد که تمرکز آن بر کدنویسی است.

مخاطب۲۴- هوش مصنوعی- «اوپن‌ای‌آی» (OpenAI) در حال حاضر مدل‌های «GPT-۴.۱»، «GPT-۴.۱ mini» و «GPT-۴.۱ nano» را دارد که برتری خود را در کدنویسی و دنبال کردن دستورالعمل‌ها نشان داده‌اند. مدل‌های چندوجهی که از طریق API اوپن‌ای‌آی در دسترس هستند، می‌توانند هر بار تقریبا یک میلیون توکن (۷۵۰ هزار کلمه) را دریافت کنند. این میزان کلمه، یک متن طولانی‌تر از رمان «جنگ و صلح» را تشکیل می‌دهد.

GPT-۴.۱ زمانی وارد شده است که رقبای اوپن‌ای‌آی مانند «گوگل» و «آنتروپیک» تلاش‌های خود را برای ساخت مدل‌های برنامه‌نویسی پیچیده افزایش می‌دهند. «جمینای ۲.۵ پرو» (Gemini ۲.۵ Pro) که اخیرا توسط گوگل منتشر شد و یک میلیون توکن را پوشش می‌دهد، رتبه بالایی را در معیار‌های محبوب کدنویسی دارد. «کلود ۳.۷ سونت» (Claude ۳.۷ Sonnet) و «V۳» ارتقاءیافته شرکت چینی «دیپ‌سیک» (DeepSeek) نیز همین طور هستند.

بیشتر بخوانید

هدف بسیاری از غول‌های فناوری از جمله اوپن‌ای‌آی، آموزش دادن مدل‌های کدنویسی هوش مصنوعی است که می‌توانند وظایف پیچیده مهندسی نرم‌افزار را انجام دهند. «سارا فریار» (Sarah Friar)، مدیر ارشد مالی اوپن‌ای‌آی ماه گذشته در نشست فناوری لندن گفت که جاه‌طلبی بزرگ این شرکت، ایجاد یک مهندس نرم‌افزار عاملی است. این شرکت ادعا می‌کند که مدل‌های آینده آن می‌توانند همه برنامه‌ها را به صورت سرتاسری برنامه‌ریزی کنند و بر جنبه‌هایی مانند تضمین کیفیت، آزمایش مشکل و نوشتن مستندات مدیریت داشته باشند.

مدل GPT-۴.۱ گامی در این مسیر است. یکی از سخن‌گویان اوپن‌ای‌آی در یک ایمیل به تک کرانچ، گفت: ما GPT-۴.۱ را برای استفاده در دنیای واقعی بر اساس بازخورد مستقیم تنظیم کرده‌ایم تا در زمینه‌هایی که توسعه‌دهندگان بیشتر به آنها اهمیت می‌دهند مانند برنامه‌نویسی فرانت‌اند، کاهش ویرایش‌های اضافی، فرمت‌های قابل اعتماد، رعایت ساختار پاسخ و سفارش، استفاده ثابت از فناوری و موارد دیگر بهبود پیدا کنیم. این پیشرفت‌ها توسعه‌دهندگان را قادر می‌سازند تا عواملی را ارائه دهند که در کار‌های مهندسی نرم‌افزار در دنیای واقعی به طور قابل توجهی بهتر باشند.

اوپن‌ای‌آی ادعا می‌کند که مدل کامل GPT-۴.۱ از مدل‌های GPT-۴o و GPT-۴o mini در معیار‌های کدنویسی مانند «SWE-bench» بهتر عمل می‌کند. گفته می‌شود که GPT-۴.۱ mini و nano با کمی دقت، کارآمدتر و سریع‌تر عمل می‌کنند و GPT-۴.۱ nano سریع‌ترین و ارزان‌ترین مدل آن است.

مدل GPT-۴.۱ برای هر میلیون توکن ورودی، دو دلار و برای هر میلیون توکن خروجی، هشت دلار هزینه دارد. هزینه GPT-۴.۱ mini برای هر میلیون توکن ورودی ۰.۴۰ دلار و برای میلیون توکن خروجی ۱.۶۰ دلار است و GPT-۴.۱ nano برای هر میلیون توکن ورودی ۰.۱۰ دلار و برای هر میلیون توکن خروجی ۰.۴۰ دلار هزینه دارد.

آزمایش داخلی اوپن‌ای‌آی نشان می‌دهد GPT-۴.۱ که می‌تواند هم‌زمان توکن‌های بیشتری را نسبت به GPT-۴o تولید کند (۳۲۷۶۸ در مقابل ۱۶۳۸۴)، امتیازی بین ۵۲ تا ۵۴.۶ درصد در پایگاه داده «SWE-bench Verified» کسب کرده است. اوپن‌ای‌آی در یک پست وبلاگ خاطرنشان کرد که برخی از راه‌حل‌ها برای مشکلات SWE-bench Verified را نمی‌توان در زیرساخت‌های آن اجرا کرد و به همین دلیل، این دامنه امتیاز‌ها وجود دارند. این ارقام کمی کمتر از امتیازات گزارش‌شده توسط گوگل و آنتروپیک برای جمینای ۲.۵ پرو (۶۳.۸ درصد) و کلود ۳.۷ سونت (۶۲.۳ درصد) هستند.

اوپن‌ای‌آی در یک ارزیابی جداگانه، GPT-۴.۱ را با استفاده از «Video-MME» بررسی کرد که برای ارزیابی توانایی یک مدل در درک محتوای ویدئو‌ها طراحی شده است. اوپن‌ای‌آی ادعا می‌کند که GPT-۴.۱ به دقت ۷۲ درصدی در مقوله ویدئو‌های طولانی و بدون زیرنویس رسیده است.

اگرچه GPT-۴.۱ امتیاز قابل قبولی را در معیار‌ها کسب کرده و دارای یک رکورد جدیدتر در آموزش داده است، اما به خاطر داشته باشید حتی برخی از بهترین مدل‌های امروزی در حال دست‌وپنجه نرم کردن با وظایفی هستند که متخصصان را غافلگیر نمی‌کنند. به عنوان مثال، بسیاری از پژوهش‌ها نشان داده‌اند که مدل‌های تولیدکننده کد اغلب در رفع و حتی معرفی آسیب‌پذیری‌ها و مشکلات امنیتی شکست می‌خورند.

همچنین، اوپن‌ای‌آی تصدیق می‌کند که GPT-۴.۱ هر چه توکن‌های ورودی بیشتری داشته باشد، کمتر قابل اعتماد می‌شود؛ یعنی احتمال بروز اشتباه افزایش می‌یابد. در یکی از آزمایش‌های خود اوپن‌ای‌آی موسوم به «OpenAI-MRCR»، دقت مدل از حدود ۸۴ درصد با ۸۰۰۰ توکن به ۵۰ درصد با یک میلیون توکن کاهش یافت. اوپن‌ای‌آی می‌گوید که GPT-۴.۱ نسبت به GPT-۴o به معنای واقعی کلمه دقیق‌تر است و گاهی اوقات به درخواست‌های مشخص‌تر و واضح‌تر نیاز دارد.

X Share

Stumble Upon Delicious

Digg Cloob

برچسب ها: هوش مصنوعی

لینک کوتاه

لینک کپی شد

نظر شما

آخرین اخبار

پزشکیان: آینده ایران را مردمش رقم خواهند زد

مقایسه هزینه ساخت جوی آب با جدول بتنی نیم شیب و نیم جوی (کانیو)

بهترین مسیر و وسیله برای سفر به مشهد کدام است؟

از قرارداد کاری تا کارت قرمز-سفید-قرمز اتریش

کاربردهای WD40 در خودرو و اشتباهات رایج مصرف

آیا وکیل شیراز می‌تواند حکم قطعی دادگاه تجدیدنظر را تغییر دهد؟

۴ راه قانونی برای مطالبه نفقه که باید بشناسید

تعرفه و هزینه حق الوکاله وکیل پایه یک تهران در سال ۱۴۰۵

آیا به رای قطعی دادگاه تجدید نظر می توان اعتراض کرد؟

منچسترسیتی قیمت نهایی رودری را مشخص کرد

ترامپ خواستار موافقت ایران با آتش بس است

چرا زلنسکی به ترامپ درخواست استارلینک داد؟

عراقچی: آب را می‌توان به موضوع همکاری با همسایگان تبدیل کرد

تردد از تنگه هرمز امکان‌پذیر نیست!

کشف سلول‌های وابسته به اوکراین در عراق، خطری برای امنیت منطقه است

پربازدید ها

آیا وکیل شیراز می‌تواند حکم قطعی دادگاه تجدیدنظر را تغییر دهد؟

تعرفه و هزینه حق الوکاله وکیل پایه یک تهران در سال ۱۴۰۵

آیا به رای قطعی دادگاه تجدید نظر می توان اعتراض کرد؟

۴ راه قانونی برای مطالبه نفقه که باید بشناسید

پربحث ترین ها

پزشکیان: آینده ایران را مردمش رقم خواهند زد ( نظر)

مقایسه هزینه ساخت جوی آب با جدول بتنی نیم شیب و نیم جوی (کانیو) ( نظر)

بهترین مسیر و وسیله برای سفر به مشهد کدام است؟ ( نظر)

از قرارداد کاری تا کارت قرمز-سفید-قرمز اتریش ( نظر)

کاربردهای WD40 در خودرو و اشتباهات رایج مصرف ( نظر)

آیا وکیل شیراز می‌تواند حکم قطعی دادگاه تجدیدنظر را تغییر دهد؟ ( نظر)

۴ راه قانونی برای مطالبه نفقه که باید بشناسید ( نظر)

تعرفه و هزینه حق الوکاله وکیل پایه یک تهران در سال ۱۴۰۵ ( نظر)

آیا به رای قطعی دادگاه تجدید نظر می توان اعتراض کرد؟ ( نظر)

منچسترسیتی قیمت نهایی رودری را مشخص کرد ( نظر)

ترامپ خواستار موافقت ایران با آتش بس است ( نظر)

چرا زلنسکی به ترامپ درخواست استارلینک داد؟ ( نظر)

عراقچی: آب را می‌توان به موضوع همکاری با همسایگان تبدیل کرد ( نظر)

تردد از تنگه هرمز امکان‌پذیر نیست! ( نظر)

پرطرفدارترین ها

آیا وکیل شیراز می‌تواند حکم قطعی دادگاه تجدیدنظر را تغییر دهد؟

۴ راه قانونی برای مطالبه نفقه که باید بشناسید

تعرفه و هزینه حق الوکاله وکیل پایه یک تهران در سال ۱۴۰۵

آیا به رای قطعی دادگاه تجدید نظر می توان اعتراض کرد؟

تصاویر

فسیل زنده در تالاب بین المللی هامون+عکس

مستند زندگی رهبر جدید ایران + ویدئو

رئیس مجلس: حقوق‌ها می‌تواند سالی ۲ بار افزایش پیدا کند

اخبار داغ

منچسترسیتی قیمت نهایی رودری را مشخص کرد

در حالی که طی ساعت‌های اخیر شایعات درباره نزدیک شدن رودری به رئال مادرید شدت گرفته، تازه‌ترین گزارش‌ها از فابریزیو رومانو نشان می‌دهد روند این انتقال با سرعت مورد انتظار و بالایی پیش نمی‌رود

چرا زلنسکی به ترامپ درخواست استارلینک داد؟

یک رسانه آمریکایی در گزارشی بیان کرده است که رییس جمهور اوکراین به دنبال استفاده از نفوذ ترامپ روی ایلان ماسک است تا محدودیت استارلینک در این کشور را بردارد.

ترامپ: محاصره دریایی ایران الان لغو می شود

دونالد ترامپ، رئیس‌جمهور آمریکا، در پیامی در شبکه اجتماعی تروث سوشال بار دیگر ادعاهایی درباره برنامه هسته‌ای ایران و وضعیت تنگه هرمز مطرح کرد او این پیام نوشت ایران باید موافقت کند که هرگز به سلاح هسته‌ای دست نخواهد یافت و تأکید کرد تا اطلاع ثانوی هیچ پولی میان طرفین رد و بدل نخواهد شد.

قیمت طلا دلار نقره سکه بیت کوین جمعه ۸ خرداد

قیمت دلار، یورو، پوند، و سایر ارز‌ها سکه و قیمت طلا سکه پارسیان قیمت بیت کوین، اتریوم و سایر ارز‌های دیجیتال را می‌توانید در جدول زیر مشاهده نمایید. در ضمن به ساعت به‌روز‌رسانی این نرخ‌ها در بالای جدول دفت فرمایید.

صحبت‌های جی دی ونس از خروج خلبانان آمریکایی از ایران!

جی دی ونس، معاون اول رئیس جمهور آمریکا درباره فراری دادن دو خلبان جنگنده اف ۱۵ که توسط پدافند هوایی ایران ساقط شد، گفت: «پس از سقوط دو خلبان در ایران، ابتدا محل دقیق آنها مشخص نبود و حدود یک روز بعد تایید شد چراغ‌های اضطراری هر دو خدمه فعال است. او این عملیات را از جسورانه‌ترین صحنه‌های عمر خود توصیف کرد.»

انگلیس حلقه تحریم‌ها علیه روسیه را تنگ‌تر کرد

دولت انگلیس در ادامه تشدید فشار‌ها علیه مسکو، بسته تازه‌ای از محدودیت‌ها و تدابیر نظارتی را با هدف مقابله با آنچه مسیر‌های غیرمستقیم تجارت با روسیه خواند، اعلام کرد.

ثبت دمای ۴۸ درجه بالای صفر در دو نقطه کشور

در روز چهارشنبه ۶ خردادماه دو نقطه در ایران رکورد گرما را شکستند. بدین ترتیب، لامرد در استان فارس و راسک در استان سیستان و بلوچستان با ثبت دمای ۴۸ درجه سانتیگراد بالای صفر رکورد گرما در از ابتدای سال ۱۴۰۵ شکستند.

برگزیده

ثبت دمای ۴۸ درجه بالای صفر در دو نقطه کشور

وضعیت تعطیلی مدارس چه شد؟

برخی خانواده‌ها درخواست دارند که مدارس به صورت حضوری دایر شوند، اما وزارت آموزش‌وپرورش می‌گوید این امکان فعلاً نیست.

فردا ۶ استان کشور بارانی می‌شوند!

رئیس مرکز ملی پیش بینی و مدیریت بحران مخاطرات وضعیت هوا از ورود سامانه بارشی به کشور از روز یکشنبه (۶ اردیبهشت ماه) خبر داد.