مخاطب۲۴ اخبار و تحلیل های اقتصادی، سیاسی و اجتماعی را در هفت روز هفته و در بیست و چهار ساعت شبانهروز در اختیار شما قرار میدهد
مرتب دستهای خود را با استفاده از آب و صابون شستشو کنید و یا با مواد ضدعفونی کننده الکلی ضدعفونی نمایید. هنگام سرفه و عطسه جلوی دهان و بینی خود را با آرنج یا دستمال بگیرید و بلافاصله دستمال را دور انداخته و دست های خود را بشویید.
«اوپنایآی» روز دوشنبه خانواده جدیدی از مدلهای هوش مصنوعی خود را به نام «GPT-۴.۱» معرفی کرد که تمرکز آن بر کدنویسی است.
مخاطب۲۴- هوش مصنوعی- «اوپنایآی» (OpenAI) در حال حاضر مدلهای «GPT-۴.۱»، «GPT-۴.۱ mini» و «GPT-۴.۱ nano» را دارد که برتری خود را در کدنویسی و دنبال کردن دستورالعملها نشان دادهاند. مدلهای چندوجهی که از طریق API اوپنایآی در دسترس هستند، میتوانند هر بار تقریبا یک میلیون توکن (۷۵۰ هزار کلمه) را دریافت کنند. این میزان کلمه، یک متن طولانیتر از رمان «جنگ و صلح» را تشکیل میدهد.
GPT-۴.۱ زمانی وارد شده است که رقبای اوپنایآی مانند «گوگل» و «آنتروپیک» تلاشهای خود را برای ساخت مدلهای برنامهنویسی پیچیده افزایش میدهند. «جمینای ۲.۵ پرو» (Gemini ۲.۵ Pro) که اخیرا توسط گوگل منتشر شد و یک میلیون توکن را پوشش میدهد، رتبه بالایی را در معیارهای محبوب کدنویسی دارد. «کلود ۳.۷ سونت» (Claude ۳.۷ Sonnet) و «V۳» ارتقاءیافته شرکت چینی «دیپسیک» (DeepSeek) نیز همین طور هستند.
هدف بسیاری از غولهای فناوری از جمله اوپنایآی، آموزش دادن مدلهای کدنویسی هوش مصنوعی است که میتوانند وظایف پیچیده مهندسی نرمافزار را انجام دهند. «سارا فریار» (Sarah Friar)، مدیر ارشد مالی اوپنایآی ماه گذشته در نشست فناوری لندن گفت که جاهطلبی بزرگ این شرکت، ایجاد یک مهندس نرمافزار عاملی است. این شرکت ادعا میکند که مدلهای آینده آن میتوانند همه برنامهها را به صورت سرتاسری برنامهریزی کنند و بر جنبههایی مانند تضمین کیفیت، آزمایش مشکل و نوشتن مستندات مدیریت داشته باشند.
مدل GPT-۴.۱ گامی در این مسیر است. یکی از سخنگویان اوپنایآی در یک ایمیل به تک کرانچ، گفت: ما GPT-۴.۱ را برای استفاده در دنیای واقعی بر اساس بازخورد مستقیم تنظیم کردهایم تا در زمینههایی که توسعهدهندگان بیشتر به آنها اهمیت میدهند مانند برنامهنویسی فرانتاند، کاهش ویرایشهای اضافی، فرمتهای قابل اعتماد، رعایت ساختار پاسخ و سفارش، استفاده ثابت از فناوری و موارد دیگر بهبود پیدا کنیم. این پیشرفتها توسعهدهندگان را قادر میسازند تا عواملی را ارائه دهند که در کارهای مهندسی نرمافزار در دنیای واقعی به طور قابل توجهی بهتر باشند.
اوپنایآی ادعا میکند که مدل کامل GPT-۴.۱ از مدلهای GPT-۴o و GPT-۴o mini در معیارهای کدنویسی مانند «SWE-bench» بهتر عمل میکند. گفته میشود که GPT-۴.۱ mini و nano با کمی دقت، کارآمدتر و سریعتر عمل میکنند و GPT-۴.۱ nano سریعترین و ارزانترین مدل آن است.
مدل GPT-۴.۱ برای هر میلیون توکن ورودی، دو دلار و برای هر میلیون توکن خروجی، هشت دلار هزینه دارد. هزینه GPT-۴.۱ mini برای هر میلیون توکن ورودی ۰.۴۰ دلار و برای میلیون توکن خروجی ۱.۶۰ دلار است و GPT-۴.۱ nano برای هر میلیون توکن ورودی ۰.۱۰ دلار و برای هر میلیون توکن خروجی ۰.۴۰ دلار هزینه دارد.
آزمایش داخلی اوپنایآی نشان میدهد GPT-۴.۱ که میتواند همزمان توکنهای بیشتری را نسبت به GPT-۴o تولید کند (۳۲۷۶۸ در مقابل ۱۶۳۸۴)، امتیازی بین ۵۲ تا ۵۴.۶ درصد در پایگاه داده «SWE-bench Verified» کسب کرده است. اوپنایآی در یک پست وبلاگ خاطرنشان کرد که برخی از راهحلها برای مشکلات SWE-bench Verified را نمیتوان در زیرساختهای آن اجرا کرد و به همین دلیل، این دامنه امتیازها وجود دارند. این ارقام کمی کمتر از امتیازات گزارششده توسط گوگل و آنتروپیک برای جمینای ۲.۵ پرو (۶۳.۸ درصد) و کلود ۳.۷ سونت (۶۲.۳ درصد) هستند.
اوپنایآی در یک ارزیابی جداگانه، GPT-۴.۱ را با استفاده از «Video-MME» بررسی کرد که برای ارزیابی توانایی یک مدل در درک محتوای ویدئوها طراحی شده است. اوپنایآی ادعا میکند که GPT-۴.۱ به دقت ۷۲ درصدی در مقوله ویدئوهای طولانی و بدون زیرنویس رسیده است.
اگرچه GPT-۴.۱ امتیاز قابل قبولی را در معیارها کسب کرده و دارای یک رکورد جدیدتر در آموزش داده است، اما به خاطر داشته باشید حتی برخی از بهترین مدلهای امروزی در حال دستوپنجه نرم کردن با وظایفی هستند که متخصصان را غافلگیر نمیکنند. به عنوان مثال، بسیاری از پژوهشها نشان دادهاند که مدلهای تولیدکننده کد اغلب در رفع و حتی معرفی آسیبپذیریها و مشکلات امنیتی شکست میخورند.
همچنین، اوپنایآی تصدیق میکند که GPT-۴.۱ هر چه توکنهای ورودی بیشتری داشته باشد، کمتر قابل اعتماد میشود؛ یعنی احتمال بروز اشتباه افزایش مییابد. در یکی از آزمایشهای خود اوپنایآی موسوم به «OpenAI-MRCR»، دقت مدل از حدود ۸۴ درصد با ۸۰۰۰ توکن به ۵۰ درصد با یک میلیون توکن کاهش یافت. اوپنایآی میگوید که GPT-۴.۱ نسبت به GPT-۴o به معنای واقعی کلمه دقیقتر است و گاهی اوقات به درخواستهای مشخصتر و واضحتر نیاز دارد.
وزیر امور خارجه در سخنانی در پایان سفر به مسکو، ضمن ارزیابی مثبت مذاکرات خود با رئیسجمهور و وزیر امور خارجه روسیه گفت: هفته آینده برای رایزنی با مقامات چین به پکن سفر میکنم.
در قلب خارطوم، جایی که دو رود بزرگ نیل آبی و نیل سفید به یکدیگر میپیوندند، جزیرهای قد برافراشته که روایتگر پیوندی هزارساله میان انسان، طبیعت و فرهنگ است. توتی، جزیرهای ناشناخته، اما پررمز، امروز به نماد تابآوری فرهنگی در برابر بلایا و درگیریها بدل شده و بهانهای شده تا در روز جهانی بناها و محوطههای تاریخی، از تجربهای آفریقایی برای نجات میراثفرهنگی در خطر بیاموزیم.
کریس کلمبوس، کارگردان فیلم محبوب «تنها در خانه ۲»، میگوید صحنه هفتثانیهای از حضور رئیسجمهور آمریکا دونالد ترامپ در این فیلم برایش به «نفرین» تبدیل شده و بابت این سکانس پشیمان است.
حالی برابر حکم کمیته انضباطی قرار است دیدار پرسپولیس و سپاهان تنها با حضور بانوان تماشاگر برگزار شود، تماشاگران مرد هم در جایگاه ویژه این مسابقه حضور دارند.
رئیس سازمان سنجش آموزش کشور از انتشار کارنامه نتایج اولیه آزمون ورودی مقطع دکتری نیمهمتمرکز سال ۱۴۰۴ خبر داد و گفت: متقاضیان مجاز میتوانند از روز دوشنبه اول اردیبهشتماه نسبت به انتخاب رشته اقدام کنند.