کد خبر: ۴۵۱۴۹
تاریخ انتشار: ۰۹ تير ۱۴۰۳ - ۲۱:۱۶

رونمایی از مدل‌های زبانی فارسی همراه اول با حضور وزیر ارتباطات

مدل‌های زبانی فارسی توسعه یافته توسط همراه اول که با هوش مصنوعی قادر به تحلیل و یادگیری حجم زیادی از داده‌های متنی هستند، با حضور وزیر ارتباطات در الکامپ ۱۴۰۳، رونمایی شدند.
رونمایی از مدل‌های زبانی فارسی همراه اول با حضور وزیر ارتباطات

به گزارش مخاطب 24 به نقل از روابط عمومی همراه اول:گروه MCINext همراه اول در نخستین روز برگزاری نمایشگاه بین المللی الکامپ ۱۴۰۳، تعدادی از مدل‌های زبانی توسعه یافته خود شامل سیلک (با ۱.۳ میلیارد پارامتر)، آهوران (با ۸ میلیارد پارامتر) و آوا (با ۱۳ میلیارد پارامتر) را با حضور عیسی زارع پور وزیر ارتباطات و فناوری اطلاعات در سالن اختصاصی همراه اول (سالن ۳۵)، رونمایی کرد.

مدل‌های زبانی بزرگ (LLM)، سیستم‌های هوش مصنوعی هستند که با تحلیل و یادگیری از حجم زیادی از داده‌های متنی، قادر به تولید متن، ترجمه، پاسخ به سوالات و انجام وظایف مختلف زبانی هستند و در حال حاضر نیز با حمایت مرکز تحقیق و توسعه همراه اول توسعه یافته اند.

مدل زبانی سیلک که از پایه (from scratch) با مجموعه دادگان فارسی در این شرکت آموزش داده شده است، با وجود تعداد پارامتر نسبتا کم، قابلیت زبانی خوبی را به نمایش می‌گذارد که با ادامه فرآیند آموزش در آینده، از لحاظ دانش نیز بهتر خواهد شد.

مدل آهوران بر پایه مدل چند زبانه Llama۳ شرکت Meta و به صورت آموزش ادامه دار (continual pretraining) بر روی یک مجموعه دادگان فارسی توسعه داده شده است. با توجه به قابلیت‌های زیاد مدل پایه، ادامه آموزش، باعث تقویت تولید متن به زبان فارسی شده در حالیکه قابلیت‌های دیگر مدل تا حد زیادی حفظ شده است.

کاربرد‌های تجاری این مدل‌ها بسیار گسترده و نظیر تولید محتوای متنی خودکار، پشتیبانی مشتریان از طریق چت بات ها، تحلیل احساسات و نظرات کاربران در شبکه‌های اجتماعی و ایجاد ابزار‌های کمکی برای نویسندگان و مترجمان است. این مدل‌ها می‌توانند به شرکت‌ها در افزایش بهره وری، کاهش هزینه‌ها و بهبود تجربه مشتری کمک کنند.

مدل آوا به منظور پاسخگویی از داخل یک متن داده شده (context) و بر پایه مدل aya از شرکت cohere توسعه داده شده است.

بر خلاف دو مدل قبلی که جوابگوی سوالات کلی هستند، این مدل نیازمند ارایه اطلاعات اولیه برای پاسخگویی است (RAG) و تا حد امکان از ارائه اطلاعات استفاده شده در حین آموزش پرهیز می‌کند؛ استفاده اصلی این مدل در ربات‌های پاسخگوی خاص منظوره است.

علاوه بر آموزش این مدل ها، تلاش شده است تا به کمک روش‌های همترازسازی (RLHF و DPO) از تولید محتوای آسیب زا جلوگیری شود.

گروه MCINext همراه اول تلاش دارد تا در آینده نزدیک امکان استفاده عمومی از این مدل‌ها را نیز فراهم کند.

برچسب ها: همراه اول
آخرین اخبار
پربازدید ها
تصاویر
صفحه خبر بالای تصاویر
اخبار داغ
وعده‌های دنیامالی را جدی نگیرید! وعده‌های دنیامالی را جدی نگیرید!
هنوز تاریخ قطعی و دقیق برای آغاز لیگ‌برتر اعلام نشده که چالش تیم‌ها برای برگزاری بازی‌های خانگی‌شان شروع شده است. ورزشگاه آزادی همچنان در حال بازسازی است و وزیر ورزش هم صرفاً به اعلام تاریخی که نزدیک نیست، بسنده می‌کند.
شاید یاران پزشکیان اکنون به مخالفان او تبدیل شده باشند شاید یاران پزشکیان اکنون به مخالفان او تبدیل شده باشند
دو چهره سیاسی اصولگرا از اقدامات تندرو‌ها علیه مسعود پزشکیان انتقاد کردند و آن را کاری نامناسب دانستند.
لامین یامال وارث مسی لامین یامال وارث مسی
لامین یامال با حضور در کنار خوان لاپورتا، رئیس باشگاه بارسلونا، ‏پیراهن شماره ۱۰ بارسا را از او دریافت کرد. ‏
بازیکن لالیگا در تبریز توپ می‌زند بازیکن لالیگا در تبریز توپ می‌زند
مدافع فصل گذشته الاوس به تیم تراکتور پیوست.
دسترسی به اطلاعات حق همه مردم است، نه یک طبقه خاص دسترسی به اطلاعات حق همه مردم است، نه یک طبقه خاص
رئیس جمهور به ماجرای اینترنت طبقاتی واکنش نشان داد و تصریح کرد: دسترسی به اطلاعات آزاد حق همه مردم است، نه یک طبقه خاص. دولت موظف و مصمم است اینترنت آزاد، باکیفیت و فراگیر فراهم کند. مصوبه اخیر شورایعالی فضای مجازی برای حمایت از اقتصاد دیجیتال بود، نه محدودسازی.
بعد از سوپرمن؛ ۹ فیلم بعدی کمپانی DC را بشناسید! بعد از سوپرمن؛ ۹ فیلم بعدی کمپانی DC را بشناسید!
فیلم «سوپرمن» به‌عنوان آغازگر فاز جدید کمپانی DC، با استقبال خوبی از سوی مخاطبان همراه شده و حالا طرفداران مشتاقانه منتظر ادامه ماجرا هستند. از سوپرگرل و بتمن تا واندر وومن و حتی ضدقهرمان‌هایی مثل دث‌استروک و بین، این کمپانی برنامه‌ای بلندپروازانه با ۹ فیلم تاییدشده برای ساخت یک دنیای سینمایی منسجم در پیش دارد.
صدا و سیمای ملی یا شبکه های جبلی و جلیلی و رجبی! صدا و سیمای ملی یا شبکه های جبلی و جلیلی و رجبی!
بخشی از جامعه ما، ازجمله روشنفکران و مردم عادی، می‌دانند که آن‌چه از برخی تلویزیون‌های ماهواره‌ای فارسی‌زبان پخش می‌شود به چه میزان اغراق‌شده و ضدملی است. با این حال استدلال و تحلیل‌های آنها، جدا از عملکرد سوگیرانه‌شان، بعضا بسیار واقع‌گرایانه‌تر از صداوسیماست. به همین دلیل است که این رسانه‌ها توانسته‌اند به افکار عمومی ایران راه پیدا کنند.
برگزیده
ملت و ملی پرتکرارترین کلمات در سخنرانی امروز رهبر ملت و ملی پرتکرارترین کلمات در سخنرانی امروز رهبر
تحلیل متن خبر منتشره از بیانات امروز رهبر معظم انقلاب، از تاکید جدی ایشان روی کلیدواژه‌های مهم حکایت می‌کند.
فشار مهاجران افغان بر شبکه بهداشت فشار مهاجران افغان بر شبکه بهداشت
در هفته‌های اخیر، موج بازگشت اجباری مهاجران افغان از ایران به افغانستان ابعاد کم‌سابقه‌ای یافته است؛ روندی که هم نگرانی نهاد‌های بین‌المللی مانند یونیسف و سازمان جهانی مهاجرت را برانگیخته و هم واکنش‌های داخلی را نسبت به ظرفیت‌پذیری ایران در قبال مهاجرت غیرقانونی برانگیخته است.
دسترسی به اطلاعات حق همه مردم است، نه یک طبقه خاص دسترسی به اطلاعات حق همه مردم است، نه یک طبقه خاص
رئیس جمهور به ماجرای اینترنت طبقاتی واکنش نشان داد و تصریح کرد: دسترسی به اطلاعات آزاد حق همه مردم است، نه یک طبقه خاص. دولت موظف و مصمم است اینترنت آزاد، باکیفیت و فراگیر فراهم کند. مصوبه اخیر شورایعالی فضای مجازی برای حمایت از اقتصاد دیجیتال بود، نه محدودسازی.
صفحه خبر بالای تصاویر