به گزارش سراج24؛ به نقل از مرکز ارتباطات و اطلاعرسانی معاونت علمی، فناوری و اقتصاد دانشبنیان ریاست جمهوری، مرکز رشد و نوآوری پژوهشگاه فرهنگ و اندیشه اسلامی با همکاری سازمان توسعه همکاریهای علمی و فناورانه بینالمللی ریاستجمهوری، کارگاه تخصصی «ظهور معماریهای تخصصی هوش مصنوعی؛ تحلیل مقایسهای ۸ الگوی مدل هوش مصنوعی در عصر پسا-مدلهای زبان بزرگ را برگزار میکند.
این کارگاه با ارائه علیرضا قبادی، مدیر مشاور در حوزه هوش مصنوعی شرکت CGI آلمان، در روزهای دوشنبه ۲۲ و سهشنبه ۲۳ دیماه ۱۴۰۴، از ساعت ۱۴ تا ۱۸، به صورت حضوری در مرکز رشد پژوهشگاه فرهنگ و اندیشه اسلامی برگزار خواهد شد. مدت زمان این برنامه آموزشی دو روز است و هر جلسه بین ۳ تا ۴ ساعت به طول میانجامد.
تمرکز اصلی این کارگاه، تحلیل تحول چشمگیر منظره هوش مصنوعی است؛ تحولی که در آن، رویکردهای مبتنی بر مدلهای زبان بزرگ تکسنگ (LLM) جای خود را به اکوسیستمی متنوعتر و تخصصیتر از معماریهای هوش مصنوعی میدهند. این گذار با هدف بهینهسازی کارایی محاسباتی و مصرف انرژی، همچنین فعالسازی تخصص عمیق دامنهمحور در کاربردهای مختلف هوش مصنوعی دنبال میشود.
سرفصلها و موضوعات روز اول
روز نخست کارگاه با محور «محدودیتهای بنیادی، چارچوب مقایسهای و مدلهای کارایی» برگزار میشود و تمرکز آن بر درک سقف عملکرد LLMها، معرفی ابزارهای تحلیلی و بررسی مدلهایی است که برای مقیاسپذیری و کاهش هزینههای محاسباتی طراحی شدهاند.
در ماژولهای ۱ و ۲، خلاصه اجرایی و مقدمهای درباره سقف LLMها ارائه میشود و رانشگرهای اصلی این تحول، شامل بهینهسازی کارایی محاسباتی و انرژی، غلبه بر محدودیتهای اشباع پنجره متن (Context Window Saturation) و امکان یکپارچهسازی چندوجهی بدون نقص مورد بررسی قرار میگیرد. همچنین محدودیتهای LLMهای سنتی، از جمله هزینههای محاسباتی بالا، ماهیت صرفاً متنی و نبود تخصص عمیق دامنهمحور تحلیل میشود.
ماژول ۳ به تعریف چارچوب مقایسهای اختصاص دارد و پنج محور اصلی ارزیابی معماریهای هوش مصنوعی معرفی میشود؛ از جمله مدالیتههای ورودی و خروجی، معماری هسته (مانند ترانسفورمر و مدلهای انتشار)، مکانیزمهای بهینهسازی، پیچیدگی یکپارچهسازی و دامنههای کاربردی.
در ماژول ۴، مدلهای بنیادی و کارایی شامل مدلهای زبان بزرگ (LLM) بهعنوان ترانسفورمرهای صرفاً زبانی با کاربردهایی نظیر چتبات و خلاصهسازی، و همچنین مدلهای زبان نقابدار (MLM) با مزیت درک متنی قوی و کاربرد در جستجو و پرسشوپاسخ اسنادی بررسی میشوند.
ماژول ۵ به معماریهای کارایی و مقیاسپذیری اختصاص دارد و ترکیب متخصصان (MoE) بهعنوان رویکردی برای مسیریابی ماژولار و کاهش هزینههای محاسباتی، و نیز مدلهای زبان کوچک (SLM) بهعنوان ترانسفورمرهای فشرده و بهینهشده برای دستگاههای با منابع محدود معرفی میشود. در ادامه، مبحث ویژهای به نقش SLMها در امنیت هوش مصنوعی و امکان اجرای مدلهای حفظکننده حریم خصوصی از طریق بهینهسازی روی دستگاه اختصاص دارد.
سرفصلها و موضوعات روز دوم
روز دوم کارگاه با تمرکز بر «یکپارچهسازی چندوجهی و هیبریدهای مولد و استدلالی» برگزار میشود و به کاوش مدلهایی میپردازد که برای پردازش دادههای متنوع، تولید پیشرفته و استدلال پیچیده در کاربردهای تخصصی طراحی شدهاند.
در ماژول ۶، معماریهای یکپارچهسازی چندوجهی شامل مدلهای زبان-بینایی (VLM) برای درک مشترک تصویر و متن، و مدل تخصصی «هر چیزی را قطعهبندی کن» (SAM) برای بخشبندی بصری قابل تعمیم معرفی میشود. مبحث ویژه این بخش به کاربردهای بینایی کامپیوتر در تصویربرداری پزشکی و نقش SAM در تسهیل تشخیص زودهنگام و پشتیبانی از تشخیص خودکار بیماریها اختصاص دارد.
ماژول ۷، به هیبریدهای مولد و استدلالی میپردازد و مدلهای شرطیشده با زبان (LCM) بهعنوان ترکیبی از مدلهای انتشار و شرطیسازی زبانی، و همچنین مدلهای منطق-عملیاتی (LAM) بهعنوان سیستمهای استدلال عصبی-نمادی با قابلیت حافظه یکپارچه معرفی میشوند. در مبحث ویژه این بخش، نقش LAMها در امنیت سایبری و دفاع هوش مصنوعی، از طریق استدلال متوالی و برنامهریزی وظایف برای ساخت سیستمهای دفاعی خودکار، بررسی میشود.
در ماژول ۸، سنتز نهایی و چشمانداز آینده ارائه شده و با مرور جدول مقایسهای، نحوه رفع مشکل فقدان تخصص عمیق دامنهمحور در LLMها توسط مدلهای تخصصی تحلیل میشود. همچنین دامنههای کاربردیای که هر مدل در آنها بیشترین کارایی را دارد، از جمله هوش مصنوعی موبایل، سیستمهای خودمختار و خدمات ابری، شناسایی میشود.
از مفاهیم کلیدی برجسته این کارگاه میتوان به انتقال پارادایم از LLMهای عمومی به اکوسیستمهای تخصصی مبتنی بر کارایی محاسباتی و انرژی، شکستن سیلوهای داده از طریق یکپارچهسازی چندوجهی، تقویت استدلال پیشرفته عصبی-نمادی و کاربرد این رویکردها در حوزههای حساس مانند تصویربرداری پزشکی و امنیت سایبری اشاره کرد.




