۱۴۰۴/۰۹/۳۰ - ۱۵:۲۹

تحلیل کاربردی معماری‌های نوین هوش مصنوعی

کارگاه تخصصی «ظهور معماری‌های تخصصی هوش مصنوعی» با هدف تحلیل تطبیقی الگوهای نوین مدل‌های هوش مصنوعی در عصر پسا-مدل‌های زبان بزرگ، برگزار می‌شود.

تحلیل کاربردی معماری‌های نوین هوش مصنوعی

به گزارش سراج24؛ به نقل از مرکز ارتباطات و اطلاع‌رسانی معاونت علمی، فناوری و اقتصاد دانش‌بنیان ریاست جمهوری، مرکز رشد و نوآوری پژوهشگاه فرهنگ و اندیشه اسلامی با همکاری سازمان توسعه همکاری‌های علمی و فناورانه بین‌المللی ریاست‌جمهوری، کارگاه تخصصی «ظهور معماری‌های تخصصی هوش مصنوعی؛ تحلیل مقایسه‌ای ۸ الگوی مدل هوش مصنوعی در عصر پسا-مدل‌های زبان بزرگ را برگزار می‌کند.

این کارگاه با ارائه علیرضا قبادی، مدیر مشاور در حوزه هوش مصنوعی شرکت CGI آلمان، در روزهای دوشنبه ۲۲ و سه‌شنبه ۲۳ دی‌ماه ۱۴۰۴، از ساعت ۱۴ تا ۱۸، به صورت حضوری در مرکز رشد پژوهشگاه فرهنگ و اندیشه اسلامی برگزار خواهد شد. مدت زمان این برنامه آموزشی دو روز است و هر جلسه بین ۳ تا ۴ ساعت به طول می‌انجامد.

تمرکز اصلی این کارگاه، تحلیل تحول چشمگیر منظره هوش مصنوعی است؛ تحولی که در آن، رویکردهای مبتنی بر مدل‌های زبان بزرگ تک‌سنگ (LLM) جای خود را به اکوسیستمی متنوع‌تر و تخصصی‌تر از معماری‌های هوش مصنوعی می‌دهند. این گذار با هدف بهینه‌سازی کارایی محاسباتی و مصرف انرژی، همچنین فعال‌سازی تخصص عمیق دامنه‌محور در کاربردهای مختلف هوش مصنوعی دنبال می‌شود.

سرفصل‌ها و موضوعات روز اول

روز نخست کارگاه با محور «محدودیت‌های بنیادی، چارچوب مقایسه‌ای و مدل‌های کارایی» برگزار می‌شود و تمرکز آن بر درک سقف عملکرد LLMها، معرفی ابزارهای تحلیلی و بررسی مدل‌هایی است که برای مقیاس‌پذیری و کاهش هزینه‌های محاسباتی طراحی شده‌اند.

در ماژول‌های ۱ و ۲، خلاصه اجرایی و مقدمه‌ای درباره سقف LLMها ارائه می‌شود و رانشگرهای اصلی این تحول، شامل بهینه‌سازی کارایی محاسباتی و انرژی، غلبه بر محدودیت‌های اشباع پنجره متن (Context Window Saturation) و امکان یکپارچه‌سازی چندوجهی بدون نقص مورد بررسی قرار می‌گیرد. همچنین محدودیت‌های LLMهای سنتی، از جمله هزینه‌های محاسباتی بالا، ماهیت صرفاً متنی و نبود تخصص عمیق دامنه‌محور تحلیل می‌شود.

ماژول ۳ به تعریف چارچوب مقایسه‌ای اختصاص دارد و پنج محور اصلی ارزیابی معماری‌های هوش مصنوعی معرفی می‌شود؛ از جمله مدالیته‌های ورودی و خروجی، معماری هسته (مانند ترانسفورمر و مدل‌های انتشار)، مکانیزم‌های بهینه‌سازی، پیچیدگی یکپارچه‌سازی و دامنه‌های کاربردی.

در ماژول ۴، مدل‌های بنیادی و کارایی شامل مدل‌های زبان بزرگ (LLM) به‌عنوان ترانسفورمرهای صرفاً زبانی با کاربردهایی نظیر چت‌بات و خلاصه‌سازی، و همچنین مدل‌های زبان نقاب‌دار (MLM) با مزیت درک متنی قوی و کاربرد در جستجو و پرسش‌وپاسخ اسنادی بررسی می‌شوند.

ماژول ۵ به معماری‌های کارایی و مقیاس‌پذیری اختصاص دارد و ترکیب متخصصان (MoE) به‌عنوان رویکردی برای مسیریابی ماژولار و کاهش هزینه‌های محاسباتی، و نیز مدل‌های زبان کوچک (SLM) به‌عنوان ترانسفورمرهای فشرده و بهینه‌شده برای دستگاه‌های با منابع محدود معرفی می‌شود. در ادامه، مبحث ویژه‌ای به نقش SLMها در امنیت هوش مصنوعی و امکان اجرای مدل‌های حفظ‌کننده حریم خصوصی از طریق بهینه‌سازی روی دستگاه اختصاص دارد.

سرفصل‌ها و موضوعات روز دوم

روز دوم کارگاه با تمرکز بر «یکپارچه‌سازی چندوجهی و هیبریدهای مولد و استدلالی» برگزار می‌شود و به کاوش مدل‌هایی می‌پردازد که برای پردازش داده‌های متنوع، تولید پیشرفته و استدلال پیچیده در کاربردهای تخصصی طراحی شده‌اند.

در ماژول ۶، معماری‌های یکپارچه‌سازی چندوجهی شامل مدل‌های زبان-بینایی (VLM) برای درک مشترک تصویر و متن، و مدل تخصصی «هر چیزی را قطعه‌بندی کن» (SAM) برای بخش‌بندی بصری قابل تعمیم معرفی می‌شود. مبحث ویژه این بخش به کاربردهای بینایی کامپیوتر در تصویربرداری پزشکی و نقش SAM در تسهیل تشخیص زودهنگام و پشتیبانی از تشخیص خودکار بیماری‌ها اختصاص دارد.

ماژول ۷، به هیبریدهای مولد و استدلالی می‌پردازد و مدل‌های شرطی‌شده با زبان (LCM) به‌عنوان ترکیبی از مدل‌های انتشار و شرطی‌سازی زبانی، و همچنین مدل‌های منطق-عملیاتی (LAM) به‌عنوان سیستم‌های استدلال عصبی-نمادی با قابلیت حافظه یکپارچه معرفی می‌شوند. در مبحث ویژه این بخش، نقش LAMها در امنیت سایبری و دفاع هوش مصنوعی، از طریق استدلال متوالی و برنامه‌ریزی وظایف برای ساخت سیستم‌های دفاعی خودکار، بررسی می‌شود.

در ماژول ۸، سنتز نهایی و چشم‌انداز آینده ارائه شده و با مرور جدول مقایسه‌ای، نحوه رفع مشکل فقدان تخصص عمیق دامنه‌محور در LLMها توسط مدل‌های تخصصی تحلیل می‌شود. همچنین دامنه‌های کاربردی‌ای که هر مدل در آن‌ها بیشترین کارایی را دارد، از جمله هوش مصنوعی موبایل، سیستم‌های خودمختار و خدمات ابری، شناسایی می‌شود.

از مفاهیم کلیدی برجسته این کارگاه می‌توان به انتقال پارادایم از LLMهای عمومی به اکوسیستم‌های تخصصی مبتنی بر کارایی محاسباتی و انرژی، شکستن سیلوهای داده از طریق یکپارچه‌سازی چندوجهی، تقویت استدلال پیشرفته عصبی-نمادی و کاربرد این رویکردها در حوزه‌های حساس مانند تصویربرداری پزشکی و امنیت سایبری اشاره کرد.

اشتراک گذاری
نظرات کاربران
capcha
هفته نامه الکترونیکی
هفته‌نامه الکترونیکی سراج۲۴ - شماره ۲۹۹
آخرین مطالب
•••
•••
•••
•••
•••
•••
•••
•••
•••
•••
•••
•••
•••
•••
•••
•••
•••
•••
•••
•••
اوقات شرعی تهران
اذان صبح ۰۵:۴۰:۰۷
اذان ظهر ۱۲:۰۲:۲۶
اذان مغرب ۱۷:۱۴:۵۸
طلوع آفتاب ۰۷:۱۰:۱۳
غروب آفتاب ۱۶:۵۴:۳۹
نیمه شب ۲۳:۱۷:۲۳
قیمت سکه و ارز