یادگیری با نظارت

یادگیری با نظارت یا یادگیری تحت نظارت (به انگلیسی: Supervised learning) یکی از زیرمجموعه‌های یادگیری ماشینی است. در این روش مدل با دریافت اطلاعات برچسب زده شده آموزش می‌بیند و سعی می‌کند الگوی بین داده‌ها و برچسب‌هایشان را به صورت یک تابع یادگرفته و برچسب داده‌های جدید و دیده نشده را پیش‌بینی کند. از این روش هم در مسائل طبقه‌بندی و هم در مسائل رگرسیون استفاده می‌شود.^[۱]

روش کار

به‌طور کلی، الگوریتم‌های یادگیری با نظارت یک پروسهٔ آموزش (training) دارند که طی آن داده‌های برچسب‌گذاری شده به الگوریتم داده می‌شود و الگوریتم سعی می‌کند پارامترهای خودش را با استفاده از این داده‌ها بروزرسانی کند و بتواند برچسب داده‌های جدید را تشخیص دهد. روش کلی این کار به این صورت است که الگوریتم سعی می‌کند پارامترها را در جهتی تغییر دهد که خطای ایجاد شده در پیش‌بینی داده‌ها کمینه شود. این خطا با استفاده از تابعی که تابع هزینه نامیده می‌شود محاسبه می‌گردد.^[۲]^[۳]

یادگیری تحت نظارت نیازمند تعدادی داده ورودی به منظور آموزش سیستم است. با این حال رده‌ای از مسائل وجود دارند که خروجی مناسب که یک سیستم یادگیری تحت نظارت نیازمند آن است، برای آن‌ها موجود نیست. این نوع از مسائل چندان قابل جوابگویی با استفاده از یادگیری تحت نظارت نیستند. یادگیری تقویتی مدلی برای مسائلی از این قبیل فراهم می‌آورد. در یادگیری تقویتی، سیستم تلاش می‌کند تا تقابلات خود با یک محیط پویا را از طریق آزمون و خطا بهینه نماید. یادگیری تقویتی مسئله‌ای است که یک عامل که می‌بایست رفتار خود را از طریق تعاملات آزمون و خطا با یک محیط پویا فرا گیرد، با آن مواجه است. در یادگیری تقویتی هیچ نوع زوج ورودی- خروجی ارائه نمی‌شود. به جای آن، پس از اتخاذ یک عمل، حالت بعدی و پاداش بلافصل به عامل ارائه می‌شود. هدف اولیه برنامه‌ریزی عامل‌ها با استفاده از تنبیه و تشویق است بدون آنکه ذکری از چگونگی انجام وظیفه آن‌ها شود.^[۴]^[۵]

الگوریتم‌های مهم

از الگوریتم‌های مهم یادگیری بانظارت می‌توان به موارد زیر اشاره کرد:

رگرسیون خطی

رگرسیون خطی (Linear Regression) نوعی تابع پیش‌بینی‌کننده خطی است که برای پیش‌بینی یک متغیر از روی یک یا چند متغیر دیگر آموزش داده می‌شود. به متغیرهایی که پیش‌بینی بر روی آن انجام می‌شود متغیر وابسته و به متغیرهایی که پیش‌بینی به کمک آن‌ها انجام می‌شود متغیرهای مستقل می‌گویند. متغیرهای وابسته را معمولاً با و متغیرهای مستقل را با نمایش می‌دهند. اگر تنها یک متغیر مستقل وجود داشته باشد مدل رگرسیون خطی را ساده و در غیر این صورت چندگانه می‌نامند.^[۶]

درخت تصمیم

درخت تصمیم (Decision Tree) مدلی است که برای حل مسائل دسته‌بندی و رگرسیون (تخمین مقدار یک متغیر وابسته از روی تعدادی متغیر مستقل) استفاده می‌شود. در درخت تصمیم از روی داده‌های آموزش یک درخت دودویی ساخته می‌شود و مقادیر داده‌های جدید با استفاده از این درخت تعیین می‌شود.^[۷]

ماشین بردار پشتیبان

ماشین‌های بردار پشتیبان (Support vector machines - SVMs) مدل‌هایی هستند که برای مسائل دسته‌بندی و رگرسیون بکار می‌روند. در مسائل دسته‌بندی، هدف ماشین‌های پشتیبان یافتن یک ابرصفحهٔ جداکننده به نحوی است که بیشترین حاشیه (margin) را با نقاط هر دسته داشته باشد.

شبکه‌های عصبی

شبکه‌های عصبی (Neural Networks) سیستم‌هایی پیچیده هستند که از تعداد نسبتاً زیادی واحدهای پردازشی که نورون نامیده می‌شوند تشکیل شده‌اند. ایدهٔ اصلی این گونه شبکه‌ها تا حدودی الهام‌گرفته از شیوهٔ کارکرد سیستم عصبی موجودات زنده می‌باشد. شبکه‌های عصبی قادرند الگوهای نسبتاً پیچیده را در داده‌های ورودی شناسایی کنند و امروزه در بسیاری از حوزه‌های یادگیری ماشین کاربرد دارند.

کاربردها

الگوریتم‌های یادگیری با نظارت در بسیاری از حوزه‌های علوم کامپیوتر و داده‌کاوی کاربرد دارند. چند مورد عبارتند از:

پردازش تصویر و بینایی کامپیوتر

از مسائل مهم مطرح در بینایی کامپیوتر می‌توان به تشخیص چهره، تشخیص اشیا و طبقه‌بندی تصاویر بر اساس محتوایشان اشاره کرد. شبکه‌های عصبی که از روش‌های یادگیری با نظارت هستند از راه حل‌های مدرن این مسائل به‌شمار می‌روند که امروزه در عمل استفادهٔ گسترده‌ای دارند.

تشخیص دست خط

از تکنیک‌های مدرن در تشخیص دست‌خط و استخراج ویژگی‌های نوشته استفاده از شبکه‌های عصبی می‌باشد.

تشخیص هرزنامه

سپم (به انگلیسی: Spam) یا هرزنامه، به معنی پیام یا نامه الکترونیکی است که بدون درخواست گیرنده و به صورت انبوه فرستاده می‌شود. بهترین تکنولوژی که در حال حاضر برای توقف اسپم وجود دارد، استفاده از نرم‌افزارهای فیلترینگ است. این نوع برنامه‌ها، وجود کلید واژه‌های خاصی را در خط موضوع پیام، بررسی و در صورت شناسائی آنان، نامه الکترونیکی مورد نظر را حذف می‌نمایند. برخی از برنامه‌های فیلترینگ پیشرفته، با استفاده از روش‌های متعدد آماری (مانند فیلترینگ اسپم بیزی) اقدام به شناسائی اسپم بر اساس الگوهایی خاص می‌نمایند.

جستارهای وابسته

منابع

↑ van Engelen، J.E.؛ Hoos، H.H. (۲۰۲۰). «A survey on semi-supervised learning». Machine Learning (۱۰۹): ۳۷۳–۴۴۰.
↑ Roman, Victor. "Unsupervised Machine Learning: Clustering Analysis". Medium. Retrieved 2019-10-01.
↑ روش کار و الگوریتم‌های مهم یادگیری. «نظارت».
↑ Nguyen، Khoi؛ Todorovic، Sinisa (۲۰۲۰). «A Self-supervised GAN for Unsupervised Few-shot Object Recognition». arXiv.
↑ Reinforcement Learning
↑ Mardia, K. V; Kent, J. T.; Bibby, J. M. (1979). Multivariate Analysis. Academic Press. ISBN 0-12-471252-5.
↑ Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition. Springer Series in Statistics (به انگلیسی) (2 ed.). New York: Springer-Verlag.

یادگیری ساختاری در شبکه‌های بیزی

[1] van Engelen، J.E.؛ Hoos، H.H. (۲۰۲۰). «A survey on semi-supervised learning». Machine Learning (۱۰۹): ۳۷۳–۴۴۰.

[2] Roman, Victor. "Unsupervised Machine Learning: Clustering Analysis". Medium. Retrieved 2019-10-01.

[3] روش کار و الگوریتم‌های مهم یادگیری. «نظارت».

[4] Nguyen، Khoi؛ Todorovic، Sinisa (۲۰۲۰). «A Self-supervised GAN for Unsupervised Few-shot Object Recognition». arXiv.

[5] Reinforcement Learning

[MardiaK1979Multivariate-6] Mardia, K. V; Kent, J. T.; Bibby, J. M. (1979). Multivariate Analysis. Academic Press. ISBN 0-12-471252-5.

[:0-7] Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition. Springer Series in Statistics (به انگلیسی) (2 ed.). New York: Springer-Verlag.

[۱]

[۲]

[۳]

[۴]

[۵]

[۶]

[۷]

ن ب و علوم رایانه
Note: This template roughly follows the 2012 ACM Computing Classification System.
سخت‌افزار	برد مدار چاپی دستگاه جانبی مدار مجتمع یکپارچه‌سازی کلان‌مقیاس سامانه روی یک تراشه رایانش سبز خودکارسازی طراحی الکترونیکی شتاب‌دهنده سخت‌افزاری
سازمان سامانه‌های رایانه	معماری رایانه سامانه نهفته رایانش بی‌درنگ اطمینان‌پذیری
شبکه رایانه‌ای	معماری شبکه پروتکل ارتباطات سخت‌افزار شبکه برنامه‌ریز شبکه کارایی شبکه رایانه‌ای سرویس شبکه‌ای
سازمان نرم‌افزار	مفسر میان‌افزار ماشین مجازی سیستم‌عامل کیفیت نرم‌افزار
نظریه زبان‌های برنامه‌نویسی و ابزار توسعه نرم‌افزار	الگو برنامه‌نویسی زبان برنامه‌نویسی کامپایلر زبان خاص دامنه زبان مدل‌سازی چارچوب نرم‌افزاری محیط یکپارچه توسعه نرم‌افزار مدیریت پیکربندی نرم‌افزار کتابخانه (رایانه) مخزن نرم‌افزاری
توسعه نرم‌افزار	فرایند توسعه نرم‌افزار تحلیل نیازمندی‌ها طراحی نرم‌افزار ساخت نرم‌افزار استقرار نرم‌افزار تعمیر و نگهداری نرم‌افزار تیم برنامه‌نویسی نرم‌افزار متن‌باز برنامه‌نویسی آزمون نرم‌افزار
نظریه محاسبات	مدل محاسبه زبان صوری نظریه اتوماتا نظریه رایانش‌پذیری نظریه پیچیدگی محاسباتی منطق در علوم کامپیوتر معنی‌شناسی (علوم رایانه)
الگوریتمها	الگوریتم تحلیل الگوریتم‌ها کارایی الگوریتمی الگوریتم‌های تصادفی هندسه محاسباتی
ریاضیات رایانه	ریاضیات گسسته احتمالات آمار نرم‌افزار ریاضی نظریه اطلاعات آنالیز ریاضی آنالیز عددی
سامانه اطلاعاتی	پایگاه داده ذخیره‌سازی داده رایانه سامانه اطلاعات سازمانی نرم‌افزار اجتماعی سامانه اطلاعات جغرافیایی سامانه پشتیبانی تصمیم کنترل فرایند پایگاه داده چند رسانه‌ای داده‌کاوی کتابخانه دیجیتال سکوی رایانش بازاریابی اینترنتی وب جهان‌گستر بازیابی اطلاعات مستندسازی فنی
امنیت رایانه	رمزنگاری روش‌های صوری خدمات امنیتی سامانه تشخیص نفوذ خرابی سخت‌افزار امنیت شبکه امنیت اطلاعات امنیت برنامه
تعامل انسان و رایانه	طراحی تعاملی رایانش اجتماعی رایانش فراگیر مصورسازی دسترس‌پذیری رایانه واسط‌های کاربر رایانش پوشیدنی
همروندی	رایانش همزمان رایانش موازی رایانش توزیع‌شده چندریسمانی چندپردازشی
هوش مصنوعی	پردازش زبان‌های طبیعی بازنمود دانش بینایی رایانه‌ای برنامه‌ریزی خودکار بهینه‌سازی نظریه کنترل فلسفه هوش مصنوعی هوش مصنوعی توزیع شده استدلال خودکار زبان‌شناسی رایانشی یادگیری ماشین
یادگیری ماشین	یادگیری با نظارت یادگیری بی‌نظارت یادگیری تقویتی یادگیری چند-وظیفه‌ای روش اعتبارسنجی متقابل
گرافیک رایانه‌ای	پویانمایی رایانه‌ای رندرینگ (گرافیک رایانه‌ای) روتوش واحد پردازش گرافیکی واقعیت ترکیبی واقعیت مجازی فشرده‌سازی تصویر مدلسازی جامد
رایانش کاربردی	تجارت الکترونیک نرم‌افزار سازمانی ریاضیات محاسباتی فیزیک محاسباتی شیمی محاسباتی زیست‌شناسی محاسباتی علوم اجتماعی محاسباتی مهندسی و علم محاسبه انفورماتیک پزشکی هنر دیجیتال نشر الکترونیک جنگ مجازی رأی‌گیری الکترونیکی بازی ویدئویی واژه‌پرداز تحقیق در عملیات فناوری آموزشی سامانه مدیریت اسناد
توجه: بنا بر سامانه رده‌بندی رایانش ای‌سی‌ام علم رایانه همچنین می‌تواند به موضوع‌ها یا زمینه‌های گوناگون تقسیم شود. کتاب:علوم رایانه رده:علوم رایانه طرح کلی علوم رایانه ویکی‌پدیا:ویکی‌پروژه علوم رایانه ویکی‌انبار