پرش به محتوا

تنظیم تیخونوف

از ویکی‌پدیا، دانشنامهٔ آزاد

تنظیم تیخونوف، که به نام آندره تیخونوف نامگذاری شده‌است، روشی برای منظم‌سازی در مسئله کمترین مربعات است.[۱] این روش معمولاً در مدلهایی که تعداد زیادی پارامتر دارند خوب عمل می‌کند. به‌طور کلی، این روش در ازای مقدار قابل اغماضی از اریبی، باعث بهبود بازدهی برآورد پارامتر می‌شود.[۲]

تعریف ریاضی

[ویرایش]

کمترین مربعات

[ویرایش]

در مسئله کمترین مربعات هدف یافتن بردار است به قسمی که به کمترین مقدار ممکن برسد. در اینجا یک ماتریس ، و بردارهای هستند و . برای پیداکردن بهینه تابع، گرادیان را حساب کرده با صفر برابر می‌کنیم. نخست را بسط می‌دهیم:

حال گرادیان این تابع را نسبت به پیدا می‌کنیم که می‌شود:

با برابر قرار دادن گرادیان با صفر پارامتر بهینه بدست می‌آید:

تنظیم تیخونوف

[ویرایش]

یکی از مشکلات اساسی که در این روش کمترین مربعات وجود دارد مشکل عدم وجود ماتریس وارون برای است. برای حل این مشکل تنظیم تیخونوف تابع را به تابع پایین تغییر می‌دهد:[۲][۳]

حال گرادیان این تابع را نسبت به پیدا می‌کنیم که می‌شود:

با برابر قرار دادن گرادیان با صفر پارامتر بهینه بدست می‌آید:

پس پارامتر بهینه ما برابر است با:

رگرسیون ستیغی

[ویرایش]

اگر را با (در اینجا ماتریس همانی است) برابر قرار دهیم، به جواب پایین می‌رسیم که همان رگرسیون ستیغی است. در این رگرسیون سعی بر این است که مقادیر پارامتر زیاد بزرگ نشود تا بیش‌برازش اتفاق نیفتد. با استفاده از ضریب لاگرانژ می‌توان نشان داد که این روش معادل بهینه‌سازی تحت محدودیتِ به ازای یک عدد است.[۴]

جستارهای وابسته

[ویرایش]

منابع

[ویرایش]
  1. Kennedy, Peter (2003). A Guide to Econometrics (Fifth ed.). Cambridge: The MIT Press. pp. 205–206. ISBN 0-262-61183-X.
  2. ۲٫۰ ۲٫۱ Gruber, Marvin (1998). Improving Efficiency by Shrinkage: The James–Stein and Ridge Regression Estimators. Boca Raton: CRC Press. pp. 7–15. ISBN 0-8247-0156-9.
  3. Golub, Gene H.; Hansen, Per Christian.; O'Leary, Dianne P. (1999-01-01). "Tikhonov Regularization and Total Least Squares". SIAM Journal on Matrix Analysis and Applications. 21 (1): 185–194. doi:10.1137/S0895479897326432. ISSN 0895-4798.
  4. Ng, Andrew Y. (2004). Feature selection, L1 vs. L2 regularization, and rotational invariance (PDF). Proc. ICML.