نرمکننده هسته
نرمکننده هسته یا هموارساز هسته (به انگلیسی: Kernel smoother)، یک تکنیک آماری برای برآورد ارزش واقعی تابع با استفاده از میانگین وزنی همسایههای آن است. در اینجا وزنها به وسیلهٔ هسته مشخص میشوند. این وزنها به صورتی است که همسایههای نزدیکتر وزن بیشتری میگیرند. تابع به دستآمده به وسیلهٔ این روش هموار بوده و درجهٔ همواری آن با استفاده از یک پارامتر کنترل میشود. هموارسازی به کمک هسته، نوعی میانگینگیری متحرک میباشد. نرمکننده هسته میتواند توابع صافتر و نرمتری از یک متغیر تصادفی را پدیدآورد.
تعریف
[ویرایش]یک هسته به صورت زیر میباشد:
که در آن
- فاصله اقلیدسی
- یک پارامتر مثبت (شعاع هسته)
- D (t) یک تابع با با مقادیر مثبت بوده که مقادیر آن با بیشتر شدن فاصلهٔ و کاهش مییابد (یا حداقل افزایش نمییابد).
به عنوان مثال فرض کنید که یک تابع پیوسته میباشد روی میباشد. با استفاده از هستهٔ نادارایا-واتسون[۱] که یک هستهٔ میانگین وزنی است، میتوان تابع توزیع را به صورت زیر برآورد کرد.
که در آن
- N تعداد نمونههای مشاهده شدهاست.
- مشاهدهٔ دیدهشده در نقطهٔ است.
در ادامه به بررسی چند مورد خاص از نرمکنندههای هسته میپردازیم.
هسته گاوسی یکی از پرکاربردترین هستهها است و با معادله زیر بیان میشود.
که در اینجا عددی است که با استفاده از آن میتوان میزان نرمی نمودار را کنترل کرد و یک اسکالر میباشد.
با افزایش مقدار شعاع هسته بزرگتر شده و در نتیجه نقاط دورتر نیز سهم بیشتری در میانگینگیری بهدست میآورند؛ بنابراین نتیجه هموارتر خواهد بود. هرچه به صفر نزدیکتر باشد، برآوردگر نوسان بیشتری خواهد داشت.
از الگوریتم نزدیکترین همسایه الگوبرداری شدهاست.
در اینجا برای هر نقطهٔ ، m نزدیکترین همسایهٔ آن را در نظر گرفته و با میانگینگیری از آنها مقدار را تخمین میزنیم.
فرمولبندی آن نیز به این صورت است که را طوری در نظر میگیریم که برابر با mامین نزدیکترین همسایه است و را نیز به صورت زیر تعریف میکنیم.
در این صورت برآورد برای هر نقطه برابر با میانگین m همسایهٔ نزدیک آن خواهد بود.
نرم کردن به وسیلهٔ میانگینگیری
[ویرایش]در این روش را به صورت یک عدد ثابت در نظر میگیریم و نیز یکی از هستههای معروف است. با این کار در هنگام میانگینگیری هر چه داده به نقطهٔ ما نزدیکتر باشد، وزن بیشتری داشته و اثر بیشتری روی خروجی نهایی میگذارد.
دلیل کاربرد
[ویرایش]دلیل تمایل به استفاده از توابع با تغییرات نرم این است که اکثر پدیدههای موجود در طبیعت نیز دارای تغییرات نرم هستند، اما ممکن است نویزهای شکل موج را خراب کنند یا آن که متغیر تصادفی با تغییرات نامطلوب باشد.
روش کاربرد
[ویرایش]معمولاً از کانولوشن توزیع طبیعی روی متغیر تصادفی استفاده میشود.[۴]
منابع
[ویرایش]- ↑ "Kernel regression". Wikipedia (به انگلیسی). 2022-12-15.
- ↑ Chung, Moo K. (2021-11-29). "Gaussian kernel smoothing". arXiv:2007.09539 [cs, stat].
- ↑ Stute, Winfried; Manteiga, Wenceslao González (1990-07-01). "Nearest neighbor smoothing in linear regression". Journal of Multivariate Analysis (به انگلیسی). 34 (1): 61–74. doi:10.1016/0047-259X(90)90061-L. ISSN 0047-259X.
- ↑ Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome (2009). The Elements of Statistical Learning (به انگلیسی). Springer. p. ۲۰۸–۲۰۹. Archived from the original on 10 November 2009. Retrieved 12 February 2022.