پرش به محتوا

توزیع حاشیه‌ای

از ویکی‌پدیا، دانشنامهٔ آزاد

در نظریه آمار و احتمال، توزیع حاشیه‌ای از یک زیرمجموعه از یک مجموعه ای از متغیرهای تصادفی، توزیع احتمال از متغیرهای موجود در زیر مجموعه هست. احتمال مقادیر مختلف متغیرها را در زیرمجموعه بدون مراجعه به مقادیر سایر متغیرها ارائه می‌دهد. در حالی که توزیع شرطی، احتمالات را مشروط به مقادیر متغیرهای دیگر می‌کند.

متغیرهای حاشیه‌ای آن متغیرها در زیرمجموعه متغیرهایی هستند که حفظ می‌شوند. این مفاهیم «حاشیه‌ای» هستند زیرا با جمع کردن مقادیر در جدول در امتداد سطرها یا ستون‌ها و نوشتن حاصل جمع در حاشیه جدول، می‌توان آنها را یافت.[۱] توزیع متغیرهای حاشیه‌ای (توزیع حاشیه‌ای) توسط حاشیه سازی حاصل می‌شود، یعنی تمرکز روی مبالغ موجود در حاشیه بیش از توزیع متغیرهای کنار گذاشته شده‌است، و گفته می‌شود که متغیرهای دور انداخته شده، به حاشیه رانده شده‌اند.

به‌طور ساده‌تر گاهی نیاز داریم توزیع مستقل دو متغیر تصادفی را هم از توزیع توأم به دست آوریم. جواب این سؤال ما در توزیع حاشیه‌ای نهفته‌است.

تعریف

[ویرایش]

برای حساب کردن توزیع حاشیه‌ای یکی از این متغیرها کافی است به نوعی تأثیر آنرا بر روی تابع توزیع توأم حذف کنیم.

تابع جرم احتمال حاشیه‌ای

[ویرایش]

فرض کنید توزیع توأم[۲] دو متغیر تصادفی گسسته X و Y به ما داده شده‌است. توزیع حاشیه‌ای هر یک از این متغیرها - به عنوان مثال X - برابر است با توزیع احتمال X هنگامی که مقادیر Y در نظر گرفته نمی‌شوند. این را می‌توان با جمع کردن احتمال توزیع توأم روی تمام حالات Y محاسبه کرد. به‌طور مشابه، برای عکس آن نیز درست است؛ یعنی توزیع حاشیه‌ای Y را نیز می‌توان با جمع کردن احتمال توزیع توأم روی حالات X محاسبه کرد.

X
Y
x1 x2 x3 x4 pY(y) ↓
y1 4/32 2/32 1/32 1/32 8/32
y2 3/32 6/32 3/32 3/32 15/32
y3 9/32 0 0 0 9/32
pX(x) → 16/32 8/32 4/32 4/32 32/32
مقادیر توزیع توأم این دو متغیر تصادفی، در مستطیل 3*4 وسط، و مقادیر توزیع حاشیه‌ای این دو متغیر، در حاشیه راست و پایین آورده شده‌است.

احتمال حاشیه‌ای می‌تواند به صورت امید ریاضی نیز نوشته شود.

به‌طور شهودی احتمال حاشیه‌ای X با بررسی احتمال شرطی X به شرط مقدار خاصی از Y، و سپس میانگین این احتمال شرطی بر روی توزیع همه مقادیر Y محاسبه می‌شود.

این از تعریف امید ریاضی (بعد از انجام قانون LOTUS) می‌آید.

تابع چگالی احتمال حاشیه‌ای

[ویرایش]

فرض کنید توزیع توأم دو متغیر تصادفی پیوسته X و Y به ما داده شده‌است. تابع چگالی احتمال حاشیه‌ای X را می‌توان از انتگرال احتمال توزیع توأم روی تمام حالات Y محاسبه کرد.

و یا به‌طور شهودی تر داریم:

تابع توزیع تجمعی حاشیه‌ای

[ویرایش]

به راحتی می‌توان تابع توزیع تجمعی حاشیه‌ای را از روی تابع چگالی احتمال حاشیه‌ای به دست آورد.

تابع توزیع تجمعی حاشیه‌ای متغیر تصادفی گسسته

[ویرایش]

برای متغیرهای تصادفی گسسته داریم:

تابع توزیع تجمعی حاشیه‌ای متغیر تصادفی پیوسته

[ویرایش]

برای متغیرهای تصادفی پیوسته داریم:

حال فرض کنید می‌خواهیم توزیع تجمعی حاشیه‌ای یک متغیر تصادفی را از روی توزیع تجمعی توأم بدون استفاده از تابع چگالی آنها بدست آوریم.

توزیع احتمال حاشیه‌ای و توزیع احتمال شرطی

[ویرایش]

تعریف

[ویرایش]

احتمال حاشیه‌ای، احتمال رخ دادن یک رخداد مستقل از رخدادهای دیگر است. از سمت دیگر احتمال شرطی، احتمال رخ دادن یک رخداد به شرطی که رخدادهای مشخص دیگری اتفاق افتاده باشند است. این بدین معنا است که در چنین احتمالی محاسبات مربوط به یک متغیر تصادفی به محاسبات متغیرهای تصادفی دیگر وابسته می‌باشد.[۳]

توزیع احتمال شرطی یک متغیر تصادفی به شرط رخ دادن متغیر تصادفی دیگر معادل توزیع احتمال توأم هر دو متغیر تصادفی تقسیم بر توزیع احتمال حاشیه‌ای متغیر تصادفی دیگری است که بالاتر معرفی شد می‌باشد.[۴] پس داریم،

  • برای متغیرهای تصادفی پیوسته،

مثال

[ویرایش]

فرض کنید داده‌های مربوط به دانشجویان یک کلاس ۲۰۰ نفری را داریم. این داده‌ها شامل میزان زمان مطالعه دانشجویان (X) و درصد جواب‌های درست دانشجویان در امتحان (Y) هستند.[۵] فرض کنید که X و Y متغیرهای تصادفی گسسته هستند؛ توزیع احتمال توأم X و Y را می‌توان با استفاده از لیست کردن تمام مقادیر ممکن p(xi,yj) همانند جدول پایین، تعریف کرد.

X
Y
میزان زمان مطالعه (دقیقه)
% جواب‌های درست x1 (0-20) x2 (21-40) x3 (41-60) x4(>60) pY(y) ↓
y1 (0-20) 2/200 0 0 8/200 10/200
y2 (21-40) 10/200 2/200 8/200 0 20/200
y3 (41-59) 2/200 4/200 32/200 32/200 70/200
y4 (60-79) 0 20/200 30/200 10/200 60/200
y5 (80-100) 0 4/200 16/200 20/200 40/200
pX(x) → 14/200 30/200 86/200 70/200 1
جدولی از داده‌های رابطهٔ بین میزان زمان مطالعه و تعداد پاسخ‌های درست در یک کلاس با ۲۰۰ دانشجو

توزیع احتمال حاشیه‌ای می‌تواند تعداد دانشجوهایی که نمره ۲۰ یا کمتر گرفته‌اند را مشخص کند:

، یعنی ۱۰ دانشجو یا ۵ درصد دانشجویان.

توزیع احتمال شرطی برای مشخص کردن احتمال اینکه یک دانشجو که ۶۰ دقیقه یا بیشتر مطالعه کرده باشد، نمرهٔ ۲۰ یا پایین‌تر کسب کند به کار می‌رود:

، این عبارت به این معنی است که ۱۱ درصد احتمال این وجود دارد که نمره دانشجو پس از حداقل ۶۰ دقیقه مطالعه، ۲۰ شود.

نمونه ای از دنیای واقعی

[ویرایش]

فرض کنید احتمال برخورد یک عابر پیاده با ماشین در حین عبور از جاده در گذرگاه عابر پیاده بدون توجه به چراغ راهنمایی محاسبه شود. فرض کنید H یک متغیر تصادفی گسسته باشد که یک مقدار از {Hit, Not Hit} را می‌گیرد. فرض کنید L (برای چراغ راهنمایی) یک متغیر تصادفی گسسته باشد که یک مقدار از {RED, YELLOW, GREEN} را می‌گیرد.

در واقع، H به L وابسته خواهد بود؛ یعنی P(H = Hit) بسته به قرمز، زرد یا سبز بودن L مقادیر متفاوتی خواهد گرفت (و به همین ترتیب برای P(H = Not Hit)). برای مثال، یک عابر زمانی که چراغ‌های راهنمایی سبز هستند، احتمال بیشتری وجود دارد که هنگام عبور با خودرو برخورد کند تا زمانی که قرمز باشد. به عبارت دیگر، برای هر جفت مقادیر ممکن معینی برای H و L، باید احتمال توزیع توأم H و L را در نظر گرفت تا در صورت نادیده گرفتن حالت چراغ راهنمایی توسط عابر، احتمال وقوع آن جفت رویدادها با هم پیدا شود.

هرچند، در تلاش برای محاسبه احتمال حاشیه‌ای P(H = Hit)، آنچه مورد نظر است، احتمال برخورد H = Hit در شرایطی است که مقدار خاص L ناشناخته است و در آن عابر پیاده وضعیت چراغ راهنمایی را نادیده می‌گیرد. به‌طور کلی، اگر چراغ‌ها قرمز باشد یا اگر چراغ‌ها زرد یا اگر چراغ‌ها سبز باشند، می‌توان به عابر پیاده ضربه زد؛ بنابراین، پاسخ احتمال حاشیه‌ای را می‌توان با جمع P(H | L) برای همه مقادیر ممکن L، با وزن هر مقدار L با احتمال وقوع آن یافت.

در اینجا جدولی وجود دارد که بسته به وضعیت چراغ‌ها، احتمالات مشروط ضربه خوردن را نشان می‌دهد. (توجه داشته باشید که ستون‌های این جدول باید تا ۱ جمع شوند زیرا بدون توجه به وضعیت نور، احتمال اصابت یا عدم اصابت ۱ است)

Conditional distribution:
L
H
Red Yellow Green
Not Hit 0.99 0.9 0.2
Hit 0.01 0.1 0.8

برای یافتن توزیع احتمال توأم، داده‌های بیشتری مورد نیاز است. برای مثال، فرض کنید P(L = red) = ۰٫۲ و P(L = yellow) = ۰٫۱ و P(L = green) = ۰٫۷. ضرب هر ستون در توزیع شرطی در احتمال وقوع آن ستون منجر به توزیع احتمال توأم H و L می‌شود که در مستطیل ۲×۳ وسط داده شده‌است.

Joint distribution:
L
H
Red Yellow Green Marginal probability P(H)
Not Hit 0.198 0.09 0.14 0.428
Hit 0.002 0.01 0.56 0.572
Total 0.2 0.1 0.7 1

احتمال حاشیه‌ای P(H = Hit) مجموع ۰٫۵۷۲ در امتداد ردیف H = Hit این جدول توزیع مشترک است، زیرا این احتمال برخورد زمانی است که چراغ‌ها قرمز یا زرد یا سبز هستند. به‌طور مشابه، احتمال حاشیه‌ای که P(H = Not Hit) مجموع در امتداد ردیف H = Not Hit است.

توزیع احتمال‌های چند متغیره

[ویرایش]
تعدادی نمونه از یک توزیع احتمال نرمال دو متغیره. توزیع احتمال‌های حاشیه‌ای قرمز و آبی به نمایش درآمده‌اند. توزیع احتمال حاشیه‌ای X بوسیله یک هیستوگرام از مختصات X بدون در نظر گرفتن مختصات Y به نمایش درآمده است.

برای توزیع احتمال‌های چند متغیره، همان فرمولی را به کار می‌گیریم که بالاتر از آن استفاده کردیم با این تفاوت که در این‌جا نمادهای X و/یا Y به عنوان بردار شناخته می‌شوند. به‌طور خاص می‌توان گفت که هر جمع یا انتگرال بر روی تمام متغیرها، بجز متغیرهایی که در X قرار دارند، اعمال می‌شود.[۶] یعنی، اگر X1,X2,…,Xn متغیرهای تصادفی گسسته باشند، آنگاه تابع جرم احتمال حاشیه‌ای باید به شکل زیر تعریف شود:

اگر X1,X2,…,Xn متغیرهای تصادفی پیوسته باشند، آنگاه تابع چگالی احتمال حاشیه‌ای باید به شکل زیر تعریف شود:

جستارهای وابسته

[ویرایش]

پانویس

[ویرایش]
  1. Trumpler, Robert J. & Harold F. Weaver (1962). Statistical Astronomy. Dover Publications. pp. 32–33.
  2. «توزیع توأم» [آمار] هم‌ارزِ «joint distribution» مترادفِ: «توزیع چندمتغیره» هم‌ارزِ واژهٔ بیگانه‌ای دیگر (multivariate distribution)؛ منبع: گروه واژه‌گزینی. جواد میرشکاری، ویراستار. دفتر یازدهم. فرهنگ واژه‌های مصوب فرهنگستان. تهران: انتشارات فرهنگستان زبان و ادب فارسی. شابک ۹۷۸-۶۰۰-۶۱۴۳-۴۵-۳ (ذیل سرواژهٔ توزیع توأم)
  3. "Marginal & Conditional Probability Distributions: Definition & Examples". Study.com (به انگلیسی). Retrieved 2019-11-16.
  4. "Exam P [FSU Math]". www.math.fsu.edu. Retrieved 2019-11-16.
  5. Marginal and conditional distributions (به انگلیسی), retrieved 2019-11-16
  6. A modern introduction to probability and statistics: understanding why and how. Dekking, Michel, 1946-. London: Springer. 2005. ISBN 978-1-85233-896-1. OCLC 262680588.{{cite book}}: نگهداری CS1: سایر موارد (link)

منابع

[ویرایش]