مدل بردلی-تری
مدل برادلی-تری یک مدل احتمال برای نتیجه مقایسههای دوتایی بین آیتمها، تیمها یا اشیا است. با توجه به یک جفت آیتم i و j که از یک توزیع خاص گرفته شده است، این احتمال را تخمین میزند که مقایسه زوجی i > j درست باشد، این فرض به احتمال زیر صحیح است:
-
(
)
بطوریکه pi یک امتیاز عدد حقیقی مثبت است که به هر یک از iها اختصاص داده شده است. مقایسه i > j میتوان به صورت " i به j ترجیح داده شده"، "رتبه i بالاتر از j است"، یا " i ,j را میزند " بسته به کاربرد، خواند و با استفاده از "قضاوت" امکان ارزیابی ذهنی را فراهم میکند.
به عنوان مثال، pi ممکن است نشان دهنده مهارت یک تیم در یک تورنمنت ورزشی باشد و به این معنای احتمال برد i در بازی مقابل j است.[۱] یا pi ممکن است نشان دهنده کیفیت یا مطلوبیت یک محصول تجاری باشد و احتمال این است که مصرفکننده محصول i را بر محصول j ترجیح میدهد.
مدل بردلی-تری میتواند در جهت رو به جلو برای پیشبینی نتایج، همانطور که توضیح داده شد، استفاده شود، اما معمولاً به صورت معکوس برای استنتاج امتیازات pi با توجه به مجموعهای از نتایج مشاهده شده استفاده میشود. در این نوع کاربرد pi نشان دهنده مقداری از قدرت یا کیفیت است و این مدل به ما امکان میدهد نقاط قوت را از یک سری مقایسههای زوجی تخمین بزنیم. به عنوان مثال، در بررسی ترجیحات شراب، ممکن است برای پاسخ دهندگان دشوار باشد که رتبهبندی کاملی از مجموعه بزرگی از شرابها را ارائه دهند، اما برای آنها نسبتاً آسان است که جفتهای نمونه شراب را با هم مقایسه کنند و بگویند که کدام یک از شرابها بهتر است. بر اساس مجموعهای از این مقایسههای زوجی، میتوان از مدل بردلی-تری برای به دست آوردن رتبهبندی کامل شرابها استفاده کرد.
هنگامی که مقادیر امتیاز pi محاسبه شد، میتوان از مدل در جهت رو به جلو نیز استفاده کرد، به عنوان مثال برای پیشبینی نتیجه احتمالی مقایسههایی که هنوز واقعاً رخ ندادهاند. به عنوان مثال، در مثال بررسی شراب، میتوان احتمال ترجیح شراب بر شراب را محاسبه کرد، حتی اگر هیچکس در نظرسنجی مستقیماً آن جفت خاص را مقایسه نکرده باشد.
تاریخچه و کاربردها
[ویرایش]این مدل به افتخار رالف آ. بردلی و میلتون ای. تری،[۲] که آن را در سال ۱۹۵۲ ارائه کردند، نامگذاری شده است،[۳] اگرچه قبلاً توسط ارنست زرملو در دهه ۱۹۲۰ مورد مطالعه قرار گرفته بود.[۱][۴][۵] کاربردهای این مدل شامل رتبهبندی رقبا در مسابقات ورزشی، شطرنج و سایر مسابقات،[۶] رتبهبندی محصولات در نظرسنجیهای مقایسه زوجی انتخاب مصرفکننده، تجزیه و تحلیل سلسله مراتب سلطه در جوامع حیوانی و انسانی،[۷] رتبهبندی مجلات، رتبهبندی مدلهای هوش مصنوعی،[۸] و برآورد ارتباط اسناد در موتورهای جستجوی ماشینی و غیره است.
تعریف
[ویرایش]مدل بردلی-تری را میتوان به روشهای مختلفی پارامتری کرد. معادله (1) شاید رایجترین روش باشد، اما تعدادی دیگر نیز وجود دارد. بردلی و تری خود توابع امتیاز نمایی، ، را تعریف کردهاند به طوری که
بهطور معادل میتوان از یک logit استفاده کرد، به طوری که[۱]
یعنی برای
این فرمول شباهت بین مدل بردلی-تری و رگرسیون لجستیک را برجسته میکند. هر دو اساساً از یک مدل واحد، اما به روشهای مختلف استفاده میکنند. در رگرسیون لجستیک فرد معمولاً پارامترهای را میداند و تلاش میکند تا شکل عملکردی را استنباط کند؛ در رتبهبندی تحت مدل بردلی-تری، فرد شکل عملکردی را میشناسد و سعی میکند پارامترها را استنتاج کند.
تخمین پارامترها
[ویرایش]رایجترین کاربرد مدل برادلی-تری، استنتاج مقادیر پارامترهای با توجه به مجموعه ای از نتایج مشاهده شده است مانند برد و باخت در یک مسابقه. سادهترین راه برای تخمین پارامترها ، تخمین حداکثر درستنمایی است، یعنی با به حداکثر رساندن احتمال نتایج مشاهده شده با توجه به مقادیر مدل و پارامتر.
فرض کنید نتایج مجموعه ای از رقابتهای دوتایی بین گروه خاصی از افراد را میدانیم و اجازه دهید wij تعداد دفعاتی باشد که i فردی j را شکست میدهد. سپس احتمال این مجموعه از نتایج در مدل بردلی-تری است و درستنمایی پارامتر p = [p1, ..., pn] برابر است با[۱]
Zermelo[۴] نشان داد که این عبارت تنها دارای یک ماکزیمم واحد است که با اگر نسبت به مشتق گرفته و نتیجه را مساوی صفر قرار دهیم خواهیم داشت:
-
(
)
این معادله هیچ راه حل بسته شناخته شدهای ندارد، اما زرملو حل آن را با تکرار ساده پیشنهاد کرد. با شروع از هر مجموعه مناسبی از مقادیر اولیه (مثبت) برای ، یکی بهطور مکرر به روز رسانی را انجام میدهد
-
(
)
برای همه iها به نوبت این مقادیر محاسبه میشود. پارامترهای به دست آمده تا یک ضریب ثابت، دلخواه هستند، بنابراین پس از محاسبه همه مقادیر جدید باید با تقسیم بر میانگین هندسی آنها نرمال سازی شوند:
-
(
)
این فرایند تخمین، احتمال ورود به سیستم را در هر تکرار بهبود میبخشد و تضمین میشود که در نهایت به حداکثر منحصر به فرد برسد.[۴][۹] با این حال، همگرایی کند است.[۱][۱۰] اخیراً اشاره شده است[۱۱] که معادله (2) را نیز میتوان به صورت بازآرایی کرد.
که با تکرار قابل حل است
-
(
)
پس از هر دور به روز رسانی با استفاده از معادله (4) دوباره عادی میشود. این تکرار نتایج یکسانی را با خروجی معادله (3) میدهد، اما خیلی سریعتر همگرا میشود و از این رو معمولاً بر (3) ترجیح داده میشود.[۱۱]
نمونه کار شده از روش حل
[ویرایش]یک رقابت ورزشی بین چهار تیم را در نظر بگیرید که در مجموع ۲۲ بازی را بین خود انجام میدهند. بردهای هر تیم در ردیفهای جدول زیر و حریفان به صورت ستون آورده شدهاند:
آ | ب | سی | D | |
---|---|---|---|---|
آ | – | ۲ | ۰ | ۱ |
ب | ۳ | – | ۵ | ۰ |
سی | ۰ | ۳ | – | ۱ |
D | ۴ | ۰ | ۳ | – |
به عنوان مثال، تیم A دو بار تیم B را شکست داده و سه بار به تیم B باخته است و با تیم C اصلاً بازی نکرده است. یک برد و چهار باخت مقابل تیم D دارد.
ما میخواهیم نقاط قوت نسبی تیمها را تخمین بزنیم که این کار را با محاسبه پارامترهای انجام میدهیم، بطوریکه پارامترهای بالاتر نشان دهنده مهارت بیشتر است. برای انجام این کار، چهار ورودی را در بردار پارامتر p بهطور دلخواه مقداردهی میکنیم، به عنوان مثال مقدار ۱ را به هر تیم اختصاص میدهیم: [۱, ۱, ۱, ۱]. سپس معادله (5) را برای به روز رسانی اعمال میکنیم، که نتیجه زیر حاصل میشود:اکنون (5) را دوباره برای به روز رسانی اعمال میکنیم، مطمئن شوید که از مقدار جدید که محاسبه شد استفاده میکنید:بهطور مشابه برای و داریم:سپس تمام پارامترها را با تقسیم بر میانگین هندسی آنها نرمال میکنیم برای بدست آوردن پارامترهای تخمینی p = [۰٫۵۱۶, ۱٫۴۱۳, ۰٫۶۷۲, ۲٫۰۴۱].
برای بهبود بیشتر تخمینها، با استفاده از مقادیر p جدید، فرایند را تکرار میکنیم؛ مثلاً،با تکرار این فرایند برای پارامترهای باقیمانده و عادی سازی، p = [۰٫۶۷۷, ۱٫۰۳۴, ۰٫۶۲۴, ۲٫۲۸۷] را دریافت میکنیم. تکرار ۱۰ بار دیگر همگرایی سریع به سمت حل نهایی p = [۰٫۶۴۰, ۱٫۰۴۳, ۰٫۶۶۰, ۲٫۲۷۰] میدهد. این نشان میدهد که تیم D قویترین و تیم B دومین قویتر است، در حالی که تیمهای A و C تقریباً از نظر قدرت برابر هستند اما کمتر از تیمهای B و D هستند. حتی اگر همه تیمها با هم بازی نکرده باشند.
جستارهای وابسته
[ویرایش]- رگرسیون ترتیبی
- مدل راش
- مقیاس (علوم اجتماعی)
- سیستم رتبهبندی الو
- مدل تورستونی
منابع
[ویرایش]- ↑ ۱٫۰ ۱٫۱ ۱٫۲ ۱٫۳ ۱٫۴ Hunter, David R. (2004). "MM algorithms for generalized Bradley–Terry models". The Annals of Statistics. 32 (1): 384–406. CiteSeerX 10.1.1.110.7878. doi:10.1214/aos/1079120141. JSTOR 3448514. خطای یادکرد: برچسب
<ref>
نامعتبر؛ نام «hunter» چندین بار با محتوای متفاوت تعریف شده است. (صفحهٔ راهنما را مطالعه کنید.). - ↑ "Bradley-Terry model". Encyclopedia of Mathematics. Retrieved 18 November 2014.
- ↑ Bradley, Ralph Allan; Terry, Milton E. (1952). "Rank Analysis of Incomplete Block Designs: I. The Method of Paired Comparisons". Biometrika. 39 (3/4): 324–345. doi:10.2307/2334029. JSTOR 2334029.
- ↑ ۴٫۰ ۴٫۱ ۴٫۲ Zermelo, Ernst (1929). "Die Berechnung der Turnier-Ergebnisse als ein Maximumproblem der Wahrscheinlichkeitsrechnung". Mathematische Zeitschrift. 29: 436–460. doi:10.1007/BF01180541. خطای یادکرد: برچسب
<ref>
نامعتبر؛ نام «zermelo» چندین بار با محتوای متفاوت تعریف شده است. (صفحهٔ راهنما را مطالعه کنید.). - ↑ Heinz-Dieter Ebbinghaus (2007), Ernst Zermelo: An Approach to His Life and Work, Springer, pp. 268–269, ISBN 978-3-540-49553-6
- ↑ Shev, A.; Fujii, K.; Hsieh, F.; McCowan, B. (2014). "Systemic testing on Bradley-Terry model against nonlinear ranking hierarchy". PLOS One. 9: e115367. doi:10.1371/journal.pone.0115367. PMC 4274013. PMID 25531899.
- ↑ Boyd, Robert; Silk, Joan B. (1983). "A method for assigning cardinal dominance ranks". Animal Behaviour. 31: 45–58. doi:10.1016/S0003-3472(83)80172-9.
- ↑ "Chatbot Arena: New models & Elo system update | LMSYS Org". lmsys.org (به انگلیسی). Retrieved 2024-01-30.
- ↑ Ford, Jr., L. R. (1957). "Solution of a ranking problem from binary comparisons". American Mathematical Monthly. 64: 28–33. doi:10.1080/00029890.1957.11989117.
- ↑ Dykstra, Jr., Otto (1956). "A note on the rank analysis of incomplete block designs". Biometrics. 12: 301–306. doi:10.2307/2334029. JSTOR 2334029.
- ↑ ۱۱٫۰ ۱۱٫۱ Newman, M. E. J. (2023). "Efficient computation of rankings from pairwise comparisons". Journal of Machine Learning Research. 24: 1–25. خطای یادکرد: برچسب
<ref>
نامعتبر؛ نام «newman» چندین بار با محتوای متفاوت تعریف شده است. (صفحهٔ راهنما را مطالعه کنید.).