پرش به محتوا

نمودار درختی تجزیه

از ویکی‌پدیا، دانشنامهٔ آزاد

نمودار درختی، در زبان‌شناسی، روشی تصویری برای تجزیه جمله‌ها و عبارت‌ها به اجزای کوچکتر است.

نمودار درختی تجزیه یا نمودار و ترکیب یا نمودار درختی.. یا نمودار درختی مشتق نموداری درختی ریشه‌ای (بنیادی) و منظم است[۱] که ساختار نحوی یک زنجیره (رشته) را مطابق با دستور زبان (گرامر) با فرض مستقل بودن از متن، ارائه می‌کند. نمودارهای درختی تجزیه و تحلیل معمولاً براساس یکی از دو رابطهٔ همبستگی یا وابستگی ساخته می‌شود. نمونه‌های درختی تجزیه و ترکیب از نمودارهای درختی تجزیه و تحلیل و همچنین از نمودارهای درختی نحو انتزاعی ذهنی (به زبان ساده همان نمودارهای درختی نحو) که ساختار و عناصرشان به طرزدقیق تری نحو زبان داده ورودی را منعکس می‌کنند، متمایز هستند. نمودارهای درختی تجزیه و ترکیب ممکن است برای جمله‌ها در زبان‌های طبیعی (پردازش زبان طبیعی را ببینید) و همچنین در طول پردازش زبان‌های کامپیوتر مانند برنامه‌ریزی، تولید شوند.

یادداشت‌هایی بر واژه‌شناسی

[ویرایش]

خود واژهٔ نمودار درختی تجزیه و ترکیب در ابتدا با رشتهء زبان‌شناسی محاسباتی (رایانشی) استفاده شد. از نظر تئوری، نحو واژه نمودار درختی نحو را بر نمودار تجزیه و تحلیل ترجیح می‌دهد. کشیدن نمودار جملات در گرامر مدرسه مربوط به نمودارهای جمله بوده به هرحال نمودارهای جمله که شخص در دورهٔ راهنمایی یاد می‌گیرد (نمودارهای رید- کادگ) بسیار متفاوت از نمودارهای تجزیه و ترکیب و زبان‌های محاسباتی و نمودارهای درختی نحو زبان‌شناسی تئوری هستند.

نمودارهای درختی تجزیه مبتنی بر اجزاء

[ویرایش]

نمودارهای درختی مبتنی بر اجزاء (= گرامر ساختار عبارت) بین گره‌های پایانه و گره‌های غیرپایانه، فرق می‌گذارد. گره‌های داخلی، طبقهٔ غیرپایانهء گرامر نامیده می‌شود؛ در حالی که گره‌های برگ طبقه پایانه نامیده می‌شود. تصویر زیر نمودار درختی و ترکیب حوزه مبنا و ساختارنحوی جمله انگلیسی John hit the ball را نشان می‌دهد.

نمودار درختی مبتنی بر اجزاء ساختاری کامل است با S (جمله) شروع و به هریک از گروه‌های (John hit , the ,ball) ختم می‌شود. علامت‌های اختصاری زیر در نمودار درختی استفاده می‌شوند.

Parse tree PSG

S – برای جمله، ساختار سطح بالای این مثال.

NP- برای عبارت اولین NP (سمت چپ). اسم تنهای John به عنوان فاعل جمله به کار می‌رود. دومین NP به عنوان مفعول جمله به کار می‌رود.

VP- برای عبارت فعلی که به عنوان گزاره بکار می‌رود.

V- برای فعل، در این مورد hit فعلی متعددی (گذرا به فعل) است.

D-برای هدف تعریف در این موردtheحرف تعریف معین است.

N- برای اسم.

هر گروه در این نمودار درختی، گروه ریشه، گروه شاخه یا گروه برگ است.[۲] گره ریشه، گرهٔ است که هیچ شاخه‌ای در بالای خود ندارد. داخل جمله، فقط یک گره ریشه وجود دارد.

گره شاخه، گرهٔ مادر است که دو یا بیشتر گره‌های دختر را به هم وصل می‌کند.

گره برگ، به هرحال، گره پایانه است که تسلطی بر دیگر گره‌های در نمودار درختی ندارد.

S گره ریشه، VP و NP گره‌های شاخه، (the(D),hit(v),john(N و(ball(N همگی گره‌های برگ هستند. این برگ‌ها را نماد یا سمبل واژگانی جملات هستند.[۳] یک گره، همچنین می‌تواند شامل گره والد یا گره بچه باشد. گره والد، گرهٔ است که حداقل گره دیگری بالای آن وجود دارد که به وسیله شاخه‌ای از نمودار درختی به آن وصل می‌شود. طبق مثال. hit گره بچه vاست. واژه‌های مادرو دخترنیز گاهی اوقات برای این رابطه استفاده می‌شوند.

نمودارهای درختی وابستگی مبنا

[ویرایش]

نمودارهای درختی وابستگی مبنای گرامر وابستگی[۴] همه گره‌ها را به عنوان گره پایانی می‌بیند بدین معنا که دانش تشخیص بین دسته پایانی و غیرپایانی را ندارند. آن‌ها به‌طور میانگین (متوسط) ساده‌تر از نمودارهای درختی مبتنی بر اجزاء هستند. چون آن‌ها شامل گره‌های کمتری هستند. نمودار درختی مبتنی بر اجزاء برای جمله مثال بالا طبق نمودار درخت وابستگی به شکل زیر است.

Parse tree DG

این نمودار درختی فاقد مقوله‌های عبارتی (NP,VP,S) هست که در نمودار مشابه به حوزه مبنا بالای دیده شد. ساختار جزء نیز همانند نمودار درختی مبتنی بر اجزاء به رسمیت شناخته می‌شود. هر شاخه نمودار درختی یک جزء است؛ بنابراین این نمودار درختی تجزیه و ترکیب وابستگی مبنا اسم فاعلjohn و مفعول عبارت اسمیthe ball را همانند نموداردرختی حوزه مبنا به عنوان اجزاء به رسمیت می‌شناسد.

تفاوت بین حوزه در مقابل وابستگی زیاد است. هرچند ساختار نحوی دیگری مربوط به نمودارهای درختی تجزیه و ترکیب حوزه ضروری یا برای موضوع بحث سودمند است.

یادداشت‌ها

[ویرایش]
  1. See Chiswell and Hodges 2007: 34.
  2. See Carnie (2013:118ff.) (e.g. root node, terminal node, non-terminal node, etc.).
  3. See Alfred et al. 2007.
  4. See for example Ágel et al. 2003/2006.

جستارهای وابسته

[ویرایش]

منابع

[ویرایش]
  • Vilmos Ágel, Ludwig Eichinger, Hans-Werner Eroms, Peter Hellwig, Hans Heringer, and Hennig Lobin (eds.) 2003/6. Dependency and valency: An international handbook of contemporary research. Berlin: Walter de Gruyter.
  • Carnie, A. 2013. Syntax: A generative introduction, 3rd edition. Malden, MA: Wiley-Blackwell.
  • Chiswell, Ian and Wilfrid Hodges 2007. Mathematical logic. Oxford: Oxford University Press.
  • Aho, Alfred et al. 2007. Compilers: Principles, techniques, & tools. Boston: Pearson/Addison Wesley.