پرش به محتوا

نام پرونده (رایانه)

از ویکی‌پدیا، دانشنامهٔ آزاد
تصویری از پنجرهٔ فرمان ویندوز که نام پرونده‌ها را در یک فهرست نشان می‌دهد
فهرست نام پرونده‌ها، با نام پرونده‌های طولانی، حروف خارجی، و نویسه‌های ویرگول، نقطه، و فاصله همان‌گونه که در نمایش نام پرونده‌ها در یک نرم‌افزار ظاهر می‌شوند

نام پرونده یا نام فایل (به انگلیسی: Filename) فراداده‌ای پیرامون یک پرونده است. این فراداده، به‌منظور شناسایی یک پرونده در میان سایر پرونده‌های موجود در سیستم به‌کار می‌رود.

هم‌چنین مطابق تعریف لغت‌نامه، یک نام متمایزکننده است که به یک پروندهٔ کامپیوتریِ ذخیره‌شدهٔ الکترونیکی داده می‌شود.

این نام، پروندهٔ کامپیوتری را با محدودیت‌های مختلفی که سیستم‌عامل اعمال می‌کند — مانند طول یا محدودیت در انتخاب کاراکترها — مطابق می‌کند.[۱]

این نام ممکن است در حالت‌های گوناگون دچار اعمال محدودیت‌هایی مانند طول نام یا نوع حروف و نویسه‌های مختلف نیز شود.

برای مثال، ویندوز این تعریف را ارائه می‌دهد: یک داده از نوع نام پرونده، یک رشتهٔ متنی است که نام یک پرونده یا پوشه را دربر می‌گیرد. به‌طور پیش‌فرض تصور می‌شود که نام پرونده از یک ترکیب نام پروندهٔ کوتاه تشکیل می‌شود که شامل ۸ کاراکتر نام، وقفه (.) و ۳ کاراکتر افزونه.

برای داشتن نام بلند در کنار نام کوتاه، آن را با یک علامت "|" از نام پروندهٔ کوتاه جدا می‌کنیم. برای مثال، هر دو رشتهٔ status.txt و projec~1.txt|Project Status.txt معتبرند. (توجه کنید که این مطلب از سایت مایکروسافت برداشته شده؛ لذا قواعد مطروحه در آن لزومًا در سایر سیستم‌عامل‌ها درست نیستند.)[۲]

یک نام پرونده، به‌طور معمول از اجزای زیر تشکیل می‌گردد:

  • میزبان (یا گره یا کارگزار (سرور)) - دستگاه شبکه‌ای که پرونده‌ها را در بر می‌گیرد.
  • دستگاه (یا درایو) - دستگاه یا درایو سخت‌افزاری
  • شاخه (Directory) یا مسیر (Patch) - (مانند: \TEMP, [USR.LIB.SRC], etc.)
  • نام پرونده
  • پسوند نام فایل (مانند: txt ،exe، com)
  • نسخه (Version)، شمارهٔ تولید یا چاپ اصلاح‌شده

ترکیب و قالب یک فایل معتبر مانند مؤلفه‌های لازم برای شناسایی فایل، در سیستم‌عامل‌های مختلف متفاوتند.

مباحث پیرامون نام پرونده به‌دلیل فقدان استانداردسازی این واژه پیچیده هستند. نام پرونده گاهی برای نام کامل مانند نام ویندوز مثل c:\directory\myfile.txt به‌کار می‌رود. گاهی برای اشاره به اجزا استفاده می‌شود؛ در این مثال myfile.txt. بعضاً ارجاعی است که یک افزونه را مشخص می‌کند، بنابراین در این حالت نام پرونده myfile خواهد بود. چنین ابهاماتی متداول است و این مقاله تلاش نمی‌کند هیچ یک از معانی را تعریف کند، و فعلاً ممکن است هر یک از آن‌ها را استفاده کنیم. بعضی سامانه‌ها ممکن است نام‌گذاری استاندارد خود را پذیرفته باشند مانند «نام مسیر» (path name)؛ ولی همین اسامی نیز در سراسر سیستم استاندارد نیستند.

تاریخچه

[ویرایش]

در حدود سال ۱۹۶۲ سیستم اشتراک زمانی سازگار، مفهوم پرونده (پروندهٔ بدون کاغذ) را معرفی کرد.

تقریبًا در همین زمان، نقطه (برای توقف کامل یا کوتاه) به عنوان جداکنندهٔ افزونهٔ نام فایل به‌وجود آمد و افزونه به سه حرف محدود شد.[۳]

در گذشته، تنها نویسه (کاراکتر)های حرفی–عددی در نام پرونده مجاز بودند؛ اما با گذشت زمان، تعداد کاراکترهای مجاز افزایش یافت؛ که این باعث ایجاد مشکلات هم‌سازی در زمان انتقال پرونده‌ها از یک فایل سیستم به دیگری شد.[۴]

در حدود سال ۱۹۹۵، یکی از افزونه‌های فایل سیستم FAT به نام جدول تخصیص فایل دروینوز۹۵ و ویندوز NT3.5 معرفی شد. در این افزونه، علاوه‌بر نام‌های کلاسیک «۸٫۳»، نام پرونده‌های طولانی یونی‌کد نیز مجاز بود.

در سال ۱۹۸۵، RFC959 تعریف رسمی زیر را برای نام مسیر (path name) ارائه کرد: رشته‌ای از کاراکترها که باید توسط کاربر برای شناسایی فایل وارد فایل سیستم شود.[۵]

مهاجرت به یونی‌کد

[ویرایش]

یک مسئله، تغییر شیوهٔ نام‌گذاری به یونی‌کد بود. به این منظور، شرکت‌های نرم‌افزاریِ بسیاری، نرم‌افزارهایی برای مهاجرت نام پرونده‌ها به رمزگذاری یونی‌کدِ جدید فراهم کردند.

  • Microsoft برای تمامی کاربران تکنولوژی vfat، نرم‌افزار migration transparent را ارائه داد
  • Apple نرم‌افزار File Name Encoding Repair Utility v1.0 را ارائه داد[۶]
  • Linux community نرم‌افزار convmv را ارائه داد[۷]

ارجاعات: مطلق در مقایسه با نسبی

[ویرایش]

یک ارجاع مطلق، تمام سطوح فهرست را شامل می‌شود. در بعضی سیستم‌ها، اگر ارجاع یک نام پرونده شامل مسیر کامل فهرست نباشد، به‌طور پیش‌فرض فهرست جاری در نظر گرفته می‌شود. این یک ارجاع نسبی است. یکی از مزایای استفاده از ارجاع نسبی در فایل‌های پیکربندی برنامه یا اسناد این است که نمونه‌های مختلفی از سند یا برنامه می‌توانند در پرونده‌های مختلف استفاده شوند.

بنابراین یک ارجاع نسبی یا مطلق مرکب از دنباله‌ای از نام پرونده‌ها است.

تعداد نام‌های هر فایل

[ویرایش]

فایل سیستم‌های شبیه به Unix به یک فایل اجازه می‌دهند بیش از یک نام داشته باشد؛ نام‌ها در فایل سیستم‌های به سبک Unix قدیمی پیوندهایی سخت به آی‌نود یا معادل فایل هستند. ویندوز از پیوندهای سخت فایل سیستم‌های ان‌تی‌اف‌اس پشتیبانی می‌کند، و برای ساخت آن‌ها فرمان fsutil را در ویندوز XP، و mklink را در نسخه‌های بعدی ارائه می‌دهد.[۸][۹] پیوندهای سخت با کلیدهای میانبر ویندوز، یا پیوند نمادین متفاوتند. معرفی LFNها با جدول تخصیص فایل اسم‌های مستعار نام پرونده را مجاز کردند. برای مثال،

longfi~1. ???

با حداکثر هشت به علاوهٔ سه کاراکتر یک اسم مستعار برای

"long file name. ???"

است. این نام مستعار جهت مطابقت با محدوده‌های ۸٫۳ برای برنامه‌های قدیمی‌تر است.

این ویژگی توسط الگوریتم فرمان move که ابتدا یک نام پروندهٔ ثانویه ایجاد می‌کند سپس تنها نام پروندهٔ اولیه را حذف می‌کند، استفاده می‌شد.

طراحی سایر فایل سیستم‌ها به‌گونه‌ای است که تنها یک نام پرونده را در هر پرونده مقرر می‌کند. این طراحی تضمین می‌کند که تغییرات فایل یک نام پرونده، فایل نام پروندهٔ دیگری را تغییر ندهد.

محدودیت‌های طول

[ویرایش]

بعضی فایل سیستم‌ها طول نام پرونده را محدود می‌کنند. در بعضی موارد این طول‌ها در نام کامل پرونده اعمال می‌شوند مانند ۴۴ کاراکتر در IBM S/370.[۱۰] در سایر موارد، ممکن است محدودیت‌های طول در بخش‌های خاصی از نام پرونده، از قبیل نام فایل در فهرست یا نام فهرست اعمال شوند. برای مثال: ۹ کاراکتر یا بایت (مانند جدول تخصیص فایل ۸ بیتی در Standalone Disk BASIC)، ۱۱ کاراکتر یا بایت (مانند جدول تخصیص فایل۱۲، جدول تخصیص فایل۱۶، جدول تخصیص فایل۳۲، ۱۴ کاراکتر یا بایت (مانند Unix اولیه)، ۲۱ کاراکتر یا بایت، ۳۰ کاراکتر یا بایت (Human68k)؛ ۳۱ کاراکتر یا بایت (مانند Apple DOS ورژن ۳٫۳ و ۳٫۲)، ۱۵ کاراکتر یا بایت (مانند Apple proDOS)؛ ۴۴ کاراکتر یا بایت (مانند IBM S/370)، یا ۲۵۵ کاراکتر یا بایت (مانند Berkeley Unix اولیه). محدودیت‌های طول عموماً نتیجهٔ تخصیص فضای معینی در فایل سیستم برای ذخیرهٔ مؤلفه‌های نام است، به همین دلیل، محدودیت‌های بیشتر همانند اختصاص‌دادن فضای بیشتر نیازمند یک تغییر ناسازگارند.

یک مسئلهٔ مهم در رابطه با فایل سیستم‌هایی که اطلاعات را در فهرست‌های تودرتو ذخیره می‌کنند، این است که شاید امکان ایجاد پرونده‌ای که اسم کامل آن از محدودیت‌های پیاده‌سازی تجاوز کند وجود داشته باشد؛ زیرا ممکن است بررسی طول به‌جای نام کامل برای بخش‌های مجزای نام، به‌تنهایی انجام شود. حداکثر محدودهٔ (MAX_PATH) بسیاری از نرم‌افزارهای کاربردی ویندوز ۲۶۰ است، در حالی که نام پرونده‌های ویندوز به‌راحتی می‌توانند از این محدوده تجاوز کنند.

افزونه‌ها (extensions) نام پرونده

[ویرایش]

بسیاری از فایل سیستم‌ها، مانند سیستم‌های جدول تخصیص فایل، ان‌تی‌اف‌اس و vms به یک افزونهٔ نام پرونده اجازه می‌دهند نام پرونده را به دو بخش تقسیم کند: یک نام اصلی یا ریشه و یک افزونه یا پسوند که بعضی از نرم‌افزارهای کاربردی برای تشخیص قالب پرونده از آن استفاده می‌کنند. افزونهٔ نام فایل از یک یا چند کاراکتر تشکیل می‌شود که پیروی آخرین بخش نام پرونده می‌آیند. پرونده‌های دارای خروجی چندگانه توسط نرم‌افزارهای کاربردی که از نام اصلی یکسان و افزونه‌های متفاوت استفاده می‌کنند ایجاد می‌شوند. برای مثال، ممکن است یک کامپایلر از افزونه‌های FOR برای پروندهٔ ورودی منبع (برای کد Fortran), OBJ برای خروجی شیء و LST برای فهرست‌نویسی استفاده کند. با این‌که تعدادی افزونهٔ متداول وجود دارد، اما این افزونه‌ها قراردادی هستند و ممکن است یک نرم‌افزار کاربردی دیگر از REL و RPT استفاده کند. معمولاً پرونده‌ها در فایل سیستم‌هایی که افزونه‌ها را جدا نمی‌کنند، افزونهٔ طولانی‌تری دارند مانند html.

قابلیت‌های همکاری رمزگذاری

[ویرایش]

برای نام پرونده‌ها یک رمزگذاری استاندارد عمومی وجود ندارد.

چرا که نام پرونده‌ها باید میان نرم‌افزارها مبادله شوند (انتقال فایل شبکه، ذخیرهٔ فایل سیستم، نرم‌افزار پشتیبانی و هماهنگ‌سازی پرونده، مدیریت پیکربندی، فشرده‌سازی و بایگانی داده و…)، این بسیار مهم است که اطلاعات نام پرونده میان دو نرم‌افزار کاربردی از دست نرود. این مسئله موجب پذیرش گستردهٔ یونی‌کد به‌عنوان استانداردی برای رمزگذاری پرونده‌ها شد، گرچه برخی نرم‌افزارهای قدیمی ممکن است یونی‌کد را متوجه نشوند.

قابلیت همکاری نشانهٔ رمزگذاری

[ویرایش]

در گذشته، نام پرونده‌ها در هر کاراکتری را تا جایی که برای فایل سیستم ایمن بود در نام پرونده‌های خود مجاز می‌دانستند. با اینکه این روش استفاده از هرگونه رمزگذاری را مجاز می‌داند، و به همین دلیل، امکان نمایش هر متن محلی را در هر سامانهٔ محلی فراهم می‌کند، منجر به بسیاری از قابلیت‌های همکاری می‌شود.

یک نام پرونده داخل یک کشور ممکن است با استفاده از رشته‌های بایتی متفاوتی در سامانه‌های متمایز ذخیره شده باشد، مثلاً یکی با استفاده از رمزگذاری Japanese Shift یا JIS و دیگری از رمزگذاری Japanese EUC. تبدیل ممکن نبوده؛ زیرا بیشتر سامانه‌ها شرحی از رمزگذاری که برای یک نام پرونده استفاده شده را به عنوان قسمتی از اطلاعات فایل توسعه‌یافته نمایش نمی‌دادند.

یک راه حل، پذیرش یونی‌کد برای رمزگذاری نام پرونده‌ها بود.

اما در MacOS کلاسیک، رمزگذاری نام پرونده‌ها همراه خصوصیات نام پرونده ذخیره می‌شد.

قابلیت همکاری یونی‌کد

[ویرایش]

استاندارد یونی‌کد مسئلهٔ تشخیص رمزگذاری را برطرف کرد.

با این حال، بعضی مسائل قابلیت همکاری محدود از قبیل هنجارسازی یا normalization (هم‌ارزی)، یا نسخهٔ در حال استفادهٔ یونی‌کد باقی ماند. برای نمونه، UDF به یونی‌کد ۲٫۰ محدود شد؛ MacOS هنجارسازی یونی‌کد NFD که به‌طور اختیاری می‌تواند به حروف کوچک و بزرگ حساس باشد (به‌طور پیش‌فرض حساس نیست) را اعمال می‌کند. حداکثر طول نام پرونده استاندارد نیست و ممکن است به اندازهٔ واحد کد وابسته باشد. اگرچه این یک مسئلهٔ جدی است، در اکثر موارد یک مسئلهٔ محدود است. در لینوکس به این معناست که نام پرونده برای باز کردن آن کافی نیست: علاوه‌بر آن، نمایش دقیق بایتی نام پرونده روی دستگاه حافظه نیاز است. این با تعدادی فراخوانی‌های هنجارسازی مکارانه در سطح نرم‌افزار قابل حل است.[۱۱]

این مسئله از هم‌ارزی یونی‌کد را «برخورد با نام نرمال» می‌نامند. یک راه حل آگاهی از ترکیب غیرنرمال یونی‌کد است که در تخریب و سرقت از جوامع فنی استفاده می‌شود.[۱۲] این راه حل مسیرهای داخل حافظه را هنجارسازی نمی‌کند. مسیرها تنها برای مقایسه هنجارسازی می‌شوند. با این حال، بعضی جوامع این راهبرد را انحصاری کردند، به‌طوری‌که استفاده از آن در سایر جوامع ممنوع باشد.

چشم‌اندازها

[ویرایش]

برای محدودکردن مسائل قابلیت همکاری بعضی اندیشه‌ها که توسط Sun شرح داده شده عبارتند از:

  • استفاده از یک رمزگذاری یونی‌کد (مانند جدول تخصیص فایل_۸)
  • انجام تبدیلات شفاف کد روی نام پرونده‌ها
  • ذخیرهٔ نام پرونده‌های هنجارسازی‌نشده
  • بررسی برای هم‌ارزی استاندارد میان نام پرونده‌ها، برای جلوگیری از دو نام پروندهٔ هم‌ارز استاندارد در یک فهرست یکسان

این توجهات یک محدودیت را ایجاد می‌کند که اجازهٔ تغییر به یک رمزگذاری متفاوت با جدول تخصیص فایل_۸ در آینده را نمی‌دهد.

یکتایی

[ویرایش]

نام پرونده‌ها داخل یک فهرست باید یکتا باشند. از آن‌جا که ترکیب مربوط به نام پرونده برای فهرست‌ها نیز اعمال می‌شود، امکان ایجاد یک فایل و ورودی‌های فهرست با نام یکسان وجود ندارد. البته فایل‌های متعدد در فهرست‌های مختلف می‌توانند نام یکسانی داشته باشند.

رویکرد یکتایی می‌تواند حساسیت نسبت به حروف کوچک و بزرگ و شکل استانداردسازی یونی‌کد را تغییر دهد مانند NFC و NFD. یعنی دو پروندهٔ مجزا می‌توانند با متن نام پروندهٔ یکسان و پیاده‌سازی بایتی متفاوت از آن نام پرونده ایجاد شوند.[۱۳]

حفاظت از بزرگی یا کوچکی حروف

[ویرایش]

بعضی فایل سیستم‌ها، مانند جدول تخصیص فایل، نام پرونده‌ها را بدون توجه به کوچک یا بزرگ بودن حروف آن‌ها با حروف بزرگ ذخیره می‌کنند. برای مثال، اگر پرونده‌ای با نام «MyName.Txt» یا «myname.txt» ایجاد شده باشد با نام پروندهٔ «MYNAME.TXT» ذخیره خواهد شد. هر تغییری در حروف کوچک و بزرگ می‌تواند برای ارجاع به یک پروندهٔ یکسان استفاده شود. این نوع فایل سیستم‌ها غیر حساس به حروف کوچک و بزرگ (case-insensitive) نامیده می‌شوند و محافظ کوچکی و بزرگی حروف(case-preserving) نیستند. بعضی فایل سیستم‌ها اجازه نمی‌دهند در نام پرونده‌ها فقط از حروف کوچک استفاده شود.

بعضی فایل سیستم‌ها نام پرونده‌ها را به همان شکلی که ایجاد شدند، ذخیره می‌کنند؛ به این فایل سیستم‌ها نگهدارندهٔ حروف کوچک و بزرگ (case-retentive) یا محافظ حروف کوچک و بزرگ(case-preserving) می‌گویند. چنین فایل سیستمی می‌تواند نسبت به حروف کوچک و بزرگ حساس یا غیرحساس باشد. اگر حساس باشد، آن‌گاه «MyName.Txt» و «myname.txt» می‌توانند به دو فایل مختلف در یک فهرست یکسان اشاره کنند، و به هر پرونده باید دقیقًا با همان ترکیبی از حروف کوچک و بزرگ که با آن نام‌گذاری شده ارجاع داده شود. از سوی دیگر در یک فایل سیستم غیرحساس به حروف کوچک و بزرگ فقط یکی از نام‌های «MyName.Txt» و «myname.txt» و «Myname.TXT» می‌توانند هم‌زمان در یک فهرست نام یک پرونده باشند، و به یک پرونده با یکی از این نام‌ها با هر ترکیبی از حروف کوچک و بزرگ می‌توان ارجاع داد.

Unix و سامانه‌های فرعی آن از شروع اصلیش محافظ حروف کوچک و بزرگ بودند. اما، همه انواع فایل سیستم‌های Unix حساس به حروف کوچک و بزرگ نیستند؛ به‌طور پیش‌فرض، HFS+ در macOS نسبت به حروف کوچک و بزرگ حساس است، و کارگزاران SMB (بلوک پیام سرور) رفتارهای غیرحساس به حروف کوچک و بزرگ ارائه می‌دهند (حتی زمانی که فایل سیستم اصلی به حروف کوچک و بزرگ حساس باشد، مانند سامبا در بیشتر سامانه‌های شبیه به Unix) و فایل سیستم کاربر SMB رفتار غیرحساس نسبت به حروف کوچک و بزرگ ارائه می‌دهد. حساسیت یا عدم حساسیت فایل سیستم به حروف کوچک و بزرگ یک چالش قابل توجه برای نرم‌افزار است مانند سامبا و واین، که باید به‌طور کارآمد همکاری کند هم با سامانه‌هایی که با پرونده‌های با حروف بزرگ و پرونده‌های با حروف کوچک متفاوت رفتار می‌کنند و هم سامانه‌هایی که با آن‌ها یکسان برخورد می‌کنند.[۱۴]

جستارهای وابسته

[ویرایش]

منابع

[ویرایش]
  1. http://www.dictionary.com/browse/filename
  2. https://msdn.microsoft.com/en-us/library/windows/desktop/aa368590(v=vs.85).aspx
  3. Howard, Randall (December 31, 2008). "General, History". Randalljhoward.com. Archived from the original on 1 December 2017. Retrieved September 17, 2013.
  4. David Robinso; Ienup Sung; Nicolas Williams (March 2006). "Solaris presentations: File Systems, Unicode, and Normalization" (PDF). San Francisco: Sun.com. Archived from the original (PDF) on July 4, 2012.
  5. RFC 959 IETF.org RFC 959, File Transfer Protocol (FTP)
  6. "File Name Encoding Repair Utility v1.0". Support.apple.com. June 1, 2006. Retrieved September 17, 2013.
  7. "convmv - converts filenames from one encoding to another". J3e.de. Retrieved September 17, 2013.
  8. "Fsutil command description page". Microsoft.com. Retrieved September 15, 2013.
  9. "NTFS Hard Links, Directory Junctions, and Windows Shortcuts". Flex hex. Inv Softworks. Archived from the original on 17 September 2017. Retrieved March 12, 2011.
  10. "ddname support with FTP, z/OS V1R11.0 Communications Server IP User's Guide and Commands z/OS V1R10.0-V1R11.0 SC31-8780-09". IBM.com.
  11. "Filenames with accents". Ned Batchelder. Retrieved September 17, 2013.
  12. "NonNormalizingUnicodeCompositionAwareness - Subversion Wiki". Wiki.apache.org. January 21, 2013. Archived from the original on 10 March 2017. Retrieved September 17, 2013.
  13. "Cross platform filepath naming conventions - General Programming". GameDev.net. Retrieved September 17, 2013.
  14. "CaseInsensitiveFilenames - The Official Wine Wiki". Wiki.winehq.org. November 8, 2009. Archived from the original on 18 August 2010. Retrieved August 20, 2010.

ویکی‌پدیای انگلیسی

پیوند به بیرون

[ویرایش]