پرش به محتوا

ویکی‌پدیا:سیاست ربات‌رانی/درخواست مجوز/HujiBot/وظیفه ۱۳

از ویکی‌پدیا، دانشنامهٔ آزاد

HujiBot (وظیفه ۱۳)

[ویرایش]

ربات‌ران: Huji (بحثمشارکت‌هاانتقال‌هابسته شودبسته‌شدن‌هااختیاراتآمارآمار پیشرفته)

خودکار، نیمه‌خودکار یا دستی: نیمه‌خودکار

کد ربات: https://github.com/PersianWikipedia/fawikibot/blob/master/hujibot_13.py

خلاصهٔ عملکرد: مقاله‌های قنات یک شهرستان را با هم ادغام می‌کند (بر اساس ویکی‌پدیا:نظرخواهی/ادغام مقالات رباتیک قنات‌ها)

تناوب اجرا: یک بار

تخمین تعداد صفحه‌هایی که ویرایش می‌شوند: نزدیک بیست هزار

گذر از الگوی {{nobots}} (بله/خیر): خیر

آیا در ویکی دیگری پرچم دارد (بله/خیر): خیر

شرح روش اجرا: نام یک ردهٔ مربوط به قنات‌های شهرستان را به عنوان ورودی می‌گیرد (مثلاً رده:قنات‌های شهرستان بیرجند). تمام صفحه‌های آن رده را می‌گیرد و به ترتیب الفبایی مرتبط می‌کند. محتوای صفحه‌ها را می‌گیرد و با هم در یک صفحه بخش‌بندی شده ادغام می‌کند. خروجی آزمایشی‌اش شبیه به ویکی‌پدیا:سیاست ربات‌رانی/درخواست مجوز/HujiBot/وظیفه ۱۳/آزمایشی خواهد بود. این متن را در صفحهٔ فهرست قنات‌های آن شهرستان (مثلاً فهرست قنات های شهرستان بیرجند) می‌گذارد و ذخیره می‌کند. صفحه‌های قنات‌های یادشده را هم تبدیل به تغییر مسیری به این فهرست می‌کند.

بحث

[ویرایش]

کد اطمینان حاصل می‌کند که فهرست موجودی را رونویسی نکند. هر بار یک رده به آن داده می‌شود و نتیجه به صورت دستی کنترل می‌شود. احتیاط می‌شود که رده‌ها با فواصل زمانی کافی از این ربات گذرانده شوند تا تعداد کل مقاله‌های ویکی‌پدیا زیر ۵۰۰٫۰۰۰ نیفتد. — حجت/بحث ‏۱۳ ژانویهٔ ۲۰۱۷، ساعت ۲۰:۴۲ (UTC)[پاسخ]

حالا که دارید زحمت انجام این مورد را می‌کشید، لطفاً در جملهٔ «تعداد مالکان این قنات X نفر می‌باشد و اراضی تحت کشت این قنات X هکتار می‌باشد»، می‌باشد اول را به «هستند» و می‌باشد دوم را به «است» تغییر دهید. لطفاً فعلاً برای آزمایش، رده:قنات‌های شهرستان بیرجند که مثال زدید را ادغام کنید.
فهرست قنات‌‌های هر شهرستان را هم خودتان می‌سازید؟ درفش کاویانی (بحث) ‏۱۳ ژانویهٔ ۲۰۱۷، ساعت ۲۲:۰۶ (UTC)[پاسخ]
تغییرش دادم تا هستند و است بنویسید. ربات خودش فهرست را می‌سازد (یا اگر از قبل موجود باشد و تغییرمسیر باشد، همان را استفاده می‌کند) — حجت/بحث ‏۱۳ ژانویهٔ ۲۰۱۷، ساعت ۲۳:۲۲ (UTC)[پاسخ]

@Huji: انگار طبق صفحه آزمایشی که ارائه کردید قرار است تمام محتوا ادغام شود؟ اگر اینگونه است الگو:قنات‌های شهرستان بیرجند تعداد زیاد است و حجم فهرست زیاد می‌شود! الان ۹۵۴ مقاله در رده‌ای که ارائه کرده‌اید وجود دارد و حجم صفحه آزمایشی که ارائه کردید بدون منبع ۳۰۰۰ بایت است یعنی با ادغام محتوای ۹۵۴ مقاله در یک مقاله حجم فهرست ۱۴۳۱ کیلوبایت! یا به عبارتی ۱.۴ مگابایت می‌شود. اگر طبق این روش بخواهید محتوا را نیز ادغام کنید بر پایه وپ:تفکیک حجم مقاله نباید بیش از ۴۰ کیلوبایت شود، هرچند ادغام به این صورت جالب نیست و خواننده با متن‌های تکراری روبرو میشود!

بهتر است به صورت جدولی که اول نظرخواهی بود ادغام شود، فرضا هم اگر تعداد قنات شهرستانی خیلی کم بود آن را به فهرست استان ارتقا می‌دهیم. (همانند فهرست_قنات‌های_استان_اصفهان) مثل جدول زیر:

قنات بخش روستا طول قنات (متر) تعداد میله چاه عمق مادر چاه دبی (لیتر بر ثانیه) سطح زیر کشت (هکتار)
آوازک بخش مرکزی شهرستان بیرجند ساقی ۳۰۰ ۱۰ ۱۲ ۲ ۳
آغلدر بخش مرکزی شهرستان بیرجند آغلدر ۶۰۰ ۲۰ ۲۰ ۳ ۱۰

--آرمانب ‏۱۴ ژانویهٔ ۲۰۱۷، ساعت ۱۵:۲۱ (UTC)[پاسخ]

@Sunfyre: حق با شماست. برای ساختن آن جدول هم نیازی نیست که مقاله‌های موجود را از کد بگذارنم، جدول اصلی از منابعی نظیر http://www.iranhydrology.net/qanat/qanatlist.asp?cmd=reset قابل دسترسی است؛ همان را برای جدول سازی به کار می‌برم و بعد مقاله‌ها را تغییرمسیر می‌کنم — حجت/بحث ‏۱۴ ژانویهٔ ۲۰۱۷، ساعت ۱۹:۳۲ (UTC)[پاسخ]
@Huji: ایجاد جدول مشابه اینجا کپی‌رایت را زیر سوال می‌برد. نمی‌توانید آن را در ویکی کپی‌پیست کنید هرچند که تغییرات جزئی روی آن انجام دهید.یاماها۵ / ب ‏۱۵ ژانویهٔ ۲۰۱۷، ساعت ۱۰:۴۶ (UTC)[پاسخ]
شاید بتوان با نویسنده مکاتبه کرد و مجوز گرفت، البته پایین صفحه نوشته است «اطلاعات اين بانک بر اساس امار وزارت جهاد کشاورزي تهيه شده است.» --آرمانب ‏۱۵ ژانویهٔ ۲۰۱۷، ساعت ۱۱:۲۲ (UTC)[پاسخ]
@Yamaha5: اطلاعات جدول حق تکثیر ندارد (چون از آمار وزارتخانه است، و تولیدات دولتی در مالکیت عمومی هستند) — حجت/بحث ‏۱۵ ژانویهٔ ۲۰۱۷، ساعت ۱۶:۲۴ (UTC)[پاسخ]
شاید بد نباشد en:Wikipedia:Public domain ترجمه شود.--آرمانب ‏۱۵ ژانویهٔ ۲۰۱۷، ساعت ۱۶:۵۷ (UTC)[پاسخ]
کارهای دولتی در ایران (مثل اکثر کشورهای جهان) حق نشر دارند ولی داده‌ها در کل حق نشر ندارند چون برای تهیه کردنشان فقط باید عرق ریخت و به خلاقیت نیاز نیست. کپی‌رایت حامی خلاقیت است. جداول اطلاعاتی کپی‌رایت ندارند. ‏4nn1l2 (بحث) ‏۱۵ ژانویهٔ ۲۰۱۷، ساعت ۱۷:۱۶ (UTC)[پاسخ]
چنین نیست! اداره هواشناسی در فرودگاه مهرآباد تشریف ببرید. داده‌‌های هواشناسی ۲۰ سال گذشته شهرها را می‌فروشند و محل درآمد خوبی برای آنهاست. همچنین اطلاعات جغرافیایی را مسکن و شهرسازی می‌فروشد تا چند سال پیش فروش عکس هوایی شیراز در انحصار شهرداری بود خدا خیر گوگل‌مپ دهد که آن را از انحصار خارج کرد. در ایران همهٔ کارهای دولتی کپی‌رایت دارند مگر آنکه ذکر کنند ندارد. در en:Wikipedia:Public domain هم نوشته با وجودی که ایران با آمریکا رابطه کپی‌رایت ندارد ولی برای احتیاط ویکی‌پدیا فقط آثار آزاد را بازنشر می‌کند.یاماها۵ / ب ‏۱۵ ژانویهٔ ۲۰۱۷، ساعت ۲۱:۵۹ (UTC)[پاسخ]
@Yamaha5: در اشتباهید! در ایالات متحده هم اطلاعات هواشناسی و هوانوردی و امثال آن که دولتی (و فاقد حق تکثیر است) فروخته می‌شود. این که چیزی حق تکثیر نداشته باشد، با این که رایگان باشد، فرق دارد. همان بحث دو مفهوم free در انگلیسی است که اغلب اشتباه می‌کنند: free to use و free of charge. آن سازمان‌ها پول می‌گیرند چون برای کارشان به قول کاربر:4nn1l2 عرق ریخته‌اند. شما می‌توانید هر دادهٔ بدون حق تکثیری را به شکلی کاربردی‌تر در بیاورد و آن شکل جدید را بفروشید؛ کسی جلودار شما نیست. اما اصل داده کماکان بدون حق تکثیر است. — حجت/بحث ‏۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۱:۳۲ (UTC)[پاسخ]
من داده‌های گذشته را گفتم نه آینده. سیاههٔ هواشناسی را آمریکا را مجانی در اختیار می‌گذارد مانند این ولی ایران نهایتاً تا چند ماه اخیر و بقیهٔ سال‌ها را باید خریداری کنید. چون در ایران جزئیات کپی‌رایت زیاد باز نشده‌است مسلما اگر جلوی آن اداره همان دیتا را بفروشید کسی به شما کاری نخواهد داشت. یاماها۵ / ب ‏۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۶:۵۳ (UTC)[پاسخ]
@Yamaha5: بله من هم داده‌های گذشته را گفتم! اگر داده‌های گذشته را در حجم بزرگ بخواهید باید پول بدهید از دولت آمریکا بخرید! اما وقتی خریدید چون حق تکثیر ندارد می‌توانید خودتان رایگان (یا غیر رایگان) اقدام به فروش آن کنید. — حجت/بحث ‏۱۶ ژانویهٔ ۲۰۱۷، ساعت ۲۱:۵۱ (UTC)[پاسخ]

@Darafsh و Yamaha5: کد را بیشتر جلو بردم؛ خروجی می‌شود شبیه ویکی‌پدیا:سیاست ربات‌رانی/درخواست مجوز/HujiBot/وظیفه ۱۳/آزمایشی (به روزش کردم). توجه کنید که در دادهٔ اصلی هم واقعاً اسم بخش برای آن مثال‌ها «نامعلوم» ذکر شده (مثلاً این را ببینید).

نظرتان چیست؟ آیا مقاله‌سازی را انجام بدهم؟ زیر ۲۰۰ مقاله ساخته خواهد شد (کلاً ۱۹۴ بخش در این داده آمده‌است) — حجت/بحث ‏۱۵ ژانویهٔ ۲۰۱۷، ساعت ۱۹:۳۰ (UTC)[پاسخ]

همچنین به ربات یاد دادم که رده‌های لازم برای شهرستان و استان را هم بسازد. — حجت/بحث ‏۱۵ ژانویهٔ ۲۰۱۷، ساعت ۲۰:۲۹ (UTC)[پاسخ]

لطفا صبر کنید تا تکلیف کپی‌رایت مشخص شود یاماها۵ / ب ‏۱۵ ژانویهٔ ۲۰۱۷، ساعت ۲۲:۰۱ (UTC)[پاسخ]
@Yamaha5: لطفاً برای تعیین تکلیف راه حل ارائه کنید. صبر کردن خالی فایده ندارد.
توجه داشته باشید که یا من درست می‌گویم و داده حق تکثیر ندارد، که در آن صورت این جداول را می‌سازیم. یا اشتباه می‌کنم و داده حق تکثیر دارد که در آن صورت تمام آن مقاله‌ها ناقض حق تکثیر هستند و باید حذف شوند (چون بر اساس دادهٔ حق تکثیر دار ساخته شده بودند). در هر دو حالت آن صفحه‌ها حذف یا تغییرمسیر خواهند شد. — حجت/بحث ‏۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۱:۲۶ (UTC)[پاسخ]
همچنین اگر فرض شما درست باشد و آمار دولتی ایران حق تکثیر داشته باشد باید تمام مقاله‌های روستاها را هم حذف سریع کنیم چون ناقض حق تکثیر خواهند بود. — حجت/بحث ‏۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۱:۴۷ (UTC)[پاسخ]
شما می‌خواهید جدول تولید کنید من تکلیف روشن کنم! حجت عزیز خود آمار در صورتی که به فرمت آن سایت باشد (جدول) حق تکثیر دارد چون کپی‌پیست از آنجا می‌شود. در صورتی که به صورت متنی باشد ندارد. این قضیه در مقالات علمی هم وجود دارد شما زمانی که یک پاراگراف از یک مقاله را می‌خواهید استفاده کنید حق ندارید آن را کپی‌پیست کنید (هرچند که به آن مقاله ارجاع دادید) باید بازنویسی کنید و به آن مقاله ارجاع دهید و اگر یکی از این دو مورد انجام نشود دزدی علمی روی داده. با کمی جستجو در وب متوجه سخن من می‌شویدیاماها۵ / ب ‏۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۶:۳۹ (UTC)[پاسخ]
@Yamaha5: گفتید «آمار در صورتی که به فرمت آن سایت باشد (جدول) حق تکثیر دارد». این هم به نظر من اشتباه است. اگر داده‌ها در اصل حق تکثیر نداشته باشند، آن چه در آن وب‌سایت آمده هم قسمتی‌اش که افزون بر داده‌ها و ناشی از کار خلاق صاحب سایت باشد حق تکثیر دارد، اما خود داده‌ها در آن سایت هم حق تکثیر ندارند. مثل این است که من یک اثر نقاشی را که حق تکثیر ندارد ببرم در سایت خودم بگذارم پایینش بنویسم حق تکثیر فلانی. این کار باعث نمی‌شود که آن اثر حق تکثیر داشته باشد؛ صرفاً باعث می‌شود که من صاحب سایت حق تکثیر را نقض کرده باشم و چیزی که حق تکثیر ندارد را به نادرست صاحب حق تکثیر جا زده باشم! قانوناً می‌شود از من شکایت کرد به خاطر انحصارطلبی غیر قانونی. — حجت/بحث ‏۱۶ ژانویهٔ ۲۰۱۷، ساعت ۲۱:۵۳ (UTC)[پاسخ]
درست است، یا داده‌ها حق تکثیر دارند که باید تمام مقالات قنات‌ها حذف سریع شوند (این کار بنظر راحتتر و سریعتر است) یا داده‌ها حق تکثیر ندارند که باید طبق اجماع اجتماع تغییر مسیر و ادغام شوند، یک بام و دو هوا که نمی‌شود، جالب است در ویکی‌پدیا:سیاست ربات‌رانی/درخواست مجوز/JYBot/وظیفه ۲۸ این بحث‌ها نبوده است!--آرمانب ‏۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۴:۰۳ (UTC)[پاسخ]
@Yamaha5: گفتید «...اگر یکی از این دو مورد انجام نشود دزدی علمی روی داده». باز مفاهیم را قاطی کردید. سرقت علمی ربطی به حق تکثیر ندارد. اگر کسی مطلبش را در مجله‌ای که حق تکثیر ندارد (مثل پلاس وان که تمام مقالاتش مجوز عامه خلاق دارند) چاپ کند شما می‌توانید عیناً متن را کپی کنید و هیچ حق تکثیری هم نقض نمی‌شود! اما وقتی بگویید که «این از اول فکر خودم بود»، بدون نقض حق تکثیر، مرتکب دزدی علمی می‌شوید. این ها دو چیز مختلف هستند. — حجت/بحث ‏۱۶ ژانویهٔ ۲۰۱۷، ساعت ۲۱:۵۷ (UTC)[پاسخ]
قبلا هم خدمتتان گفتم اگر داده‌‌ها به صورت جدول باشد حق تکثیر دارد اگر به متن تبدیل شود مشکلی نیست یاماها۵ / ب ‏۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۶:۱۸ (UTC)[پاسخ]
@Yamaha5: این دیگر از آن حرف‌ها بود! فرق داده جدولی و غیر جدولی، فقط در نحوهٔ ارائه‌اش است. اگر حرف شما درست باشد، یعنی داده خودش حق تکثیر ندارد (اگر نه به صورت غیر جدولی هم نمی‌شد ارائه‌اش کرد)، بلکه نحوهٔ ارائه‌اش حق تکثیر دارد. اما نحوهٔ ارائه به صورت جدول، یک کار خلاق نیست در نتیجه جدول خودش حق تکثیر ندارد. توجه کنید که حق تکثیر مربوط به کارهای خلاق است. مثلاً اگر ارائه به صورت یک اطلاع‌نگاشت بود می‌شد گفت که طراحی‌اش خلاقیت برده و در نتیجه این «نحوهٔ ارائه» حق تکثیر دارد. اما آثاری که ایجادش خلاقیت خاصی ندارند، حق تکثیر هم ندارند. مثالش لوگوی شرکت مایکروسافت که همچنان که در File:Microsoft logo (2012).svg می‌بینید، چون فقط از حروف و خطوط صاف و رنگ‌های ساده تشکیل شده و کشیدنش خلاقیت نمی‌خواهد، در نتیجه حق تکثیر ندارد! احتمالاً تا قبل از خواندن این جمله تصور این را نمی‌کردید که نشان یک شرکت مثل مایکروسافت حق تکثیر نداشته باشد!
من این بحث را چنین جمع‌بندی می‌کنم که تنها کسی که مشکل حق‌تکثیری دارد، شما هستید که مشکلاتی که مطرح می‌کنید هم نه اساس قانونی دارند (سند قانونی ندارید نشان بدهید که «فقط جدول» حق تکثیر دارد) نه با مفاهیم قوانین حق تکثیر سازگارند. در نتیجه بحث بیشتر روی حق تکثیر را لازم نمی‌بینم.
@Ladsgroup،‏ Ebrahim و Darafsh: مجوز ویرایش آزمایشی برای رباتم در اینجا می‌خواهم. — حجت/بحث ‏۱۶ ژانویهٔ ۲۰۱۷، ساعت ۲۱:۴۹ (UTC)[پاسخ]
سخن آخر برای علاقه‌مندان: این را تماشا کنید. خواهید دید که «داده‌های تحقیقاتی» (research data) دست کم در آمریکا، حق تکثیر ندارند! نمایش آن‌ها به شکلی خلاقانه می‌تواند حق تکثیر داشته باشد اما داده‌هایی که در آن به کار رفته‌اند کماکان حق تکثیر ندارند.
بدیهی است که قوانین ایران می‌تواند متفاوت باشد و ویکی‌مدیا اگر چه بر اساس قوانین ایالات متحده اداره می‌شود (که در آن داده‌های تحقیقاتی و نیز تولیدات دولتی فاقد حق تکثیرند) اما ترجیح می‌دهد که قوانین محلی هم رعایت شوند. اما یک چیز بدیهی است: یا «داده»‌های دولتی ایرانی حق تکثیر دارند یا نه. اگر بله، باید تمام مقاله‌های مبتنی بر آن (از جمله مقاله‌های مبتنی بر داده‌های قنات، داده‌های سرشماری، و ...) به خاطر نقض حق تکثیر حذف شوند. اگر نه، بحث بالا لازم نبود و از اول می‌شد جدول‌ها را ساخت — حجت/بحث ‏۱۶ ژانویهٔ ۲۰۱۷، ساعت ۲۲:۰۵ (UTC)[پاسخ]

@Ladsgroup: درود؛ لطفا به عنوان عضوی از گمر که در این موضوع تعارض منافع ندارد این بحث را جمع‌بندی کنید؛ اختلاف این است که یاماها۵ می‌گوید نمیتوان از داده‌های وزارت کشاورزی بدلیل کپی رایت استفاده کرد، من و حجت و فور معتقدیم می‌توان استفاده کرد و نقض کپی رایت نیست. (بحث‌های بالا را مطالعه کنید)--آرمانب ‏۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۷:۳۹ (UTC)[پاسخ]

سلام.

  1. تعداد کل نوشتارهای قنات‌ها زیر ۱۴هزارتاست. هر کار هم بکنید زیر ۵۰۰هزار نخواهیم رفت.
  2. برای مستثنی کردن آنها که سرشناسند چه فکری شده؟ فهرستی از قنات‌هایی که ویرایشی غیرربات در تاریخچه دارند به ترتیب حجم اینجا فهرست شده. البته نه حجم و نه داشتن ویرایش برای سرشناسی کافی نیست، ولی بهتر است چندده تای اول فهرست بررسی شوند. Saeidpourbabak (بحث) ‏۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۰:۴۱ (UTC)[پاسخ]
@Saeidpourbabak: باید ویرایش‌های خود کاربر:جواد را هم نادیده بگیرید چون معمولاً برای رفع اشتباهات رباتش بوده. نتیجه می‌شود نزدیک هفتصد صفحه که من دستی چک می‌کنم — حجت/بحث ‏۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۱:۳۰ (UTC)[پاسخ]

از من خواسته شده که نظر دهم. توضیح به نظر ضروری می‌رسد که حجت از خود وب‌سایت کپی پیست نمی‌کند. بلکه از داده‌های آن استفاده می‌کند. و دانستن این نکته برای همه ربات‌رانان ضروری است که طبق قوانین حق‌تکثیر در آمریکا داده (نه فقط داده تحقیقاتی) را نمی‌توان کپی‌رایت کرد (به همین دلیل است ویکی‌داده با لایسنس CC0 = مالکیت عمومی منتشر می‌کند.) در صورتی که اتحادیه اروپا داده‌ها را کپی‌رایت می‌کند (تحت عنوان قانونی با نام Directive 96/9/EC of the European Parliament and of the Council of 11 March 1996 on the legal protection of databases) و بسیاری از چپترها در حال جنگ هستند تا این قانون را ملغا کنند. به هر صورت، برای ایران بند یازدهم از ماده دوم قانون حق‌تکثیر داده‌ها را در صورت داشتن «جنبه ابتکاری» دارای حق‌تکثیر می‌کند که با توجه به وضعیت اسف‌بار حق‌تکثیر در ایران و عضو نبودن در کنسواسیون برن به نظرم چنین چیزی سخت‌گیری بی‌مورد خواهد بود.
از بحث حق‌تکثیر بگذریم. به عنوان گمر به نظرم تنها روند منطقی این است که جدول بسازیم یا در مقالات روستاها ادغام شوند (و فهرستی ساده از آنها برای هر شهرستان هم داشته‌باشیم) :)امیرΣυζήτηση ‏۱۷ ژانویهٔ ۲۰۱۷، ساعت ۰۲:۲۵ (UTC)[پاسخ]

@Ladsgroup: ممنون؛ برداشت من از «جدول بسازیم» این بود که به این درخواست مجوز دادید.--آرمانب ‏۱۷ ژانویهٔ ۲۰۱۷، ساعت ۰۸:۵۹ (UTC)[پاسخ]
من چه کنم؟ مجوز دارم؟ آزمایشی برانم؟ بی‌خیال شوم؟ — حجت/بحث ‏۱۸ ژانویهٔ ۲۰۱۷، ساعت ۱۶:۵۲ (UTC)[پاسخ]
@Huji: لطفاً فعلاً برای آزمایش، رده:قنات‌های شهرستان بیرجند که مثال زدید را ادغام کنید. درفش کاویانی (بحث) ‏۱۸ ژانویهٔ ۲۰۱۷، ساعت ۱۸:۰۲ (UTC)[پاسخ]
@Darafsh: سپاس از شما. فهرست قنات‌های شهرستان بیرجند را ساختم و در این پروسه چند ایراد املایی در جدول اصلی را هم شناسایی و رفع کردم. کلاً همه صفحه‌ها را دستی چک می‌کنم و اگر ایراد داشته باشد رفع می‌کنم. — حجت/بحث ‏۱۹ ژانویهٔ ۲۰۱۷، ساعت ۱۷:۵۶ (UTC)[پاسخ]
امکانش هست به روستاها و بخش‌ها هم لینک داشته باشد؟ ‏4nn1l2 (بحث) ‏۱۹ ژانویهٔ ۲۰۱۷، ساعت ۱۸:۰۳ (UTC)[پاسخ]
@4nn1l2: پیوند به روستاها نه؛ چون نامگذاری روستاهای این فهرست کاملاً با نامگذاری روستاها در ویکی‌پدیا (و منابعی که ویکی‌پدیا از آن گرفته) سازگار نیست. اما در مورد بخش‌های شهرستان میزان مطابقت بالاتر است. اتفاقاً دارم همین الان کد را تغییر می‌دهم که پیوند بکند — حجت/بحث ‏۱۹ ژانویهٔ ۲۰۱۷، ساعت ۱۸:۱۲ (UTC)[پاسخ]
@4nn1l2: نتیجه باز هم دلخواه من نبود. این داده می‌گوید که شهرستان بیرجند بخشی به نام درمیان دارد (پیوند) در حالی که در تقسیم‌بندی کشوری که در ویکی داریم، شهرستان درمیان خودش یک شهرستان مستقل از بیرجند است، و شهرستان بیرجند فقط دو بخش مرکزی و خوسف دارد.
ربات قبلی که جواد رانده بود احتمالاً این اشکالات برای ورودی‌اش به طور دستی رفع شده بود چنان که قنات آویشک بالا در شهرستان درمیان طبقه‌بندی کرده، نه در شهرستان بیرجند.
با این حال معلوم نیست که کار ربات قبلی هم درست باشد. داده‌ای که ما الان داریم همان است که آن ربات داشته و این داده می‌گوید آن قنات در شهرستان بیرجند است.
نظر شما چیست؟ — حجت/بحث ‏۱۹ ژانویهٔ ۲۰۱۷، ساعت ۱۸:۱۹ (UTC)[پاسخ]
برای قضاوت بهتر، ویکی‌پدیا:سیاست ربات‌رانی/درخواست مجوز/HujiBot/وظیفه ۱۳/بخش‌ها را بر اساس داده‌های قنات ایجاد کردم. همچنان که می‌بینید در سطح شهرستان کمابیش سازگار است اما در سطح بخش، وضع خراب است. نظرتان چیست؟ — حجت/بحث ‏۱۹ ژانویهٔ ۲۰۱۷، ساعت ۱۸:۵۴ (UTC)[پاسخ]
سلام. علت داستان درمیان این است که اطلاعات جدول مربوط به پیش از سال ۸۴ است که هنوز بخش درمیان به شهرستان درمیان ارتقاء پیدا نکرده بود.
در مورد ویکی‌پدیا:سیاست ربات‌رانی/درخواست مجوز/HujiBot/وظیفه ۱۳/بخش‌ها، نام‌گذاری بخش‌ها (بجز بخش‌های مرکزی) بدون نام شهرستان است. بنابراین بخش کوهساران شهرستان راور می‌شود بخش کوهساران. البته باز برای بخش‌هایی که پرانتزِ ابهام‌زدایی دارند باز به مشکل خواهید خورد، چرا که مثلاً بخش فیروزآباد (اگر قناتی داشته باشد) صفحهٔ ابهام‌زدایی است و باید اسم شهرستان توی پرانتز بیاید (بخش فیروزآباد (سلسله) یا بخش فیروزآباد (کرمانشاه)).
ضمناً در ستون اول «استان» باید به همهٔ پیوندها اضافه شود (کرمان > استان کرمان).
Saeidpourbabak (بحث) ‏۱۹ ژانویهٔ ۲۰۱۷، ساعت ۱۹:۱۶ (UTC)[پاسخ]
(تعارض ویرایشی) به نظرم شما جداول را بر اساس داده‌های اصلی به صورت لینک‌دار ایجاد کنید، کاربران هر شهرستان خودشان به‌مرور زمان اطلاعات را به‌روز خواهند کرد مثلاً ویژه:مشارکت‌ها/Msoltankhushab را ببینید. مقاله‌های کاربر:جواد هم همگی به‌روز نبودند و از این لحاظ یکدست نبودند.
همچنین در ستون سوم اگر بتوانید از عبارت بخش فلانی شهرستان بهمان قسمت «شهرستان بهمان» را حذف کنید، احتمالاً پیوندهای آبی بیشتری به دست می‌آورید فقط فراموش نکنید که بخش مرکزی شهرستان بهمان را همینجوری نگه دارید. ‏4nn1l2 (بحث) ‏۱۹ ژانویهٔ ۲۰۱۷، ساعت ۱۹:۲۰ (UTC)[پاسخ]

@4nn1l2: ممنون از توضیح. من پیوندها را به همان صورت بخش فلان شهرستان بهمان نگه می‌دارم. خودم دستی تمام تغییرمسیرها را ایجاد خواهم کرد. این‌ها تغییرمسیرهای به درد بخوری هستند. در مورد درمیان و سربیشه هم که شهرستان جدا شده‌اند داده را دستی درست کردم. @Darafsh: با راهنمایی‌هایی کاربر:4nn1l2 من فهرست قنات‌های شهرستان بیرجند را باز به روز کردم. ربات حالا نتایج دلپذیری می‌دهد! اگر موافقید کار را ادامه بدهم — حجت/بحث ‏۱۹ ژانویهٔ ۲۰۱۷، ساعت ۱۹:۲۹ (UTC)[پاسخ]

مجوز دارد. با آرزوی موفقیت. درفش کاویانی (بحث) ‏۲۰ ژانویهٔ ۲۰۱۷، ساعت ۱۱:۰۸ (UTC)[پاسخ]

استخراج داده

[ویرایش]

برای مشاهدهٔ کد به اینجا مراجعه کنید.

حجم فعالیت‌ها

[ویرایش]

بعد از کلی تمیزکاری که روی فهرست قنات‌ها انجام شد، تعداد قنات‌های هر استان به شرح زیر است:

استان قنات ها
آذربایجان شرقی ۱۰۶۲
آذربایجان غربی ۱۵۱
اردبیل ۸۴
اصفهان ۱۴۱۳
ایلام ۴
بوشهر ۳۹
تهران ۲۱۹
چهارمحال و بختیاری ۴۴۹
خراسان ۸۷۶
خراسان جنوبی ۳۰۷۸
خراسان رضوی ۴۹۲۹
خراسان شمالی ۴۲۱
خوزستان ۱۱
زنجان ۴۵۱
سمنان ۷۱۵
سیستان و بلوچستان ۹۶۵
فارس ۱۰۱۶
قزوین ۲۰۸
قم ۶۴۰
کردستان ۲۳۳
کرمان ۹۰۱
کرمانشاه ۱۹۶
کهگیلویه وبویراحمد ۴۰
گلستان ۲۸۵
گیلان ۲
لرستان ۷
مازندران ۳۹
مرکزی ۲۱۶۷
هرمزگان ۱۲۹
همدان ۱۳۳۱
یزد ۲۹۰۷

فعلاً هشت استان (شامل سه خراسان، دو آذربایجان، اردبیل، یزد، گیلان) را راندم. این کار آمار مقاله‌های ویکی‌پدی را از ۵۳۱ هزار به ۵۲۵ هزار رساند. الباقی را دیرتر می‌رانم که سقوط خیلی ناگهانی نباشد. — حجت/بحث ‏۲۵ مارس ۲۰۱۷، ساعت ۲۱:۲۷ (UTC)[پاسخ]

تشکر. لطفاً برای صفحات بحث مقاله‌ها هم تصمیمی گرفته شود: بحث:قنات دیواندر، خوشاب. ‏4nn1l2 (بحث) ‏۲۶ مارس ۲۰۱۷، ساعت ۰۸:۲۰ (UTC)[پاسخ]
@4nn1l2: حتماً. یک سری از مقاله‌ها هم تغییر مسیر نشد (احتمالاً به دلیل تفاوت‌های کوچک املایی در نامی که در جدول من هست با آنچه در زمان ایجاد به کار رفته) که این‌ها را هم باید درست کنم. هر دو در دستور کارند — حجت/بحث ‏۲۶ مارس ۲۰۱۷، ساعت ۱۴:۴۶ (UTC)[پاسخ]

سلام. پیشتر درخواست کردم آنها که در تاریخچه‌شان ویرایش غیرربات دارند و حجیم‌اند (و در نتیجه احتمال سرشناسی‌شان می‌رود) بررسی شوند. الان چندتای اول آن فهرست (مثلاً قنات بلده فردوس و کاریز زیبد) تغییرمسیر شده. بنده در مورد سرشناسی اینها نظری ندارم، فقط خواستم مطمئن شوم بررسی صورت گرفته. سپاس. Saeidpourbabak (بحث) ‏۲۶ مارس ۲۰۱۷، ساعت ۱۵:۰۱ (UTC)[پاسخ]

هر دو سرشناس بود.--آرمانب ‏۲۶ مارس ۲۰۱۷، ساعت ۱۵:۱۳ (UTC)[پاسخ]
@Sunfyre و Saeidpourbabak: بررسی در دست انجام است. راه سرراستی برای این که پیشاپیش این بررسی را انجام بدهم و از فهرست خارج کنم در کد تعبیه نشده بود. لذا تصمیم گرفتم کد را اول برانم بعد مواردی که سابقهٔ ویرایش بالا داشته‌اند را دستی بررسی کنم. الان مشغول نوشتم پرسمان‌های مناسب هستم — حجت/بحث ‏۲۶ مارس ۲۰۱۷، ساعت ۱۷:۵۴ (UTC)[پاسخ]
من پرسمان ۱۷٬۶۱۴ را ایجاد کردم که در تمام صفحه‌های قناتی که ربات من ویرایش کرده جستجو می‌کند، صفحه‌هایی که پیش از آن توسط کاربر ثبت‌نام کردهٔ دیگری ویرایش غیر جزئی شده‌اند را پیدا می‌کند، آخرین نسخهٔ صفحه را (تا پیش از نسخه‌ای که ربات من ویرایش کرده) پیدا می‌کند، و حجم آن نسخه را به همراه شمارهٔ نسخه نشان می‌دهد. بررسی من نشان می‌دهد که آن چند موردی که شما دو نفر و کاربر:4nn1l2 دستی واگردانی کرده‌اید و سرشناس دانسته‌اید، همگی حجمشان بالای ۹۰۰۰ بایت بود. از سوی دیگر، توجه کنید که صفحهٔ خام قنات (بدون هیچ ویرایش) که توسط JYBot ایجاد شده بود حدود ۲۰۰۰ بایت است پس بررسی مواردی که نزدیک همین اندازه باقی مانده‌اند مفید نیست (چون مقاله رشد نداشته، که یعنی احتمالاً سرشناس نیست). لذا من هر چه بالای ۳۰۰۰ بایت بود را دستی بررسی می‌کنم و این کار را مرتباً تکرار می‌کنم تا زمانی که این پروژه به اتمام برسد.
برای مثال، الان که پرسمان را اجرا کردم، فقط چهار مورد برای بررسی پیدا شد:
لذا تا اینجا خطاهای ربات فقط همان چند صفحه‌ای است که شما سه نفر اصلاح کردید — حجت/بحث ‏۲۶ مارس ۲۰۱۷، ساعت ۱۸:۳۹ (UTC)[پاسخ]

پیشرفت کار

[ویرایش]

به دلیل مشغولیت‌ها کمی پیشرفت کار کند شد که البته چیز بدی نیست (همه نگران بودند مبادا چنان تند شود که تعداد مقالات سقوط آزاد کند؛ کند شدنش کسی را نباید برنجاند!). به هر تقدیر در زیر یک فهرست از استان‌ها می‌گذارم و مواردی که کامل شده را مشخص می‌کنم. — حجت/بحث ‏۱۱ ژوئن ۲۰۱۷، ساعت ۲۰:۰۹ (UTC)[پاسخ]

همچنین ببینید: بخش‌ها
استان کامل شد؟
استان آذربایجان شرقی آری
استان کرمان آری
استان گیلان آری
استان زنجان آری
استان خراسان رضوی آری
استان قزوین آری
استان کردستان آری
استان اردبیل آری
استان تهران آری
استان هرمزگان آری
استان مرکزی آری
استان مازندران آری
استان کرمانشاه آری
استان قم آری
استان بوشهر آری
استان خراسان جنوبی آری
استان آذربایجان غربی آری
استان ایلام آری
استان کهگیلویه و بویراحمد آری
استان چهارمحال و بختیاری آری
استان یزد آری
استان فارس آری
استان سمنان آری
استان گلستان آری
استان اصفهان آری
استان خراسان شمالی آری
استان همدان آری
استان لرستان آری
استان خوزستان آری
استان سیستان و بلوچستان آری
@Huji: به نظر میرسد هنوز تمام نشده است، رده:مقاله‌های خرد قنات را بنگرید.--SunfyreT ‏۲۱ مارس ۲۰۱۸، ساعت ۱۷:۵۵ (UTC)[پاسخ]
@Sunfyre: بله هنوز تمامِ تمام نشده؛ این‌ها قنات‌هایی هستند که اسم شهرستانشان اشتباه بوده و من در کار رباتم کلی وقت صرف کردم اسم شهرستان‌ها را در حد امکان اصلاح کردم. این صفحه‌ها را باید حذف کنم که هنوز وقت نشده.— حجت/بحث ‏۲۱ مارس ۲۰۱۸، ساعت ۱۸:۲۰ (UTC)[پاسخ]

درخواست حذف صفحه‌های بحث

[ویرایش]

@Huji: سلام. من دستی و با کمک وخ مشغول تمیزکاری صفحه‌هایی هستم که خود صفحه و بحثش ساز مخالف می‌زنند. بخشی از اینها مربوط به نوشتارهای قنات‌هایی هستند که تبدیل به تغییرمسیر شده‌اند اما صفحهٔ بحث‌شان همچنان وجود دارد. از این فهرست ۹هزارتایی (مرتب شده بر اساس حجم صفحهٔ بحث) ۴تای اول مطالب نامرتبط در صفحهٔ بحث‌شان دارند و بقیه فقط شامل رتبه‌بندی رباتیک و الگوهای {{رتب}} و {{بصب}} (مربوط به نوشتار قدیم قنات) هستند. از دید من اینها همه باید حذف شوند. اگر موافقید یا حذف‌شان کنید یا بگویید من با وخ صفحه‌ها را خالی کنم. اگر هم مخالفید لطفاً دلیل خود را بگویید. ممنون. Saeidpourbabak (بحث) ‏۱۷ سپتامبر ۲۰۱۷، ساعت ۱۱:۴۰ (UTC)[پاسخ]

@Saeidpourbabak: با وخ انجامش بدهید — حجت/بحث ‏۱۷ سپتامبر ۲۰۱۷، ساعت ۱۵:۳۸ (UTC)[پاسخ]