ویکیپدیا:سیاست رباترانی/درخواست مجوز/HujiBot/وظیفه ۱۳
رباتران: Huji (بحث • مشارکتها • انتقالها • بسته شود • بستهشدنها • اختیارات • آمار • آمار پیشرفته)
خودکار، نیمهخودکار یا دستی: نیمهخودکار
کد ربات: https://github.com/PersianWikipedia/fawikibot/blob/master/hujibot_13.py
خلاصهٔ عملکرد: مقالههای قنات یک شهرستان را با هم ادغام میکند (بر اساس ویکیپدیا:نظرخواهی/ادغام مقالات رباتیک قناتها)
تناوب اجرا: یک بار
تخمین تعداد صفحههایی که ویرایش میشوند: نزدیک بیست هزار
گذر از الگوی {{nobots}} (بله/خیر): خیر
آیا در ویکی دیگری پرچم دارد (بله/خیر): خیر
شرح روش اجرا: نام یک ردهٔ مربوط به قناتهای شهرستان را به عنوان ورودی میگیرد (مثلاً رده:قناتهای شهرستان بیرجند). تمام صفحههای آن رده را میگیرد و به ترتیب الفبایی مرتبط میکند. محتوای صفحهها را میگیرد و با هم در یک صفحه بخشبندی شده ادغام میکند. خروجی آزمایشیاش شبیه به ویکیپدیا:سیاست رباترانی/درخواست مجوز/HujiBot/وظیفه ۱۳/آزمایشی خواهد بود. این متن را در صفحهٔ فهرست قناتهای آن شهرستان (مثلاً فهرست قنات های شهرستان بیرجند) میگذارد و ذخیره میکند. صفحههای قناتهای یادشده را هم تبدیل به تغییر مسیری به این فهرست میکند.
بحث
[ویرایش]کد اطمینان حاصل میکند که فهرست موجودی را رونویسی نکند. هر بار یک رده به آن داده میشود و نتیجه به صورت دستی کنترل میشود. احتیاط میشود که ردهها با فواصل زمانی کافی از این ربات گذرانده شوند تا تعداد کل مقالههای ویکیپدیا زیر ۵۰۰٫۰۰۰ نیفتد. — حجت/بحث ۱۳ ژانویهٔ ۲۰۱۷، ساعت ۲۰:۴۲ (UTC)
- حالا که دارید زحمت انجام این مورد را میکشید، لطفاً در جملهٔ «تعداد مالکان این قنات X نفر میباشد و اراضی تحت کشت این قنات X هکتار میباشد»، میباشد اول را به «هستند» و میباشد دوم را به «است» تغییر دهید. لطفاً فعلاً برای آزمایش، رده:قناتهای شهرستان بیرجند که مثال زدید را ادغام کنید.
- فهرست قناتهای هر شهرستان را هم خودتان میسازید؟ درفش کاویانی (بحث) ۱۳ ژانویهٔ ۲۰۱۷، ساعت ۲۲:۰۶ (UTC)
- تغییرش دادم تا هستند و است بنویسید. ربات خودش فهرست را میسازد (یا اگر از قبل موجود باشد و تغییرمسیر باشد، همان را استفاده میکند) — حجت/بحث ۱۳ ژانویهٔ ۲۰۱۷، ساعت ۲۳:۲۲ (UTC)
@Huji: انگار طبق صفحه آزمایشی که ارائه کردید قرار است تمام محتوا ادغام شود؟ اگر اینگونه است الگو:قناتهای شهرستان بیرجند تعداد زیاد است و حجم فهرست زیاد میشود! الان ۹۵۴ مقاله در ردهای که ارائه کردهاید وجود دارد و حجم صفحه آزمایشی که ارائه کردید بدون منبع ۳۰۰۰ بایت است یعنی با ادغام محتوای ۹۵۴ مقاله در یک مقاله حجم فهرست ۱۴۳۱ کیلوبایت! یا به عبارتی ۱.۴ مگابایت میشود. اگر طبق این روش بخواهید محتوا را نیز ادغام کنید بر پایه وپ:تفکیک حجم مقاله نباید بیش از ۴۰ کیلوبایت شود، هرچند ادغام به این صورت جالب نیست و خواننده با متنهای تکراری روبرو میشود!
بهتر است به صورت جدولی که اول نظرخواهی بود ادغام شود، فرضا هم اگر تعداد قنات شهرستانی خیلی کم بود آن را به فهرست استان ارتقا میدهیم. (همانند فهرست_قناتهای_استان_اصفهان) مثل جدول زیر:
قنات | بخش | روستا | طول قنات (متر) | تعداد میله چاه | عمق مادر چاه | دبی (لیتر بر ثانیه) | سطح زیر کشت (هکتار) |
آوازک | بخش مرکزی شهرستان بیرجند | ساقی | ۳۰۰ | ۱۰ | ۱۲ | ۲ | ۳ |
آغلدر | بخش مرکزی شهرستان بیرجند | آغلدر | ۶۰۰ | ۲۰ | ۲۰ | ۳ | ۱۰ |
--آرمانب ۱۴ ژانویهٔ ۲۰۱۷، ساعت ۱۵:۲۱ (UTC)
- @Sunfyre: حق با شماست. برای ساختن آن جدول هم نیازی نیست که مقالههای موجود را از کد بگذارنم، جدول اصلی از منابعی نظیر http://www.iranhydrology.net/qanat/qanatlist.asp?cmd=reset قابل دسترسی است؛ همان را برای جدول سازی به کار میبرم و بعد مقالهها را تغییرمسیر میکنم — حجت/بحث ۱۴ ژانویهٔ ۲۰۱۷، ساعت ۱۹:۳۲ (UTC)
- @Huji: ایجاد جدول مشابه اینجا کپیرایت را زیر سوال میبرد. نمیتوانید آن را در ویکی کپیپیست کنید هرچند که تغییرات جزئی روی آن انجام دهید.یاماها۵ / ب ۱۵ ژانویهٔ ۲۰۱۷، ساعت ۱۰:۴۶ (UTC)
- شاید بتوان با نویسنده مکاتبه کرد و مجوز گرفت، البته پایین صفحه نوشته است «اطلاعات اين بانک بر اساس امار وزارت جهاد کشاورزي تهيه شده است.» --آرمانب ۱۵ ژانویهٔ ۲۰۱۷، ساعت ۱۱:۲۲ (UTC)
- @Yamaha5: اطلاعات جدول حق تکثیر ندارد (چون از آمار وزارتخانه است، و تولیدات دولتی در مالکیت عمومی هستند) — حجت/بحث ۱۵ ژانویهٔ ۲۰۱۷، ساعت ۱۶:۲۴ (UTC)
- شاید بد نباشد en:Wikipedia:Public domain ترجمه شود.--آرمانب ۱۵ ژانویهٔ ۲۰۱۷، ساعت ۱۶:۵۷ (UTC)
- کارهای دولتی در ایران (مثل اکثر کشورهای جهان) حق نشر دارند ولی دادهها در کل حق نشر ندارند چون برای تهیه کردنشان فقط باید عرق ریخت و به خلاقیت نیاز نیست. کپیرایت حامی خلاقیت است. جداول اطلاعاتی کپیرایت ندارند. 4nn1l2 (بحث) ۱۵ ژانویهٔ ۲۰۱۷، ساعت ۱۷:۱۶ (UTC)
- چنین نیست! اداره هواشناسی در فرودگاه مهرآباد تشریف ببرید. دادههای هواشناسی ۲۰ سال گذشته شهرها را میفروشند و محل درآمد خوبی برای آنهاست. همچنین اطلاعات جغرافیایی را مسکن و شهرسازی میفروشد تا چند سال پیش فروش عکس هوایی شیراز در انحصار شهرداری بود خدا خیر گوگلمپ دهد که آن را از انحصار خارج کرد. در ایران همهٔ کارهای دولتی کپیرایت دارند مگر آنکه ذکر کنند ندارد. در en:Wikipedia:Public domain هم نوشته با وجودی که ایران با آمریکا رابطه کپیرایت ندارد ولی برای احتیاط ویکیپدیا فقط آثار آزاد را بازنشر میکند.یاماها۵ / ب ۱۵ ژانویهٔ ۲۰۱۷، ساعت ۲۱:۵۹ (UTC)
- @Yamaha5: در اشتباهید! در ایالات متحده هم اطلاعات هواشناسی و هوانوردی و امثال آن که دولتی (و فاقد حق تکثیر است) فروخته میشود. این که چیزی حق تکثیر نداشته باشد، با این که رایگان باشد، فرق دارد. همان بحث دو مفهوم free در انگلیسی است که اغلب اشتباه میکنند: free to use و free of charge. آن سازمانها پول میگیرند چون برای کارشان به قول کاربر:4nn1l2 عرق ریختهاند. شما میتوانید هر دادهٔ بدون حق تکثیری را به شکلی کاربردیتر در بیاورد و آن شکل جدید را بفروشید؛ کسی جلودار شما نیست. اما اصل داده کماکان بدون حق تکثیر است. — حجت/بحث ۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۱:۳۲ (UTC)
- من دادههای گذشته را گفتم نه آینده. سیاههٔ هواشناسی را آمریکا را مجانی در اختیار میگذارد مانند این ولی ایران نهایتاً تا چند ماه اخیر و بقیهٔ سالها را باید خریداری کنید. چون در ایران جزئیات کپیرایت زیاد باز نشدهاست مسلما اگر جلوی آن اداره همان دیتا را بفروشید کسی به شما کاری نخواهد داشت. یاماها۵ / ب ۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۶:۵۳ (UTC)
- @Yamaha5: بله من هم دادههای گذشته را گفتم! اگر دادههای گذشته را در حجم بزرگ بخواهید باید پول بدهید از دولت آمریکا بخرید! اما وقتی خریدید چون حق تکثیر ندارد میتوانید خودتان رایگان (یا غیر رایگان) اقدام به فروش آن کنید. — حجت/بحث ۱۶ ژانویهٔ ۲۰۱۷، ساعت ۲۱:۵۱ (UTC)
- من دادههای گذشته را گفتم نه آینده. سیاههٔ هواشناسی را آمریکا را مجانی در اختیار میگذارد مانند این ولی ایران نهایتاً تا چند ماه اخیر و بقیهٔ سالها را باید خریداری کنید. چون در ایران جزئیات کپیرایت زیاد باز نشدهاست مسلما اگر جلوی آن اداره همان دیتا را بفروشید کسی به شما کاری نخواهد داشت. یاماها۵ / ب ۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۶:۵۳ (UTC)
- @Yamaha5: در اشتباهید! در ایالات متحده هم اطلاعات هواشناسی و هوانوردی و امثال آن که دولتی (و فاقد حق تکثیر است) فروخته میشود. این که چیزی حق تکثیر نداشته باشد، با این که رایگان باشد، فرق دارد. همان بحث دو مفهوم free در انگلیسی است که اغلب اشتباه میکنند: free to use و free of charge. آن سازمانها پول میگیرند چون برای کارشان به قول کاربر:4nn1l2 عرق ریختهاند. شما میتوانید هر دادهٔ بدون حق تکثیری را به شکلی کاربردیتر در بیاورد و آن شکل جدید را بفروشید؛ کسی جلودار شما نیست. اما اصل داده کماکان بدون حق تکثیر است. — حجت/بحث ۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۱:۳۲ (UTC)
- چنین نیست! اداره هواشناسی در فرودگاه مهرآباد تشریف ببرید. دادههای هواشناسی ۲۰ سال گذشته شهرها را میفروشند و محل درآمد خوبی برای آنهاست. همچنین اطلاعات جغرافیایی را مسکن و شهرسازی میفروشد تا چند سال پیش فروش عکس هوایی شیراز در انحصار شهرداری بود خدا خیر گوگلمپ دهد که آن را از انحصار خارج کرد. در ایران همهٔ کارهای دولتی کپیرایت دارند مگر آنکه ذکر کنند ندارد. در en:Wikipedia:Public domain هم نوشته با وجودی که ایران با آمریکا رابطه کپیرایت ندارد ولی برای احتیاط ویکیپدیا فقط آثار آزاد را بازنشر میکند.یاماها۵ / ب ۱۵ ژانویهٔ ۲۰۱۷، ساعت ۲۱:۵۹ (UTC)
- @Huji: ایجاد جدول مشابه اینجا کپیرایت را زیر سوال میبرد. نمیتوانید آن را در ویکی کپیپیست کنید هرچند که تغییرات جزئی روی آن انجام دهید.یاماها۵ / ب ۱۵ ژانویهٔ ۲۰۱۷، ساعت ۱۰:۴۶ (UTC)
@Darafsh و Yamaha5: کد را بیشتر جلو بردم؛ خروجی میشود شبیه ویکیپدیا:سیاست رباترانی/درخواست مجوز/HujiBot/وظیفه ۱۳/آزمایشی (به روزش کردم). توجه کنید که در دادهٔ اصلی هم واقعاً اسم بخش برای آن مثالها «نامعلوم» ذکر شده (مثلاً این را ببینید).
نظرتان چیست؟ آیا مقالهسازی را انجام بدهم؟ زیر ۲۰۰ مقاله ساخته خواهد شد (کلاً ۱۹۴ بخش در این داده آمدهاست) — حجت/بحث ۱۵ ژانویهٔ ۲۰۱۷، ساعت ۱۹:۳۰ (UTC)
همچنین به ربات یاد دادم که ردههای لازم برای شهرستان و استان را هم بسازد. — حجت/بحث ۱۵ ژانویهٔ ۲۰۱۷، ساعت ۲۰:۲۹ (UTC)
- لطفا صبر کنید تا تکلیف کپیرایت مشخص شود یاماها۵ / ب ۱۵ ژانویهٔ ۲۰۱۷، ساعت ۲۲:۰۱ (UTC)
- @Yamaha5: لطفاً برای تعیین تکلیف راه حل ارائه کنید. صبر کردن خالی فایده ندارد.
- توجه داشته باشید که یا من درست میگویم و داده حق تکثیر ندارد، که در آن صورت این جداول را میسازیم. یا اشتباه میکنم و داده حق تکثیر دارد که در آن صورت تمام آن مقالهها ناقض حق تکثیر هستند و باید حذف شوند (چون بر اساس دادهٔ حق تکثیر دار ساخته شده بودند). در هر دو حالت آن صفحهها حذف یا تغییرمسیر خواهند شد. — حجت/بحث ۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۱:۲۶ (UTC)
- همچنین اگر فرض شما درست باشد و آمار دولتی ایران حق تکثیر داشته باشد باید تمام مقالههای روستاها را هم حذف سریع کنیم چون ناقض حق تکثیر خواهند بود. — حجت/بحث ۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۱:۴۷ (UTC)
- شما میخواهید جدول تولید کنید من تکلیف روشن کنم! حجت عزیز خود آمار در صورتی که به فرمت آن سایت باشد (جدول) حق تکثیر دارد چون کپیپیست از آنجا میشود. در صورتی که به صورت متنی باشد ندارد. این قضیه در مقالات علمی هم وجود دارد شما زمانی که یک پاراگراف از یک مقاله را میخواهید استفاده کنید حق ندارید آن را کپیپیست کنید (هرچند که به آن مقاله ارجاع دادید) باید بازنویسی کنید و به آن مقاله ارجاع دهید و اگر یکی از این دو مورد انجام نشود دزدی علمی روی داده. با کمی جستجو در وب متوجه سخن من میشویدیاماها۵ / ب ۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۶:۳۹ (UTC)
- @Yamaha5: گفتید «آمار در صورتی که به فرمت آن سایت باشد (جدول) حق تکثیر دارد». این هم به نظر من اشتباه است. اگر دادهها در اصل حق تکثیر نداشته باشند، آن چه در آن وبسایت آمده هم قسمتیاش که افزون بر دادهها و ناشی از کار خلاق صاحب سایت باشد حق تکثیر دارد، اما خود دادهها در آن سایت هم حق تکثیر ندارند. مثل این است که من یک اثر نقاشی را که حق تکثیر ندارد ببرم در سایت خودم بگذارم پایینش بنویسم حق تکثیر فلانی. این کار باعث نمیشود که آن اثر حق تکثیر داشته باشد؛ صرفاً باعث میشود که من صاحب سایت حق تکثیر را نقض کرده باشم و چیزی که حق تکثیر ندارد را به نادرست صاحب حق تکثیر جا زده باشم! قانوناً میشود از من شکایت کرد به خاطر انحصارطلبی غیر قانونی. — حجت/بحث ۱۶ ژانویهٔ ۲۰۱۷، ساعت ۲۱:۵۳ (UTC)
- درست است، یا دادهها حق تکثیر دارند که باید تمام مقالات قناتها حذف سریع شوند (این کار بنظر راحتتر و سریعتر است) یا دادهها حق تکثیر ندارند که باید طبق اجماع اجتماع تغییر مسیر و ادغام شوند، یک بام و دو هوا که نمیشود، جالب است در ویکیپدیا:سیاست رباترانی/درخواست مجوز/JYBot/وظیفه ۲۸ این بحثها نبوده است!--آرمانب ۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۴:۰۳ (UTC)
- @Yamaha5: گفتید «...اگر یکی از این دو مورد انجام نشود دزدی علمی روی داده». باز مفاهیم را قاطی کردید. سرقت علمی ربطی به حق تکثیر ندارد. اگر کسی مطلبش را در مجلهای که حق تکثیر ندارد (مثل پلاس وان که تمام مقالاتش مجوز عامه خلاق دارند) چاپ کند شما میتوانید عیناً متن را کپی کنید و هیچ حق تکثیری هم نقض نمیشود! اما وقتی بگویید که «این از اول فکر خودم بود»، بدون نقض حق تکثیر، مرتکب دزدی علمی میشوید. این ها دو چیز مختلف هستند. — حجت/بحث ۱۶ ژانویهٔ ۲۰۱۷، ساعت ۲۱:۵۷ (UTC)
- قبلا هم خدمتتان گفتم اگر دادهها به صورت جدول باشد حق تکثیر دارد اگر به متن تبدیل شود مشکلی نیست یاماها۵ / ب ۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۶:۱۸ (UTC)
- @Yamaha5: این دیگر از آن حرفها بود! فرق داده جدولی و غیر جدولی، فقط در نحوهٔ ارائهاش است. اگر حرف شما درست باشد، یعنی داده خودش حق تکثیر ندارد (اگر نه به صورت غیر جدولی هم نمیشد ارائهاش کرد)، بلکه نحوهٔ ارائهاش حق تکثیر دارد. اما نحوهٔ ارائه به صورت جدول، یک کار خلاق نیست در نتیجه جدول خودش حق تکثیر ندارد. توجه کنید که حق تکثیر مربوط به کارهای خلاق است. مثلاً اگر ارائه به صورت یک اطلاعنگاشت بود میشد گفت که طراحیاش خلاقیت برده و در نتیجه این «نحوهٔ ارائه» حق تکثیر دارد. اما آثاری که ایجادش خلاقیت خاصی ندارند، حق تکثیر هم ندارند. مثالش لوگوی شرکت مایکروسافت که همچنان که در File:Microsoft logo (2012).svg میبینید، چون فقط از حروف و خطوط صاف و رنگهای ساده تشکیل شده و کشیدنش خلاقیت نمیخواهد، در نتیجه حق تکثیر ندارد! احتمالاً تا قبل از خواندن این جمله تصور این را نمیکردید که نشان یک شرکت مثل مایکروسافت حق تکثیر نداشته باشد!
- من این بحث را چنین جمعبندی میکنم که تنها کسی که مشکل حقتکثیری دارد، شما هستید که مشکلاتی که مطرح میکنید هم نه اساس قانونی دارند (سند قانونی ندارید نشان بدهید که «فقط جدول» حق تکثیر دارد) نه با مفاهیم قوانین حق تکثیر سازگارند. در نتیجه بحث بیشتر روی حق تکثیر را لازم نمیبینم.
- @Ladsgroup، Ebrahim و Darafsh: مجوز ویرایش آزمایشی برای رباتم در اینجا میخواهم. — حجت/بحث ۱۶ ژانویهٔ ۲۰۱۷، ساعت ۲۱:۴۹ (UTC)
- شما میخواهید جدول تولید کنید من تکلیف روشن کنم! حجت عزیز خود آمار در صورتی که به فرمت آن سایت باشد (جدول) حق تکثیر دارد چون کپیپیست از آنجا میشود. در صورتی که به صورت متنی باشد ندارد. این قضیه در مقالات علمی هم وجود دارد شما زمانی که یک پاراگراف از یک مقاله را میخواهید استفاده کنید حق ندارید آن را کپیپیست کنید (هرچند که به آن مقاله ارجاع دادید) باید بازنویسی کنید و به آن مقاله ارجاع دهید و اگر یکی از این دو مورد انجام نشود دزدی علمی روی داده. با کمی جستجو در وب متوجه سخن من میشویدیاماها۵ / ب ۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۶:۳۹ (UTC)
- سخن آخر برای علاقهمندان: این را تماشا کنید. خواهید دید که «دادههای تحقیقاتی» (research data) دست کم در آمریکا، حق تکثیر ندارند! نمایش آنها به شکلی خلاقانه میتواند حق تکثیر داشته باشد اما دادههایی که در آن به کار رفتهاند کماکان حق تکثیر ندارند.
- بدیهی است که قوانین ایران میتواند متفاوت باشد و ویکیمدیا اگر چه بر اساس قوانین ایالات متحده اداره میشود (که در آن دادههای تحقیقاتی و نیز تولیدات دولتی فاقد حق تکثیرند) اما ترجیح میدهد که قوانین محلی هم رعایت شوند. اما یک چیز بدیهی است: یا «داده»های دولتی ایرانی حق تکثیر دارند یا نه. اگر بله، باید تمام مقالههای مبتنی بر آن (از جمله مقالههای مبتنی بر دادههای قنات، دادههای سرشماری، و ...) به خاطر نقض حق تکثیر حذف شوند. اگر نه، بحث بالا لازم نبود و از اول میشد جدولها را ساخت — حجت/بحث ۱۶ ژانویهٔ ۲۰۱۷، ساعت ۲۲:۰۵ (UTC)
@Ladsgroup: درود؛ لطفا به عنوان عضوی از گمر که در این موضوع تعارض منافع ندارد این بحث را جمعبندی کنید؛ اختلاف این است که یاماها۵ میگوید نمیتوان از دادههای وزارت کشاورزی بدلیل کپی رایت استفاده کرد، من و حجت و فور معتقدیم میتوان استفاده کرد و نقض کپی رایت نیست. (بحثهای بالا را مطالعه کنید)--آرمانب ۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۷:۳۹ (UTC)
سلام.
- تعداد کل نوشتارهای قناتها زیر ۱۴هزارتاست. هر کار هم بکنید زیر ۵۰۰هزار نخواهیم رفت.
- برای مستثنی کردن آنها که سرشناسند چه فکری شده؟ فهرستی از قناتهایی که ویرایشی غیرربات در تاریخچه دارند به ترتیب حجم اینجا فهرست شده. البته نه حجم و نه داشتن ویرایش برای سرشناسی کافی نیست، ولی بهتر است چندده تای اول فهرست بررسی شوند. Saeidpourbabak (بحث) ۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۰:۴۱ (UTC)
- @Saeidpourbabak: باید ویرایشهای خود کاربر:جواد را هم نادیده بگیرید چون معمولاً برای رفع اشتباهات رباتش بوده. نتیجه میشود نزدیک هفتصد صفحه که من دستی چک میکنم — حجت/بحث ۱۶ ژانویهٔ ۲۰۱۷، ساعت ۰۱:۳۰ (UTC)
از من خواسته شده که نظر دهم. توضیح به نظر ضروری میرسد که حجت از خود وبسایت کپی پیست نمیکند. بلکه از دادههای آن استفاده میکند. و دانستن این نکته برای همه رباترانان ضروری است که طبق قوانین حقتکثیر در آمریکا داده (نه فقط داده تحقیقاتی) را نمیتوان کپیرایت کرد (به همین دلیل است ویکیداده با لایسنس CC0 = مالکیت عمومی منتشر میکند.) در صورتی که اتحادیه اروپا دادهها را کپیرایت میکند (تحت عنوان قانونی با نام Directive 96/9/EC of the European Parliament and of the Council of 11 March 1996 on the legal protection of databases) و بسیاری از چپترها در حال جنگ هستند تا این قانون را ملغا کنند. به هر صورت، برای ایران بند یازدهم از ماده دوم قانون حقتکثیر دادهها را در صورت داشتن «جنبه ابتکاری» دارای حقتکثیر میکند که با توجه به وضعیت اسفبار حقتکثیر در ایران و عضو نبودن در کنسواسیون برن به نظرم چنین چیزی سختگیری بیمورد خواهد بود.
از بحث حقتکثیر بگذریم. به عنوان گمر به نظرم تنها روند منطقی این است که جدول بسازیم یا در مقالات روستاها ادغام شوند (و فهرستی ساده از آنها برای هر شهرستان هم داشتهباشیم) :)
امیرΣυζήτηση ۱۷ ژانویهٔ ۲۰۱۷، ساعت ۰۲:۲۵ (UTC)
- @Ladsgroup: ممنون؛ برداشت من از «جدول بسازیم» این بود که به این درخواست مجوز دادید.--آرمانب ۱۷ ژانویهٔ ۲۰۱۷، ساعت ۰۸:۵۹ (UTC)
- من چه کنم؟ مجوز دارم؟ آزمایشی برانم؟ بیخیال شوم؟ — حجت/بحث ۱۸ ژانویهٔ ۲۰۱۷، ساعت ۱۶:۵۲ (UTC)
- @Huji: لطفاً فعلاً برای آزمایش، رده:قناتهای شهرستان بیرجند که مثال زدید را ادغام کنید. درفش کاویانی (بحث) ۱۸ ژانویهٔ ۲۰۱۷، ساعت ۱۸:۰۲ (UTC)
- @Darafsh: سپاس از شما. فهرست قناتهای شهرستان بیرجند را ساختم و در این پروسه چند ایراد املایی در جدول اصلی را هم شناسایی و رفع کردم. کلاً همه صفحهها را دستی چک میکنم و اگر ایراد داشته باشد رفع میکنم. — حجت/بحث ۱۹ ژانویهٔ ۲۰۱۷، ساعت ۱۷:۵۶ (UTC)
- امکانش هست به روستاها و بخشها هم لینک داشته باشد؟ 4nn1l2 (بحث) ۱۹ ژانویهٔ ۲۰۱۷، ساعت ۱۸:۰۳ (UTC)
- @4nn1l2: پیوند به روستاها نه؛ چون نامگذاری روستاهای این فهرست کاملاً با نامگذاری روستاها در ویکیپدیا (و منابعی که ویکیپدیا از آن گرفته) سازگار نیست. اما در مورد بخشهای شهرستان میزان مطابقت بالاتر است. اتفاقاً دارم همین الان کد را تغییر میدهم که پیوند بکند — حجت/بحث ۱۹ ژانویهٔ ۲۰۱۷، ساعت ۱۸:۱۲ (UTC)
- @4nn1l2: نتیجه باز هم دلخواه من نبود. این داده میگوید که شهرستان بیرجند بخشی به نام درمیان دارد (پیوند) در حالی که در تقسیمبندی کشوری که در ویکی داریم، شهرستان درمیان خودش یک شهرستان مستقل از بیرجند است، و شهرستان بیرجند فقط دو بخش مرکزی و خوسف دارد.
- ربات قبلی که جواد رانده بود احتمالاً این اشکالات برای ورودیاش به طور دستی رفع شده بود چنان که قنات آویشک بالا در شهرستان درمیان طبقهبندی کرده، نه در شهرستان بیرجند.
- با این حال معلوم نیست که کار ربات قبلی هم درست باشد. دادهای که ما الان داریم همان است که آن ربات داشته و این داده میگوید آن قنات در شهرستان بیرجند است.
- نظر شما چیست؟ — حجت/بحث ۱۹ ژانویهٔ ۲۰۱۷، ساعت ۱۸:۱۹ (UTC)
- برای قضاوت بهتر، ویکیپدیا:سیاست رباترانی/درخواست مجوز/HujiBot/وظیفه ۱۳/بخشها را بر اساس دادههای قنات ایجاد کردم. همچنان که میبینید در سطح شهرستان کمابیش سازگار است اما در سطح بخش، وضع خراب است. نظرتان چیست؟ — حجت/بحث ۱۹ ژانویهٔ ۲۰۱۷، ساعت ۱۸:۵۴ (UTC)
- سلام. علت داستان درمیان این است که اطلاعات جدول مربوط به پیش از سال ۸۴ است که هنوز بخش درمیان به شهرستان درمیان ارتقاء پیدا نکرده بود.
- در مورد ویکیپدیا:سیاست رباترانی/درخواست مجوز/HujiBot/وظیفه ۱۳/بخشها، نامگذاری بخشها (بجز بخشهای مرکزی) بدون نام شهرستان است. بنابراین بخش کوهساران شهرستان راور میشود بخش کوهساران. البته باز برای بخشهایی که پرانتزِ ابهامزدایی دارند باز به مشکل خواهید خورد، چرا که مثلاً بخش فیروزآباد (اگر قناتی داشته باشد) صفحهٔ ابهامزدایی است و باید اسم شهرستان توی پرانتز بیاید (بخش فیروزآباد (سلسله) یا بخش فیروزآباد (کرمانشاه)).
- ضمناً در ستون اول «استان» باید به همهٔ پیوندها اضافه شود (کرمان > استان کرمان).
- Saeidpourbabak (بحث) ۱۹ ژانویهٔ ۲۰۱۷، ساعت ۱۹:۱۶ (UTC)
- امکانش هست به روستاها و بخشها هم لینک داشته باشد؟ 4nn1l2 (بحث) ۱۹ ژانویهٔ ۲۰۱۷، ساعت ۱۸:۰۳ (UTC)
- @Darafsh: سپاس از شما. فهرست قناتهای شهرستان بیرجند را ساختم و در این پروسه چند ایراد املایی در جدول اصلی را هم شناسایی و رفع کردم. کلاً همه صفحهها را دستی چک میکنم و اگر ایراد داشته باشد رفع میکنم. — حجت/بحث ۱۹ ژانویهٔ ۲۰۱۷، ساعت ۱۷:۵۶ (UTC)
- @Huji: لطفاً فعلاً برای آزمایش، رده:قناتهای شهرستان بیرجند که مثال زدید را ادغام کنید. درفش کاویانی (بحث) ۱۸ ژانویهٔ ۲۰۱۷، ساعت ۱۸:۰۲ (UTC)
- (تعارض ویرایشی) به نظرم شما جداول را بر اساس دادههای اصلی به صورت لینکدار ایجاد کنید، کاربران هر شهرستان خودشان بهمرور زمان اطلاعات را بهروز خواهند کرد مثلاً ویژه:مشارکتها/Msoltankhushab را ببینید. مقالههای کاربر:جواد هم همگی بهروز نبودند و از این لحاظ یکدست نبودند.
- همچنین در ستون سوم اگر بتوانید از عبارت بخش فلانی شهرستان بهمان قسمت «شهرستان بهمان» را حذف کنید، احتمالاً پیوندهای آبی بیشتری به دست میآورید فقط فراموش نکنید که بخش مرکزی شهرستان بهمان را همینجوری نگه دارید. 4nn1l2 (بحث) ۱۹ ژانویهٔ ۲۰۱۷، ساعت ۱۹:۲۰ (UTC)
@4nn1l2: ممنون از توضیح. من پیوندها را به همان صورت بخش فلان شهرستان بهمان نگه میدارم. خودم دستی تمام تغییرمسیرها را ایجاد خواهم کرد. اینها تغییرمسیرهای به درد بخوری هستند. در مورد درمیان و سربیشه هم که شهرستان جدا شدهاند داده را دستی درست کردم. @Darafsh: با راهنماییهایی کاربر:4nn1l2 من فهرست قناتهای شهرستان بیرجند را باز به روز کردم. ربات حالا نتایج دلپذیری میدهد! اگر موافقید کار را ادامه بدهم — حجت/بحث ۱۹ ژانویهٔ ۲۰۱۷، ساعت ۱۹:۲۹ (UTC)
- مجوز دارد. با آرزوی موفقیت. درفش کاویانی (بحث) ۲۰ ژانویهٔ ۲۰۱۷، ساعت ۱۱:۰۸ (UTC)
استخراج داده
[ویرایش]برای مشاهدهٔ کد به اینجا مراجعه کنید.
حجم فعالیتها
[ویرایش]بعد از کلی تمیزکاری که روی فهرست قناتها انجام شد، تعداد قناتهای هر استان به شرح زیر است:
استان | قنات ها |
---|---|
آذربایجان شرقی | ۱۰۶۲ |
آذربایجان غربی | ۱۵۱ |
اردبیل | ۸۴ |
اصفهان | ۱۴۱۳ |
ایلام | ۴ |
بوشهر | ۳۹ |
تهران | ۲۱۹ |
چهارمحال و بختیاری | ۴۴۹ |
خراسان | ۸۷۶ |
خراسان جنوبی | ۳۰۷۸ |
خراسان رضوی | ۴۹۲۹ |
خراسان شمالی | ۴۲۱ |
خوزستان | ۱۱ |
زنجان | ۴۵۱ |
سمنان | ۷۱۵ |
سیستان و بلوچستان | ۹۶۵ |
فارس | ۱۰۱۶ |
قزوین | ۲۰۸ |
قم | ۶۴۰ |
کردستان | ۲۳۳ |
کرمان | ۹۰۱ |
کرمانشاه | ۱۹۶ |
کهگیلویه وبویراحمد | ۴۰ |
گلستان | ۲۸۵ |
گیلان | ۲ |
لرستان | ۷ |
مازندران | ۳۹ |
مرکزی | ۲۱۶۷ |
هرمزگان | ۱۲۹ |
همدان | ۱۳۳۱ |
یزد | ۲۹۰۷ |
فعلاً هشت استان (شامل سه خراسان، دو آذربایجان، اردبیل، یزد، گیلان) را راندم. این کار آمار مقالههای ویکیپدی را از ۵۳۱ هزار به ۵۲۵ هزار رساند. الباقی را دیرتر میرانم که سقوط خیلی ناگهانی نباشد. — حجت/بحث ۲۵ مارس ۲۰۱۷، ساعت ۲۱:۲۷ (UTC)
- تشکر. لطفاً برای صفحات بحث مقالهها هم تصمیمی گرفته شود: بحث:قنات دیواندر، خوشاب. 4nn1l2 (بحث) ۲۶ مارس ۲۰۱۷، ساعت ۰۸:۲۰ (UTC)
- @4nn1l2: حتماً. یک سری از مقالهها هم تغییر مسیر نشد (احتمالاً به دلیل تفاوتهای کوچک املایی در نامی که در جدول من هست با آنچه در زمان ایجاد به کار رفته) که اینها را هم باید درست کنم. هر دو در دستور کارند — حجت/بحث ۲۶ مارس ۲۰۱۷، ساعت ۱۴:۴۶ (UTC)
سلام. پیشتر درخواست کردم آنها که در تاریخچهشان ویرایش غیرربات دارند و حجیماند (و در نتیجه احتمال سرشناسیشان میرود) بررسی شوند. الان چندتای اول آن فهرست (مثلاً قنات بلده فردوس و کاریز زیبد) تغییرمسیر شده. بنده در مورد سرشناسی اینها نظری ندارم، فقط خواستم مطمئن شوم بررسی صورت گرفته. سپاس. Saeidpourbabak (بحث) ۲۶ مارس ۲۰۱۷، ساعت ۱۵:۰۱ (UTC)
- هر دو سرشناس بود.--آرمانب ۲۶ مارس ۲۰۱۷، ساعت ۱۵:۱۳ (UTC)
- @Sunfyre و Saeidpourbabak: بررسی در دست انجام است. راه سرراستی برای این که پیشاپیش این بررسی را انجام بدهم و از فهرست خارج کنم در کد تعبیه نشده بود. لذا تصمیم گرفتم کد را اول برانم بعد مواردی که سابقهٔ ویرایش بالا داشتهاند را دستی بررسی کنم. الان مشغول نوشتم پرسمانهای مناسب هستم — حجت/بحث ۲۶ مارس ۲۰۱۷، ساعت ۱۷:۵۴ (UTC)
- من پرسمان ۱۷٬۶۱۴ را ایجاد کردم که در تمام صفحههای قناتی که ربات من ویرایش کرده جستجو میکند، صفحههایی که پیش از آن توسط کاربر ثبتنام کردهٔ دیگری ویرایش غیر جزئی شدهاند را پیدا میکند، آخرین نسخهٔ صفحه را (تا پیش از نسخهای که ربات من ویرایش کرده) پیدا میکند، و حجم آن نسخه را به همراه شمارهٔ نسخه نشان میدهد. بررسی من نشان میدهد که آن چند موردی که شما دو نفر و کاربر:4nn1l2 دستی واگردانی کردهاید و سرشناس دانستهاید، همگی حجمشان بالای ۹۰۰۰ بایت بود. از سوی دیگر، توجه کنید که صفحهٔ خام قنات (بدون هیچ ویرایش) که توسط JYBot ایجاد شده بود حدود ۲۰۰۰ بایت است پس بررسی مواردی که نزدیک همین اندازه باقی ماندهاند مفید نیست (چون مقاله رشد نداشته، که یعنی احتمالاً سرشناس نیست). لذا من هر چه بالای ۳۰۰۰ بایت بود را دستی بررسی میکنم و این کار را مرتباً تکرار میکنم تا زمانی که این پروژه به اتمام برسد.
- برای مثال، الان که پرسمان را اجرا کردم، فقط چهار مورد برای بررسی پیدا شد:
- قنات رضویه، گناباد که میبینید فقط یک جعبه اطلاعات به آن افزوده شده وگر نه رشد دیگری نداشته
- قنات زیرجان سفلی، گناباد به همین شکل
- قنات رهن، گناباد که رشدش ناشی از افزودن مطالبی بوده که منبعشان ربطی به این قنات خاص ندارد (لذا سرشناسی این قنات خاص را اثبات نمیکند)
- قنات سمافات، نهبندان که رشدش ناشی از افزودن مطالب بدون منبع بوده
- لذا تا اینجا خطاهای ربات فقط همان چند صفحهای است که شما سه نفر اصلاح کردید — حجت/بحث ۲۶ مارس ۲۰۱۷، ساعت ۱۸:۳۹ (UTC)
پیشرفت کار
[ویرایش]به دلیل مشغولیتها کمی پیشرفت کار کند شد که البته چیز بدی نیست (همه نگران بودند مبادا چنان تند شود که تعداد مقالات سقوط آزاد کند؛ کند شدنش کسی را نباید برنجاند!). به هر تقدیر در زیر یک فهرست از استانها میگذارم و مواردی که کامل شده را مشخص میکنم. — حجت/بحث ۱۱ ژوئن ۲۰۱۷، ساعت ۲۰:۰۹ (UTC)
استان | کامل شد؟ |
---|---|
استان آذربایجان شرقی | آری |
استان کرمان | آری |
استان گیلان | آری |
استان زنجان | آری |
استان خراسان رضوی | آری |
استان قزوین | آری |
استان کردستان | آری |
استان اردبیل | آری |
استان تهران | آری |
استان هرمزگان | آری |
استان مرکزی | آری |
استان مازندران | آری |
استان کرمانشاه | آری |
استان قم | آری |
استان بوشهر | آری |
استان خراسان جنوبی | آری |
استان آذربایجان غربی | آری |
استان ایلام | آری |
استان کهگیلویه و بویراحمد | آری |
استان چهارمحال و بختیاری | آری |
استان یزد | آری |
استان فارس | آری |
استان سمنان | آری |
استان گلستان | آری |
استان اصفهان | آری |
استان خراسان شمالی | آری |
استان همدان | آری |
استان لرستان | آری |
استان خوزستان | آری |
استان سیستان و بلوچستان | آری |
- @Huji: به نظر میرسد هنوز تمام نشده است، رده:مقالههای خرد قنات را بنگرید.--SunfyreT ۲۱ مارس ۲۰۱۸، ساعت ۱۷:۵۵ (UTC)
- @Sunfyre: بله هنوز تمامِ تمام نشده؛ اینها قناتهایی هستند که اسم شهرستانشان اشتباه بوده و من در کار رباتم کلی وقت صرف کردم اسم شهرستانها را در حد امکان اصلاح کردم. این صفحهها را باید حذف کنم که هنوز وقت نشده.— حجت/بحث ۲۱ مارس ۲۰۱۸، ساعت ۱۸:۲۰ (UTC)
درخواست حذف صفحههای بحث
[ویرایش]@Huji: سلام. من دستی و با کمک وخ مشغول تمیزکاری صفحههایی هستم که خود صفحه و بحثش ساز مخالف میزنند. بخشی از اینها مربوط به نوشتارهای قناتهایی هستند که تبدیل به تغییرمسیر شدهاند اما صفحهٔ بحثشان همچنان وجود دارد. از این فهرست ۹هزارتایی (مرتب شده بر اساس حجم صفحهٔ بحث) ۴تای اول مطالب نامرتبط در صفحهٔ بحثشان دارند و بقیه فقط شامل رتبهبندی رباتیک و الگوهای {{رتب}} و {{بصب}} (مربوط به نوشتار قدیم قنات) هستند. از دید من اینها همه باید حذف شوند. اگر موافقید یا حذفشان کنید یا بگویید من با وخ صفحهها را خالی کنم. اگر هم مخالفید لطفاً دلیل خود را بگویید. ممنون. Saeidpourbabak (بحث) ۱۷ سپتامبر ۲۰۱۷، ساعت ۱۱:۴۰ (UTC)
- @Saeidpourbabak: با وخ انجامش بدهید — حجت/بحث ۱۷ سپتامبر ۲۰۱۷، ساعت ۱۵:۳۸ (UTC)