پرش به محتوا

داده‌کاوی

از ویکی‌پدیا، دانشنامهٔ آزاد

داده‌کاوی (به انگلیسی: Data Mining) به مفهوم استخراج اطلاعات نهان یا الگوها و روابط مشخص در حجم زیادی از داده‌ها در یک یا چند بانک اطلاعاتی بزرگ گفته می‌شود. بسیاری از مردم داده کاوی را مترادف واژه‌های رایج کشف دانش در پایگاه‌داده‌ها (به انگلیسی: knowledge discovery in databases) (اختصاری KDD) می‌دانند. داده‌کاوی، پایگاه‌ها و مجموعه حجیم داده‌ها را در پی کشف و استخراج، مورد تحلیل قرار می‌دهد. این‌گونه مطالعات و کاوش‌ها را به واقع می‌توان همان امتداد و استمرار دانش کهن و همه جا گیر آمار دانست. تفاوت عمده در مقیاس، وسعت و گوناگونی زمینه‌ها و کاربردها، و نیز ابعاد و اندازه‌های داده‌های امروزین است که شیوه‌های ماشینی مربوط به یادگیری، مدل‌سازی، و آموزش را طلب می‌نماید.

ویژگی‌ها

[ویرایش]

یکی از ویژگی‌های کلیدی در بسیاری از ابتکارات مربوط به تأمین امنیت ملی، داده کاوی است. داده کاوی که به عنوان ابزاری برای کشف جرایم، ارزیابی میزان ریسک و فروش محصولات به کار می‌رود، در بر گیرنده ابزارهای تجزیه و تحلیل اطلاعات به منظور کشف الگوهای معتبر و ناشناخته در بین انبوهی از داده هاست. داده کاوی غالباً در زمینه تأمین امنیت ملی به منزله ابزاری برای شناسایی فعالیت‌های افراد خرابکار شامل جابه جایی پول و ارتباطات بین آن‌ها و همچنین شناسایی و ردگیری خود آن‌ها با بررسی سوابق مربوط به مهاجرت و مسافرت هاست.

داده کاوی پیشرفت قابل ملاحظه‌ای را در نوع ابزارهای تحلیل موجود نشان می‌دهد اما محدودیت‌هایی نیز دارد. یکی از این محدودیت‌ها این است که با وجود اینکه به آشکارسازی الگوها و روابط کمک می‌کند اما اطلاعاتی را دربارهٔ ارزش یا میزان اهمیت آن‌ها به دست نمی‌دهد. دومین محدودیت آن این است که با وجود توانایی شناسایی روابط بین رفتارها یا متغیرها لزوماً قادر به کشف روابط علت و معلولی نیست. موفقیت داده کاوی در گرو بهره‌گیری از کارشناسان فنی و تحلیل گران کار آزموده‌ای است که از توانایی کافی برای طبقه‌بندی تحلیل‌ها و تغییر آن‌ها برخوردار هستند.

بهره‌برداری از داده کاوی در دو بخش دولتی و بخش خصوصی رو به گسترش است.[۱] صنایعی چون بانکداری، بیمه، بهداشت[۲] و بازاریابی آن را عموماً برای کاهش هزینه‌ها، ارتقاء کیفی پژوهش‌ها و بالاتر بردن میزان فروش به کار می‌برند. کاربرد اصلی داده کاوی در بخش دولتی به عنوان ابزاری برای تشخیص جرایم بوده‌است اما امروزه دامنه بهره‌برداری از آن گسترش روزافزونی یافته و سنجش و بهینه‌سازی برنامه‌ها را نیز در بر می‌گیرد. بررسی برخی از برنامه‌های کاربردی مربوط به داده کاوی که برای تأمین امنیت ملی به کار می‌روند، نشان دهنده رشد قابل ملاحظه‌ای در رابطه با کمیت و دامنه داده‌هایی است که باید تجزیه و تحلیل شوند.

توانایی‌های فنی در داده کاوی از اهمیت ویژه‌ای برخوردارند اما عوامل دیگری نیز مانند چگونگی پیاده‌سازی و نظارت ممکن است نتیجه کار را تحت تأثیر قرار دهند. یکی از این عوامل کیفیت داده‌ها است که بر میزان دقت و کامل بودن آن دلالت دارد. عامل دوم میزان سازگاری نرم‌افزار داده کاوی با بانک‌های اطلاعاتی است که از سوی شرکت‌های متفاوتی عرضه می‌شوند. عامل سومی که باید به آن اشاره کرد به بیراهه رفتن داده کاوی و بهره‌برداری از داده‌ها به منظوری است که در ابتدا با این نیت گردآوری نشده‌اند. حفظ حریم خصوصی افراد عامل دیگری است که باید به آن توجه داشت.

اصولاً به پرسش‌های زیر در زمینه داده کاوی باید پاسخ داده شود:

  • سازمان‌های دولتی تا چه حدی مجاز به بهره‌برداری از داده‌ها هستند؟
  • آیا از داده‌ها در چارچوبی غیر متعارف بهره‌برداری می‌شود؟
  • کدام قوانین حفظ حریم خصوصی ممکن است به داده کاوی مربوط شوند؟

کاوش در داده‌ها بخشی بزرگ از سامانه‌های هوشمند است. سامانه‌های هوشمند زیر شاخه‌ای بزرگ و پرکاربرد از زمینه علمی جدید و پهناور یادگیری ماشینی هستند که خود زمینه‌ای در هوش مصنوعی است. فرایند گروه گروه کردن مجموعه‌ای از اشیا فیزیکی یا مجرد به صورت طبقه‌هایی از اشیا مشابه هم را خوشه‌بندی می‌نامیم.

با توجه به اندازه‌های گوناگونِ (و در اغلب کاربردها بسیار بزرگ و پیچیده) مجموعه‌های داده‌ها، مقیاس‌پذیری الگوریتم‌های به کار رفته معیاری مهم در مفاهیم مربوط به کاوش در داده‌ها است.

کاوش‌های ماشینی در متون حالتی خاص از زمینهٔ عمومی‌تر کاوش در داده‌ها بوده و به آن دسته از کاوش‌ها گفته می‌شود که در آن‌ها داده‌های مورد مطالعه از جنس متون نوشته شده به زبان‌های طبیعی انسانی باشد.

چیستی

[ویرایش]

داده کاوی به بهره‌گیری از ابزارهای تجزیه و تحلیل داده‌ها به منظور کشف الگوها و روابط معتبری که تاکنون ناشناخته بوده‌اند گفته می‌شود. این ابزارها ممکن است مدل‌های آماری، الگوریتم‌های ریاضی و روش‌های یاد گیرنده (Machine Learning Methods) باشند که کار این خود را به صورت خودکار و بر اساس تجربه‌ای که از طریق شبکه‌های عصبی (Neural Networks) یا درخت‌های تصمیم‌گیری (Decision Trees) به دست می‌آورند بهبود می‌بخشد. داده کاوی منحصر به گردآوری و مدیریت داده‌ها نبوده و تجزیه و تحلیل اطلاعات و پیش‌بینی را نیز شامل می‌شود برنامه‌های کاربردی که با بررسی فایل‌های متن یا چند رسانه‌ای به کاوش داده‌ها می‌پردازند پارامترهای گوناگونی را در نظر می‌گیرد که عبارت اند از:

  • قواعد انجمنی (Association): الگوهایی که بر اساس آن یک رویداد به دیگری مربوط می‌شود مثلاً خرید قلم به خرید کاغذ.
  • ترتیب (Sequence): الگویی که به تجزیه و تحلیل توالی رویدادها پرداخته و مشخص می‌کند کدام رویداد، رویدادهای دیگری را در پی دارد مثلاً تولد یک نوزاد و خرید پوشک.
  • پیش‌بینی(Prediction): در پیش‌بینی هدف پیش‌بینی یک متغیر پیوسته می‌باشد. مانند پیش‌بینی نرخ ارز یا هزینه‌های درمانی.
  • رده‌بندی یا طبقه‌بندی (Classification): فرایندی برای پیدا کردن مدلی است که رده‌های موجود در داده‌ها را تعریف می‌نماید و متمایز می‌کند، با این هدف که بتوان از این مدل برای پیش‌بینی رده رکوردهایی که برچسب رده آن‌ها (متغیر هدف) ناشناخته می‌باشد، استفاده نمود.[۳] در حقیقت در رده‌بندی برخلاف پیش‌بینی، هدف پیش‌بینی مقدار یک متغیر گسسته‌است. روش‌های مورد استفاده در پیش‌بینی و رده‌بندی عموماً یکسان هستند.
  • خوشه‌بندی (Clustering): گروه‌بندی مجموعه‌ای از اعضاء، رکوردها یا اشیاء به نحوی که اعضای موجود در یک خوشه بیشترین شباهت را به یکدیگر و کمترین شباهت را به اعضای خوشه‌های دیگر داشته باشند.[۴]
  • مصورسازی (visualization): مصورسازی داده‌ها یکی از قدرتمندترین و جذابترین روش‌های اکتشاف در داده‌ها می‌باشد.[۵]

برنامه‌های کاربردی که در زمینه تجزیه و تحلیل اطلاعات به کار می‌روند از امکاناتی چون پرس و جوی ساخت یافته (Structured query) که در بسیاری از بانک‌های اطلاعاتی یافت می‌شود و از ابزارهای تجزیه و تحلیل آماری برخوردارند اما برنامه‌های مربوط به داده کاوی در عین برخورداری از این قابلیت‌ها از نظر نوع با آن‌ها تفاوت دارند. بسیاری از ابزارهای ساده برای تجزیه و تحلیل داده‌ها روشی بر پایه راستی آزمایی (verification) را به کار می‌برند که در آن فرضیه‌ای بسط داده شده آنگاه داده‌ها برای تأیید یا رد آن بررسی می‌شوند. به‌طور مثال ممکن است این نظریه مطرح شود که فردی که یک چکش خریده حتماً یک بسته میخ هم خواهد خرید. کارایی این روش به میزان خلاقیت کاربر برای ارائه فرضیه‌های متنوع و همچنین ساختار برنامه بکار رفته بستگی دارد. در مقابل در داده کاوی روش‌هایی برای کشف روابط بکار برده می‌شوند و به کمک الگوریتم‌هایی روابط چند بعدی بین داده‌ها تشخیص داده شده و آن‌هایی که یکتا (unique) یا رایج هستند شناسایی می‌شوند. به‌طور مثال در یک فروشگاه سخت‌افزار ممکن است بین خرید ابزار توسط مشتریان با تملک خانه شخصی یا نوع خودرو، سن، شغل، میزان درآمد یا فاصله محل اقامت آن‌ها با فروشگاه رابطه‌ای برقرار شود.

در نتیجه قابلیت‌های پیچیده‌اش برای موفقیت در تمرین داده کاوی دو مقدمه مهم است یکی فرمول واضحی از مشکل که قابل حل باشد و دیگری دسترسی به داده متناسب. بعضی از ناظران داده کاوی را مرحله‌ای در روند کشف دانش در پایگاه داده‌ها می‌دانند (KDD). مراحل دیگری در روند KDD به صورت تصاعدی شامل، پاکسازی داده، انتخاب داده انتقال داده، داده کاوی، الگوی ارزیابی، و عرضه دانش می‌باشد. بسیاری از پیشرفت‌ها در تکنولوژی و فرایندهای تجاری بر رشد علاقه‌مندی به داده کاوی در بخش‌های خصوصی و عمومی سهمی داشته‌اند. بعضی از این تغییرات شامل:

  • رشد شبکه‌های کامپیوتری که در ارتباط برقرار کردن پایگاه‌ها داده مورد استفاده قرار می‌گیرند.
  • توسعه افزایش تکنیکهایی بر پایه جستجو مثل شبکه‌های عصبی و الگوریتم‌های پیشرفته.
  • گسترش مدل محاسبه کلاینت سروری که به کاربران اجازه دسترسی به منابع داده‌های متمرکز شده را از روی دسک تاپ می‌دهد.
  • و افزایش توانایی به تلفیق داده از منابع غیر متجانس به یک منبع قابل جستجو می‌باشد.

علاوه بر پیشرفت ابزارهای مدیریت داده، افزایش قابلیت دسترسی به داده و کاهش نرخ نگهداری داده نقش ایفا می‌کند. در طول چند سال گذشته افزایش سریع جمع‌آوری و نگهداری حجم اطلاعات وجود داشته‌است. با پیشنهادهای برخی از ناظران مبنی بر آنکه کمیت داده‌های دنیا به‌طور تخمینی هر ساله دوبرابر می‌گردد. در همین زمان هزینه ذخیره‌سازی داده‌ها به‌طور قابل توجهی از دلار برای هر مگابایت به پنی برای مگابایت کاهش پیدا کرده‌است. در نتیجهً قدرت محاسبه‌ها در هر ۱۸ – ۲۴ ماه به دوبرابر ارتقاء پیدا کرده‌است این در حالی است که هزینه قدرت محاسبه رو به کاهش است. داده کاوی به‌طور معمول در دو حوزه خصوصی و عمومی افزایش پیدا کرده‌است. سازمان‌ها داده کاوی را به عنوان ابزاری برای بازدید اطلاعات مشتریان کاهش تقلب و اتلاف و کمک به تحقیقات پزشکی استفاده می‌کنند. با اینهمه ازدیاد داده کاوی به طبع بعضی از پیاده‌سازی و پیامد اشتباه را هم دارد. این‌ها شامل نگرانی‌هایی در مورد کیفیت داده‌ای که تحلیل می‌گردد، توانایی کار گروهی پایگاه‌های داده و نرم‌افزارها بین ارگان‌ها و تخطی‌های بالقوه به حریم شخصی می‌باشد. همچنین ملاحظاتی در مورد محدودیت‌هایی در داده کاوی در ارگان‌ها که کارشان تأثیر بر امنیت دارد، نادیده گرفته می‌شود.

مفهوم مدیریت ذخیره‌سازی و دستیابی اطلاعات

[ویرایش]

داده‌های اطلاعاتی به عنوان یکی از منابع حیاتی سازمان شناخته می‌شود و بسیاری از سازمان‌ها با اطلاعات و دانش سازمانی خود مانند سایر دارایی‌های ارزشمندشان برخورد می‌کنند.

نکته: داده اطلاعاتی به اطلاعات خام سازمان گفته می‌شود و اطلاعات به داده‌های پردازش شده. همچنین داده‌های پردازش شده پس از طبقه‌بندی و آنالیز به دانش سازمان تبدیل می‌گردند.

حال تصور نمایید، دسترسی به اطلاعات در شرایطی که داده‌ها به روش نامناسبی نگهداری شوند و یا روش ضابطه‌مندی جهت دستیابی به آن‌ها وجود نداشته باشد تا چه حد مشکل است. برای رسیدن به یک سیستم اطلاعاتی مناسب، داده‌ها می‌بایست به صورتی منطقی طبقه‌بندی و ذخیره شوند تا استفاده از آن‌ها ساده‌تر بوده، با کارایی بیشتری تحلیل شوند، سریعتر مورد استفاده قرار گیرند و در نتیجه مدیریت بهتری بر آن‌ها اعمال شود.

ساختار بانک اطلاعاتی سازمان

[ویرایش]

داده‌های سازمان‌ها در انواع بانک‌های اطلاعاتی و با ساختارهای متنوعی ذخیره می‌گردند. طراحی و سازماندهی این ساختارها، به‌کارگیری و انتقال به بانک‌های اطلاعاتی پیشرفته و بهینه سازی آن‌ها یکی از خدماتی است که توسط واحدهای فناوری اطلاعات ارائه می‌شود.

محدودیت‌های داده‌کاوی

[ویرایش]

درحالی‌که محصولات داده کاوی ابزارهای قدرتمندی می‌باشند، اما در نوع کاربردی کافی نیستند. برای کسب موفقیت، داده کاوی نیازمند تحلیل گران حرفه‌ای و متخصصان ماهری می‌باشد که بتوانند ترکیب خروجی به وجود آمده را تحلیل و تفسیر نمایند. در نتیجه محدودیت‌های داده کاوی مربوط به داده اولیه یا افراد است تا اینکه مربوط به تکنولوژی باشد.

اگرچه {داده کاوی} به الگوهای مشخص و روابط آن‌ها کمک می‌کند، اما برای کاربر اهمیت و ارزش این الگوها را بیان نمی‌کند. تصمیماتی از این قبیل بر عهده خود کاربر است. برای نمونه در ارزیابی صحت داده کاوی، برنامه کاربردی در تشخیص مظنونان تروریست طراحی شده که ممکن است این مدل به کمک اطلاعات موجود در مورد تروریستهای شناخته شده، آزمایش شود. با اینهمه درحالی‌که ممکن است اطلاعات شخص به‌طور معین دوباره تصدیق گردد، که این مورد به این منظور نیست که برنامه مظنونی را که رفتارش به‌طور خاص از مدل اصلی منحرف شده را تشخیص بدهد.

تشخیص رابطه بین رفتارها یا متغیرها یکی دیگر از محدودیت‌های داده کاوی می‌باشد که لزوماً روابط اتفاقی را تشخیص نمی‌دهد. برای مثال برنامه‌های کاربردی ممکن است الگوهای رفتاری را مشخص کند، مثل تمایل به خرید بلیط هواپیما درست قبل از حرکت که این موضوع به مشخصات درآمد، سطح تحصیلی و استفاده از اینترنت بستگی دارد. در حقیقت رفتارهای شخصی شامل شغل (نیاز به سفر در زمانی محدود) وضع خانوادگی (نیاز به مراقبت پزشکی برای مریض) یا تفریح (سود بردن از تخفیف دقایق پایانی برای دیدن مکان‌های جدید) ممکن است بر روی متغیرهای اضافه تأثیر بگذارد.

کاربردهای داده‌کاوی در علوم رایانه

[ویرایش]

در علم رایانه از داده‌کاوی برای کشف الگوی میان داده‌ها استفاده می‌شود، معمولاً داده‌های خام و معمولاً بی‌معنا وارد سیستم شده و پس از پردازش‌های مورد نیاز نتایج حاصل از داده که آن‌ها را اطلاعات می‌نامند، استخراج می‌گردد[۶] [۷]کاربردهای عمومی داده‌کاوی در علم کامپیوتر عبارتند از:

  • کشف الگوی میان داده‌ها
  • پیش‌بینی حدودی نتایج
  • به‌دست آوردن اطلاعات کاربردی
  • تمرکز بر روی داده‌های بزرگ

کاربردهای داده‌کاوی در رشته مهندسی صنایع

[ویرایش]

به منظور استفاده از مفاهیم، مدل‌ها، روش‌ها و یادگیری الگوریتم‌های داده کاوی مقالات و کتاب‌های معتبری مانند این کتاب و این کتاب وجود دارد. در مهندسی صنایع از داده‌کاوی در حوزه‌های مدیریت ارتباط با مشتری، نگهداری و تعمیرات پیشگیرانه، مدیریت زنجیره تأمین، برنامه‌ریزی تولید، کنترل کیفیت، مدیریت پروژه، ایمنی، بهداشت و محیط زیست استفاده می‌شود.

زبان رایج در استفاده از دیتا ماینینگ و تحلیل داده‌ها نرم‌افزار WEKA می‌باشد، اما به تازگی نرم‌افزار Rapidminer نیز با توجه به امکانات زیادش مورد توجه قرار گرفته‌است.


کاربردهای داده‌کاوی در رشته مهندسی برق


  • پیش بینی بار(load forecasting) : پیش بینی مصرف انرژی الکتریکی یکی از امور مهم در حوزه مهندسی برق است که نقش بسیار مهمی در برنامه ریزی، بهره برداری و کنترل سیستم های قدرت دارد. پیش بینی بار دقیق، می تواند تاثیرات شگرفی بر بهبود تصمیم گیری های عملیاتی در مورد برنامه ریزی تعمیرات و نگهداری، تخصیص ذخیره مطمئن، برنامه ریزی ورود و خروج واحدها، توزیع اقتصادی و ... داشته باشد. پیش بینی دقیق بار کوتاه مدت با توجه به عوامل متعدد مؤثر بر بار، از قبیل شرایط آب و هوایی، تغییرات دوره ای روزانه، هفتگی، فصلی و عوامل اتفاقی که دارای روابط پیچیده غیرخطی با بار هستند، از پیچیدگی های خاص برخوردار می باشد و کار بسیار دشواری است. برای حل مشکلات فوق درپیش بینی بار کوتاه مدت، می توان از روشهای داده کاوی که قادرند روابط غیرخطی دقیق را از میان داده های ورودی استخراج کنند، کمک گرفت.
  • پیش بینی دقیق بار در عملیات و برنامه ریزی سیستم قدرت بسیار مهم است. پیش بینی بار الکتریکی را می توان تقسیم کرد به سه دسته پیش بینی بار کوتاه مدت، پیش بینی بار میان مدت و پیش بینی بار بلند مدت پیش بینی بار کوتاه مدت تقاضای بار را از یک پیش بینی می کند روز تا چند هفته این به تخمین جریان های بار کمک می کند که می تواند از اضافه بار و در نتیجه جلوگیری کند منجر به اقتصاد و امنیت بیشتر سیستم قدرت شود. پیش بینی بار میان مدت پیش بینی می کند تقاضای بار از یک ماه تا چند سال است که اطلاعاتی را برای سیستم قدرت فراهم می کند برنامه ریزی و عملیات پیش بینی بار بلند مدت تقاضای بار را از یک سال پیش بینی می کند تا بیست سال و عمدتاً برای برنامه ریزی سیستم قدرت است [11].
. 
  • کاربردهای داده کاوی در کتابخانه‌ها

داده کاوی در ابتدا از حوزه تجارت برخاست اما کاربردهای آن در سایر حوزه‌هایی که به گردآوری حجم وسیعی از داده‌ها می‌پردازند که دستخوش تغییرات پویا نیز می‌گردند، مفید شناخته شد. بخش‌هایی مثل بانکداری، تجارت الکترونیک، تجارت سهام، بیمارستان و هتل از این نمونه‌اند.

انتظار می‌رود که استفاده از داده کاوی در بخش آموزش به‌طور عام امکان‌های جدید بسیاری ارائه دهد. برخی کاربردهای داده کاوی در کتابخانه‌ها و قسمت اداری آموزش در ذیل مورد بحث قرار گرفته‌اند.

عملیات کتابداری به‌طور کلی شامل مدیریت مدارک، ارائه خدمات و امور اداره و نگهداری است. هر کدام از این کارکردها با انواع مختلفی از داده‌ها سروکار دارد و به‌طور جداگانه پردازش می‌شود. اگرچه، انجام تحلیل ترکیبی بر این مجموعه‌های داده نیز می‌تواند افق تازه‌ای را بگشاید که به طرح خدمات جدید و تحول رویه‌ها و عملیات جاری کمک نماید. جدول یک برخی از کاربردهای ممکن داده کاوی را که می‌تواند در کتابداری مفید باشد ارائه می‌کند.

[۸]ابزارهای داده‌کاوی

[ویرایش]

معروف‌ترین ابزارهای داده‌کاوی برای انجام پروژه‌های داده کاوی به ترتیب پرطرفدار بودن

  1. آر (زبان برنامه‌نویسی)
  2. پایتون (زبان برنامه‌نویسی)
  3. رپیدماینر
  4. Clementine که نسخه ۱۳ ان با نام SPSS Modeler نامیده می‌شود.
  5. نرم‌افزار وکا
  6. متلب

نرم‌افزار[۹]

[ویرایش]

برنامه‌های کاربردی و نرم‌افزارهای داده کاوی متن-باز رایگان

  • Carrot2: پلتفرمی برای خوشه بندی متن و نتایج جستجو
  • Chemicalize.org: یک کاوشگر ساختمان شیمیایی و موتور جستجوی وب
  • ELKI: یک پروژه تحقیقاتی دانشگاهی با تحلیل خوشه‌ای پیشرفته و روش‌های تشخیص داده‌های خارج از محدوده که به زبان جاوا نوشته شده‌است.
  • GATE: یک پردازشگر زبان بومی و ابزار مهندسی زبان.


برنامه‌های کاربردی و نرم‌افزارهای داده کاوی تجاری

بررسی اجمالی بازار نرم‌افزارهای داده کاوی

[ویرایش]

تا کنون چندین محقق و سازمان بررسی‌هایی را بر روی ابزارهای داده کاوی و راهنمایی‌هایی برای داده کاوها تهیه دیده‌اند. این بررسی‌ها بعضی از نقاط ضعف و قوت بسته‌های نرم‌افزاری را مشخص می‌کنند. همچنین خلاصه‌ای را از رفتارها، اولویت‌ها و دیدهای داده کاوها تهیه کرده‌اند.

بعضی از این گزارش‌ها را در زیر می‌توانید مشاهده نمایید:


جستارهای وابسته

[ویرایش]

منابع

[ویرایش]
  1. «کتاب مدیریت کلان داده‌ها در بخش‌های خصوصی و عمومی - تألیف دکتر بابک سهرابی و حمیده ایرج - انتشارات سمت». بایگانی‌شده از اصلی در ۸ مه ۲۰۱۶. دریافت‌شده در ۶ مه ۲۰۱۶.
  2. Madadipouya, Kasra (2015). "A New Decision tree method for Data mining in Medicine". Advanced Computational Intelligence: An International Journal (ACII). 2 (3): 31–37.
  3. گروه داده کاوی ایران. «تعریف رده‌بندی». گروه داده کاوی ایران. دریافت‌شده در 26 فبریه 2014. تاریخ وارد شده در |تاریخ بازبینی= را بررسی کنید (کمک)
  4. گروه داده کاوی ایران. «تعریف خوشه بندی». گروه داده کاوی ایران. دریافت‌شده در 26 فبریه 2014. تاریخ وارد شده در |تاریخ بازبینی= را بررسی کنید (کمک)
  5. گروه داده کاوی ایران (26 فبریه 2014). «تعریف مصورسازی». گروه داده کاوی ایران. دریافت‌شده در 26 فبریه 2014. تاریخ وارد شده در |تاریخ بازبینی=،|تاریخ= را بررسی کنید (کمک)
  6. «داده کاوی (Data Mining) و کاربردهای آن». همیار آی تی. 2017-07-10. بایگانی‌شده از اصلی در ۱۱ اكتبر ۲۰۱۸. دریافت‌شده در 2018-10-11. بیش از یک پارامتر |نشانی بایگانی= و |archive-url= داده‌شده است (کمک); بیش از یک پارامتر |تاریخ بایگانی= و |archive-date= داده‌شده است (کمک); تاریخ وارد شده در |archive-date= را بررسی کنید (کمک)
  7. "Integration of meta-analysis and supervised machine learning for pattern recognition in breast cancer using epigenetic data". Informatics in Medicine Unlocked (به انگلیسی). 24: 100629. 2021-01-01. doi:10.1016/j.imu.2021.100629. ISSN 2352-9148.
  8. "Integration of meta-analysis and supervised machine learning for pattern recognition in breast cancer using epigenetic data". Informatics in Medicine Unlocked (به انگلیسی). 24: 100629. 2021-01-01. doi:10.1016/j.imu.2021.100629. ISSN 2352-9148.
  9. این بخش به صورت کامل برگردان (ترجمه) قسمت انگلیسی ویکی‌پدیا می‌باشد.
  10. Mikut, Ralf; Reischl, Markus (September/October 2011). "Data Mining Tools". Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery. 1 (5): 431–445. doi:10.1002/widm.24. ISSN 1942-4795. Retrieved October 21, 2011. {{cite journal}}: Check date values in: |date= (help)
  11. Karl Rexer, Heather Allen, & Paul Gearan (2011); Understanding Data Miners, Analytics Magazine, May/June 2011 (INFORMS: Institute for Operations Research and the Management Sciences).

پانویس

[ویرایش]
  1. {Data }کلمه‌ای‌ست جمع (با مفرد Datum) که نمی‌شود آن را به واژهٔ مفرد «داده» نسبت داد. عدم رعایت این‌گونه اصول آشکار در دانشنامه‌ای با مقیاس و وسعت جهانی، تناقضات و ناسازگاری‌های معنایی (semantic) بعدی در تعاملات ماشینی با سایر زبان‌ها را در پی می‌آورد.

پیوند به بیرون

[ویرایش]