پرش به محتوا

داده‌های تاریک

از ویکی‌پدیا، دانشنامهٔ آزاد

داده‌های تاریک داده‌هایی هستند که از طریق عملیات‌های مختلف شبکه کامپیوتری به دست می‌آیند اما به هیچ وجه برای استخراج بینش یا تصمیم‌گیری استفاده نمی‌شوند. سازمان‌ها اغلب داده‌های تاریک را فقط برای اهداف انطباق داده‌ها ذخیره می‌کنند.[۱] توانایی یک سازمان در جمع‌آوری داده‌ها ممکن است از توان تجزیه و تحلیل داده‌ها بیشتر باشد. در برخی موارد ممکن است سازمان حتی از جمع آوری داده‌ها آگاه نباشد.[۲] IBM تخمین می‌زند که تقریباً ۹۰ درصد داده‌های تولید شده توسط حسگرها و تبدیل‌های آنالوگ به دیجیتال هرگز مورد استفاده قرار نمی‌گیرند و ۶۰ درصد از این داده ها ارزش واقعی خود را بعد از چند میلی ثانیه از دست می دهند.[۳]

در زمینه صنعتی، داده‌های تاریک می‌تواند شامل اطلاعات جمع‌آوری‌شده توسط حسگرها و تله‌ماتیک‌ها باشد.[۴]

سازمان‌ها داده‌های تاریک را به دلایل زیادی ذخیره می‌کنند، و تخمین زده می‌شود که بیشتر شرکت‌ها تنها ۱٪ از داده‌های خود را تجزیه و تحلیل می‌کنند.[۵] [۶] برخی از سازمان‌ها بر این باورند که داده‌های تاریک می‌تواند در آینده برای آنها مفید باشد، زیرا آن‌ها در آینده فناوری تحلیلی و هوش تجاری بهتری را برای پردازش اطلاعات به دست خواهند آورند.[۲][۶] از آن‌جایی که ذخیره سازی داده‌ها به نسبت ارزان است، ذخیره داده‌ها آسان است. با این حال، ذخیره سازی و ایمن سازی داده ها معمولاً مستلزم هزینه‌های (یا حتی ریسک) بیشتر از سود بالقوه است.[۱]

پروفسور دیوید هند(به انگلیسی:Professor David Hand) از امپریال کالج لندن نیز از این اصطلاح برای اشاره به داده هایی استفاده می کند که گم شده اند: داده های تاریک داده هایی هستند که شما ندارید.[۷]

تحلیل و بررسی

[ویرایش]

بسیاری از داده‌های تاریک ساختاری ندارند، به این معنی که اطلاعات در قالب‌هایی هستند که خواندن، تجزیه و تحلیل و دسته‌بندی آن‌ها ممکن است برای رایانه دشوار باشد. کسب‌وکار داده‌های تاریک خود را اغلب به دلیل مقدار منابعی که برای این کار لازم است و دشواری تجزیه و تحلیل آن داده‌ها، تجزیه و تحلیل نمی‌کند. طبق گزارش Computer Weekly حدود ۶۰ درصد از سازمان‌ها معتقدند که قابلیت گزارش‌دهی هوش تجاری خودشان «ناکافی» است و ۶۵ درصد می‌گویند که «رویکردهای مدیریت محتوا تا حدی سازمان‌دهی نشده» دارند.[۸]

ارتباط

[ویرایش]

داده‌های مفید ممکن است پس از بی‌ربط شدن به داده‌های تاریک تبدیل شوند، زیرا به اندازه کافی سریع پردازش نمی‌شوند. به عنوان مثال، اگر موقعیت جغرافیایی یک مشتری برای یک شرکت شناخته شده باشد، شرکت می‌تواند بر اساس موقعیت مکانی پیشنهاد دهد، اما اگر این داده‌ها فورا پردازش نشود، ممکن است در آینده نامربوط شوند. به گفته IBM، حدود 60 درصد از داده ها بلافاصله ارزش خود را از دست می دهند.[۳]

ذخیره سازی

[ویرایش]

بر اساس گزارش نیویورک تایمز، ۹۰ درصد انرژی مورد استفاده توسط مراکز داده هدر می رود.[۹] اگر این داده‌ها ذخیره نمی‌شد در هزینه‌های انرژی صرفه‌جویی بزرگی می‌شد. علاوه بر این، هزینه‌های مرتبط با استفاده ناکافی از اطلاعات و در نتیجه از دست رفتن فرصت‌ها وجود دارد. به گفته سایت Datamation "محیط‌های ذخیره سازی سازمان‌های EMEA شامل ۵۴ درصد داده‌های تاریک، ۳۲ درصد داده های اضافی، منسوخ و پیش پا افتاده و ۱۴ درصد داده های حیاتی تجاری است. تا سال ۲۰۲۰ میلادی، این می‌تواند تا ۸۹۱ میلیارد دلار هزینه های ذخیره سازی و مدیریتی را اضافه کند. در غیر این صورت می توان از آن اجتناب کرد.»[۱۰]

ذخیره سازی مداوم داده‌های تاریک می‌تواند یک سازمان را در معرض خطر قرار دهد، به خصوص اگر این داده‌ها حساس باشند. در صورت رخنه و نقض می تواند عواقب جدی داشته باشد. عواقب می‌توانند مالی، قانونی باشند و به اعتبار یک سازمان آسیب جدی وارد کنند. به عنوان مثال، نقض سوابق خصوصی مشتریان می‌تواند منجر به سرقت اطلاعات حساس شود که می‌تواند منجر به سرقت هویت شود. مثال دیگر می‌تواند نقض اطلاعات حساس خود شرکت، به عنوان مثال مربوط به تحقیق و توسعه باشد. این خطرات را می‌توان با ارزیابی و ممیزی اینکه آیا این داده ها برای سازمان مفید هستند یا خیر، با استفاده از رمزگذاری و امنیت قوی کاهش داد[۱۱] و در نهایت، اگر مشخص شد که داده تاریک هستند حذف می‌شود، باید به گونه ای حذف شود که غیرقابل بازیابی باشد.[۱۲] [۶]

آینده داده‌های تاریک

[ویرایش]

به طور کلی فرض می‌شود که هرچه سیستم‌های محاسباتی پیشرفته‌تری برای تجزیه و تحلیل داده‌ها ساخته شود، ارزش داده‌های تاریک بالاتر بیش‌تر خواهد شد. «داده‌ها و تحلیل‌ها پایه و اساس انقلاب صنعتی مدرن خواهند بود».[۴] البته، این موضوع شامل داده‌هایی می‌شود که در حال حاضر «داده‌های تاریک» در نظر گرفته می‌شوند، زیرا منابع کافی برای پردازش آن‌ها وجود ندارد. تمام این داده‌هایی که جمع‌آوری می‌شوند، می‌توانند در آینده برای به ارمغان آوردن حداکثر بهره‌وری و توانایی سازمان‌ها برای برآوردن تقاضای مصرف‌کنندگان مورد استفاده قرار گیرند. پیشرفت‌های فناوری اطلاعات به لطف شرکت‌های جوان و مبتکر این زمینه مانند Datumize، Veritas یا Lucidworks به استفاده مقرون‌به‌صرفه از این داده‌های تاریک کمک می‌کنند. علاوه بر این، بسیاری از سازمان‌ها در حال حاضر ارزش داده‌های تاریک را درک نمی‌کنند، به عنوان مثال در سازمان‌های مراقبت‌های بهداشتی و آموزشی با حجم زیادی از داده‌ها سروکار دارند که می‌تواند، توان قابل‌توجهی برای ارائه خدمات به دانش‌آموزان و بیماران به شیوه‌ای ایجاد کند. [۶] [۱۳]

منابع

[ویرایش]
  1. ۱٫۰ ۱٫۱ "Definition of Dark Data - Gartner Information Technology Glossary". Gartner (به انگلیسی). Retrieved 2021-11-19.
  2. ۲٫۰ ۲٫۱ «The API Briefing: the Challenge of Government's Dark Data». Digital.gov (به انگلیسی). ۲۰۱۵-۰۶-۱۷. دریافت‌شده در ۲۰۲۱-۱۱-۱۹.
  3. ۳٫۰ ۳٫۱ «Digging up dark data: What puts IBM at the forefront of insight economy | #IBMinsight». SiliconANGLE (به انگلیسی). ۲۰۱۵-۱۰-۳۰. دریافت‌شده در ۲۰۲۱-۱۱-۱۹.
  4. ۴٫۰ ۴٫۱ «TeradataVoice: Factories Of The Future: The Value Of Dark Data - Forbes». web.archive.org. ۲۰۱۵-۰۲-۲۲. بایگانی‌شده از اصلی در ۲۲ فوریه ۲۰۱۵. دریافت‌شده در ۲۰۲۱-۱۱-۱۹.
  5. «Journey to AI Blog - The IBM Data and AI blog». Journey to AI Blog (به انگلیسی). ۲۰۲۱-۱۱-۱۵. دریافت‌شده در ۲۰۲۱-۱۱-۱۹.
  6. ۶٫۰ ۶٫۱ ۶٫۲ ۶٫۳ "Dark data". Wikipedia (به انگلیسی). 2021-08-23.
  7. "10-Minute Talks: Dark data". The British Academy (به انگلیسی). Retrieved 2021-11-19.
  8. "Dark data could halt big data's path to success". ComputerWeekly.com (به انگلیسی). Retrieved 2021-11-19.
  9. Glanz، James (۲۰۱۲-۰۹-۲۳). «Power, Pollution and the Internet» (به انگلیسی). The New York Times. شاپا 0362-4331. دریافت‌شده در ۲۰۲۱-۱۱-۱۹.
  10. «Enterprises are Hoarding 'Dark' Data: Veritas». Datamation (به انگلیسی). ۲۰۱۵-۱۰-۳۰. دریافت‌شده در ۲۰۲۱-۱۱-۱۹.
  11. «Press Releases». www.iri.com. دریافت‌شده در ۲۰۲۱-۱۱-۱۹.
  12. Tittel, Ed (2014-09-24). "The Dangers of Dark Data and How to Minimize Your Exposure". CIO (به انگلیسی). Retrieved 2021-11-19.
  13. Prag, Crystal; Manager, Event Marketing; Media, Rising; Inc. "Leveraging Dark Data: Q&A with Melissa McCormack « Machine Learning Times" (به انگلیسی). Retrieved 2021-11-19.