پرش به محتوا

پیش‌نویس:پروژه GDELT

از ویکی‌پدیا، دانشنامهٔ آزاد

پروژه GDELT یا پایگاه داده جهانی رویدادها، زبان و لحن ، که کالف لیتارو از یاهو! و دانشگاه جورج تاون ، همراه با فیلیپ شرود و دیگران آن را ساخته‌اند، در وبسایتش این‌گونه معرفی شده است: «ابتکاری برای ساخت داده‌نامه‌ای (کاتالوگ) از رفتارها و باورهای اجتماعی انسان‌ها در تمام کشورهای جهان که با ربط دادن همه انسان‌ها، سازمان‌ها، مکان‌ها، منابع خبری و رویدادها در یک شبکه‌ی بزرگ واحد بتواند مشخص کند که هر روز در جهان چه چیزی در حال رخ دادن است، در چه بستری رخ می‌دهد، چه کسانی درگیر آن هستند و افکار عمومی نسبت به آن چه حسی دارند.»[۱][۲][۳] فیلیپ شرود، یکی از سازندگان، در یک مقاله‌ی کنفرانسی در ژانویه 2011، نخستین کنجکاوی‌هایی را که به ساخت GDELT انجامید، شرح می‌دهد.[۴] در حال حاضر، مجموعه‌داده در سکوی ابری گوگل در دسترس است.[۵]

داده

[ویرایش]

GDELT شامل داده‌های سال ۱۹۷۹ تا کنون است. داده‌ها به‌صورت فایل‌های فشرده با فرمت CSV در دسترس هستند که به آسانی در اکسل یا دیگر نرم‌افزارهای مشابه خوانده می‌شود.[۶] داده‌های هر سال از سال‌های ۱۹۷۹ تا ۲۰۰۵، به صورت یک فایل فشرده (zip) موجود است. اندازه این فایل‌ها به تدریج از ۱۴.۳ مگابایت در سال ۱۹۷۹ به ۱۲۵.۹ مگابایت در سال ۲۰۰۵ رسیده است که نشان‌دهنده افزایش تعداد رسانه‌های خبری و فراوانی و جامعیت ثبت رویدادها است.[۷] از ژانویه ۲۰۰۶ تا مارس ۲۰۱۳، داده‌ها با جزئیات ماهانه در دسترس هستند و حجم فایل فشرده نیز از 11 مگابایت در ژانویه ۲۰۰۶ به ۱۰۳.۲ مگابایت در مارس ۲۰۱۳ افزایش یافته است. از ابتدای آوریل ۲۰۱۳، داده‌ها با جزئیات روزانه در دسترس هستند. فایل داده برای هر تاریخ تا ساعت ۶ صبح روز بعد به وقت استاندارد شرقی در دسترس قرار می گیرد. از ژوئن ۲۰۱۴، حجم فایل فشرده روزانه حدود ۵ تا ۱۲ مگابایت است.[۶][۷] در این داده‌ها از کدگذاری مشاهدات رویدادهای تعارض و میانجیگری (CAMEO) برای ضبط رویدادها استفاده شده است.[۸]

کالف لیتارو، یکی از سازنده‌ها، در یک پست وبلاگی برای فارین پالیسی تلاش کرد تا با بهره‌گیری از داده‌های GDELT پاسخی به این پرسش بدهد که آیا بهار عربی باعث اعتراض در سراسر جهان شده است یا نه؟برای این کار او از نسبت تعداد رویدادهای اعتراض‌محور به تعداد کل رویدادهای ثبت‌شده به عنوان معیاری از شدت اعتراض استفاده کرد.[۹] جی اولفلدر، دانشمند سیاسی و کارشناس علوم داده/پیش‌بینی، از این پست در وبلاگ شخصی خود انتقاد کرد و گفت که روش بهنجارسازی (normalization) لیتارو ممکن است به اندازه کافی تغییر در ماهیت و ترکیب پوشش رسانه‌ای را توجیه نکرده باشد.[۱۰]

در حال حاضر، این مجموعه‌داده در سکوی ابری گوگل موجود است و با استفاده از گوگل بیگ‌کوئری قابل دسترسی است.[۵]

پذیرفتگی

[ویرایش]

پذیرفتگی دانشگاهی

[ویرایش]

تا کنون GDELT در چندین مطالعه دانشگاهی مورد ارجاع و استفاده قرار گرفته است؛ از جمله، مطالعه‌ی تحلیل‌های بصری و پیش‌بینانه‌ی اخبار سنگاپور (در کنار ویکی‌پدیا و شاخص استریتس تایمز) و مطالعه‌ای روی مناقشه‌های سیاسی.[۱۱]

در کنفرانس بین‌المللی رایانش اجتماعی، مدل‌سازی و پیش‌بینی رفتاری (SBP) در سال ۲۰۱۴، به عنوان چالش از شرکت‌کنندگان خواسته شد تا GDELT را بکاوند و آن را در تحلیل شبکه‌های اجتماعی، رفتار و پیش‌بینی به کار ببرند.[۱۲]

پذیرفتگی در وبلاگ‌ها و رسانه‌ها

[ویرایش]

GDELT در وبگاه مرکز نوآوری داده‌[۱۳] و نیز وبگاه GIS Lounge پوشش داده شده است.[۱۴] همچنین این پایگاه‌داده در وبلاگ‌های مربوط به خشونت سیاسی و پیش‌بینی بحران مورد بحث قرار گرفته و نقد شده است.[۱۰][۱۵][۱۶] در مجله خبری فارین پالیسی[۲][۱۷] نیز بارها این داده‌ها را استفاده کرده و به نقد آن پرداخته است؛ از جمله پیرامون رخدادهای سیاسی در سوریه[۱۸]، بهار عربی[۹][۱۹] و نیجریه[۲۰]. افزون بر این‌ها، هفته‌نامه‌ی New Scientist[۲۱]، وبگاه FiveThirtyEight[۲۲] و وبلاگ اندرو سالیوان نیز از دیگر مواردی هستند که به GDELT استناد کرده‌اند.[۲۳]

چندین وبلاگ از جمله وبلاگ Predictive Heuristics، پروژه GDELT را با سامانه هشدار اولیه درگیری یکپارچه (ICEWS) مقایسه کرده‌اند.[۲۴][۲۵] الکس هانا نیز در وبلاگش، در مورد آزمایشش در ارزیابی GDELT با داده‌های کدشده‌ی دستی نوشته و آن را با مجموعه‌داده‌ی دینامیک کنش جمعی، مقایسه کرده است.[۲۶]

در ماه مِی ۲۰۱۴، وبلاگ سکوی ابری گوگل اعلام کرد که کل مجموعه‌داده‌ی GDELT در گوگل بیگ کوئری در دسترس عموم قرار می‌گیرد.[۵]

جستارهای وابسته

[ویرایش]

منابع

[ویرایش]
  1. مشارکت‌کنندگان ویکی‌پدیا. «GDELT Project». در دانشنامهٔ ویکی‌پدیای انگلیسی، بازبینی‌شده در ۲۷ می ۲۰۲۴.

پیوند به بیرون

[ویرایش]
  1. "About GDELT: The Global Database of Events, Language, and Tone". Retrieved June 2, 2014.
  2. ۲٫۰ ۲٫۱ "Mapped: Every Protest on the Planet Since 1979". Foreign Policy. Retrieved June 2, 2014.
  3. "Global Database of Events, Language, and Tone". datahub.io. Retrieved June 2, 2014.
  4. Schrodt, Philip (January 20, 2011). "Automated Production of High-Volume, Near-Real-Time Political Event Data" (PDF). Archived from the original (PDF) on 2017-07-02. Retrieved June 12, 2014.
  5. ۵٫۰ ۵٫۱ ۵٫۲ "World's largest event dataset now publicly available in BigQuery". Google Cloud Platform. May 29, 2014. Retrieved June 2, 2014.
  6. ۶٫۰ ۶٫۱ "Raw data files". Global Database of Events, Language, and Tone.
  7. ۷٫۰ ۷٫۱ "All GDELT Event Files". Retrieved June 12, 2014.
  8. "Documentation". Global Database of Events, Language, and Tone.
  9. ۹٫۰ ۹٫۱ Leetaru, Kalev (May 29, 2014). "Did the Arab Spring Really Spark a Wave of Global Protests? The world may look like it's roiling now, but the 1980s were far worse". Foreign Policy. Retrieved June 2, 2014.
  10. ۱۰٫۰ ۱۰٫۱ Ulfelder, Jay (June 6, 2014). "Another Note on the Limitations of Event Data". Retrieved June 12, 2014.
  11. Yonamine, James E. "A nuanced study of political conflict using the Global Datasets of Events Location and Tone (GDELT) dataset". Retrieved June 2, 2014.
  12. "SBP 2014 Grand Challenge: explore GDELT, Global Database of Events, Language and Tone". Retrieved June 2, 2014.
  13. "Creating a Real-Time Global Database of Events, People, and Places in the News". Center for Data Innovation. December 15, 2013. Retrieved June 2, 2014.
  14. Caitlin Dempsey Morais (September 5, 2013). "Mapping Global Events Since 1979". GIS Lounge. Retrieved June 2, 2014.
  15. "Raining on the Parade: Some Cautions Regarding the Global Database of Events, Language and Tone Dataset". Political Violence at a Glance. February 20, 2014. Retrieved June 2, 2014.
  16. Jongman, Berto (January 5, 2014). "Global Database of Events, Language, and Tone (GDELT) — (Old) Big Data to See (New) Crises?". Public Intelligence Blog. Retrieved June 2, 2014.
  17. Keating, Joshua (April 10, 2013). "What can we learn from the last 200 million things that happened in the world?". Foreign Policy. Archived from the original on June 6, 2014. Retrieved June 2, 2014.
  18. Keating, Joshua (July 9, 2013). "How Well Does GDELT Follow Events in Syria?". Foreign Policy. Archived from the original on June 6, 2014. Retrieved June 2, 2014.
  19. Steinert-Threlkeld, Zachary (September 27, 2013). "The Arab Spring and GDELT". Retrieved June 18, 2014.
  20. Leetaru, Kalev (March 13, 2014). "Mapping Violence and Protests in Nigeria: How Big Data can find the big story". Foreign Policy. Retrieved June 2, 2014.
  21. Heaven, Douglas (May 13, 2013). "World's largest events database could predict conflict". New Scientist. Retrieved June 2, 2014.
  22. Chalabi, Mona (May 6, 2014). "Kidnapping of Girls in Nigeria Is Part of a Worsening Problem (Updated)". FiveThirtyEight. Retrieved June 2, 2014.
  23. Sullivan, Andrew (May 30, 2014). "Not Your Father's Global Uprising". Retrieved June 2, 2014.
  24. mdwardlab (October 17, 2013). "GDELT and ICEWS, a short comparison". Predictive Heuristics. Archived from the original on July 17, 2014. Retrieved June 18, 2014.
  25. Beieler, John (October 28, 2013). "Noise in GDELT". Retrieved June 21, 2014.
  26. Hanna, Alex (February 24, 2014). "Assessing GDELT with handcoded protest data". Bad Hessian. Retrieved June 21, 2014.