پیشنویس:پروژه GDELT
پروژه GDELT یا پایگاه داده جهانی رویدادها، زبان و لحن ، که کالف لیتارو از یاهو! و دانشگاه جورج تاون ، همراه با فیلیپ شرود و دیگران آن را ساختهاند، در وبسایتش اینگونه معرفی شده است: «ابتکاری برای ساخت دادهنامهای (کاتالوگ) از رفتارها و باورهای اجتماعی انسانها در تمام کشورهای جهان که با ربط دادن همه انسانها، سازمانها، مکانها، منابع خبری و رویدادها در یک شبکهی بزرگ واحد بتواند مشخص کند که هر روز در جهان چه چیزی در حال رخ دادن است، در چه بستری رخ میدهد، چه کسانی درگیر آن هستند و افکار عمومی نسبت به آن چه حسی دارند.»[۱][۲][۳] فیلیپ شرود، یکی از سازندگان، در یک مقالهی کنفرانسی در ژانویه 2011، نخستین کنجکاویهایی را که به ساخت GDELT انجامید، شرح میدهد.[۴] در حال حاضر، مجموعهداده در سکوی ابری گوگل در دسترس است.[۵]
داده
[ویرایش]GDELT شامل دادههای سال ۱۹۷۹ تا کنون است. دادهها بهصورت فایلهای فشرده با فرمت CSV در دسترس هستند که به آسانی در اکسل یا دیگر نرمافزارهای مشابه خوانده میشود.[۶] دادههای هر سال از سالهای ۱۹۷۹ تا ۲۰۰۵، به صورت یک فایل فشرده (zip) موجود است. اندازه این فایلها به تدریج از ۱۴.۳ مگابایت در سال ۱۹۷۹ به ۱۲۵.۹ مگابایت در سال ۲۰۰۵ رسیده است که نشاندهنده افزایش تعداد رسانههای خبری و فراوانی و جامعیت ثبت رویدادها است.[۷] از ژانویه ۲۰۰۶ تا مارس ۲۰۱۳، دادهها با جزئیات ماهانه در دسترس هستند و حجم فایل فشرده نیز از 11 مگابایت در ژانویه ۲۰۰۶ به ۱۰۳.۲ مگابایت در مارس ۲۰۱۳ افزایش یافته است. از ابتدای آوریل ۲۰۱۳، دادهها با جزئیات روزانه در دسترس هستند. فایل داده برای هر تاریخ تا ساعت ۶ صبح روز بعد به وقت استاندارد شرقی در دسترس قرار می گیرد. از ژوئن ۲۰۱۴، حجم فایل فشرده روزانه حدود ۵ تا ۱۲ مگابایت است.[۶][۷] در این دادهها از کدگذاری مشاهدات رویدادهای تعارض و میانجیگری (CAMEO) برای ضبط رویدادها استفاده شده است.[۸]
کالف لیتارو، یکی از سازندهها، در یک پست وبلاگی برای فارین پالیسی تلاش کرد تا با بهرهگیری از دادههای GDELT پاسخی به این پرسش بدهد که آیا بهار عربی باعث اعتراض در سراسر جهان شده است یا نه؟برای این کار او از نسبت تعداد رویدادهای اعتراضمحور به تعداد کل رویدادهای ثبتشده به عنوان معیاری از شدت اعتراض استفاده کرد.[۹] جی اولفلدر، دانشمند سیاسی و کارشناس علوم داده/پیشبینی، از این پست در وبلاگ شخصی خود انتقاد کرد و گفت که روش بهنجارسازی (normalization) لیتارو ممکن است به اندازه کافی تغییر در ماهیت و ترکیب پوشش رسانهای را توجیه نکرده باشد.[۱۰]
در حال حاضر، این مجموعهداده در سکوی ابری گوگل موجود است و با استفاده از گوگل بیگکوئری قابل دسترسی است.[۵]
پذیرفتگی
[ویرایش]پذیرفتگی دانشگاهی
[ویرایش]تا کنون GDELT در چندین مطالعه دانشگاهی مورد ارجاع و استفاده قرار گرفته است؛ از جمله، مطالعهی تحلیلهای بصری و پیشبینانهی اخبار سنگاپور (در کنار ویکیپدیا و شاخص استریتس تایمز) و مطالعهای روی مناقشههای سیاسی.[۱۱]
در کنفرانس بینالمللی رایانش اجتماعی، مدلسازی و پیشبینی رفتاری (SBP) در سال ۲۰۱۴، به عنوان چالش از شرکتکنندگان خواسته شد تا GDELT را بکاوند و آن را در تحلیل شبکههای اجتماعی، رفتار و پیشبینی به کار ببرند.[۱۲]
پذیرفتگی در وبلاگها و رسانهها
[ویرایش]GDELT در وبگاه مرکز نوآوری داده[۱۳] و نیز وبگاه GIS Lounge پوشش داده شده است.[۱۴] همچنین این پایگاهداده در وبلاگهای مربوط به خشونت سیاسی و پیشبینی بحران مورد بحث قرار گرفته و نقد شده است.[۱۰][۱۵][۱۶] در مجله خبری فارین پالیسی[۲][۱۷] نیز بارها این دادهها را استفاده کرده و به نقد آن پرداخته است؛ از جمله پیرامون رخدادهای سیاسی در سوریه[۱۸]، بهار عربی[۹][۱۹] و نیجریه[۲۰]. افزون بر اینها، هفتهنامهی New Scientist[۲۱]، وبگاه FiveThirtyEight[۲۲] و وبلاگ اندرو سالیوان نیز از دیگر مواردی هستند که به GDELT استناد کردهاند.[۲۳]
چندین وبلاگ از جمله وبلاگ Predictive Heuristics، پروژه GDELT را با سامانه هشدار اولیه درگیری یکپارچه (ICEWS) مقایسه کردهاند.[۲۴][۲۵] الکس هانا نیز در وبلاگش، در مورد آزمایشش در ارزیابی GDELT با دادههای کدشدهی دستی نوشته و آن را با مجموعهدادهی دینامیک کنش جمعی، مقایسه کرده است.[۲۶]
در ماه مِی ۲۰۱۴، وبلاگ سکوی ابری گوگل اعلام کرد که کل مجموعهدادهی GDELT در گوگل بیگ کوئری در دسترس عموم قرار میگیرد.[۵]
جستارهای وابسته
[ویرایش]منابع
[ویرایش]- مشارکتکنندگان ویکیپدیا. «GDELT Project». در دانشنامهٔ ویکیپدیای انگلیسی، بازبینیشده در ۲۷ می ۲۰۲۴.
پیوند به بیرون
[ویرایش]- ↑ "About GDELT: The Global Database of Events, Language, and Tone". Retrieved June 2, 2014.
- ↑ ۲٫۰ ۲٫۱ "Mapped: Every Protest on the Planet Since 1979". Foreign Policy. Retrieved June 2, 2014.
- ↑ "Global Database of Events, Language, and Tone". datahub.io. Retrieved June 2, 2014.
- ↑ Schrodt, Philip (January 20, 2011). "Automated Production of High-Volume, Near-Real-Time Political Event Data" (PDF). Archived from the original (PDF) on 2017-07-02. Retrieved June 12, 2014.
- ↑ ۵٫۰ ۵٫۱ ۵٫۲ "World's largest event dataset now publicly available in BigQuery". Google Cloud Platform. May 29, 2014. Retrieved June 2, 2014.
- ↑ ۶٫۰ ۶٫۱ "Raw data files". Global Database of Events, Language, and Tone.
- ↑ ۷٫۰ ۷٫۱ "All GDELT Event Files". Retrieved June 12, 2014.
- ↑ "Documentation". Global Database of Events, Language, and Tone.
- ↑ ۹٫۰ ۹٫۱ Leetaru, Kalev (May 29, 2014). "Did the Arab Spring Really Spark a Wave of Global Protests? The world may look like it's roiling now, but the 1980s were far worse". Foreign Policy. Retrieved June 2, 2014.
- ↑ ۱۰٫۰ ۱۰٫۱ Ulfelder, Jay (June 6, 2014). "Another Note on the Limitations of Event Data". Retrieved June 12, 2014.
- ↑ Yonamine, James E. "A nuanced study of political conflict using the Global Datasets of Events Location and Tone (GDELT) dataset". Retrieved June 2, 2014.
- ↑ "SBP 2014 Grand Challenge: explore GDELT, Global Database of Events, Language and Tone". Retrieved June 2, 2014.
- ↑ "Creating a Real-Time Global Database of Events, People, and Places in the News". Center for Data Innovation. December 15, 2013. Retrieved June 2, 2014.
- ↑ Caitlin Dempsey Morais (September 5, 2013). "Mapping Global Events Since 1979". GIS Lounge. Retrieved June 2, 2014.
- ↑ "Raining on the Parade: Some Cautions Regarding the Global Database of Events, Language and Tone Dataset". Political Violence at a Glance. February 20, 2014. Retrieved June 2, 2014.
- ↑ Jongman, Berto (January 5, 2014). "Global Database of Events, Language, and Tone (GDELT) — (Old) Big Data to See (New) Crises?". Public Intelligence Blog. Retrieved June 2, 2014.
- ↑ Keating, Joshua (April 10, 2013). "What can we learn from the last 200 million things that happened in the world?". Foreign Policy. Archived from the original on June 6, 2014. Retrieved June 2, 2014.
- ↑ Keating, Joshua (July 9, 2013). "How Well Does GDELT Follow Events in Syria?". Foreign Policy. Archived from the original on June 6, 2014. Retrieved June 2, 2014.
- ↑ Steinert-Threlkeld, Zachary (September 27, 2013). "The Arab Spring and GDELT". Retrieved June 18, 2014.
- ↑ Leetaru, Kalev (March 13, 2014). "Mapping Violence and Protests in Nigeria: How Big Data can find the big story". Foreign Policy. Retrieved June 2, 2014.
- ↑ Heaven, Douglas (May 13, 2013). "World's largest events database could predict conflict". New Scientist. Retrieved June 2, 2014.
- ↑ Chalabi, Mona (May 6, 2014). "Kidnapping of Girls in Nigeria Is Part of a Worsening Problem (Updated)". FiveThirtyEight. Retrieved June 2, 2014.
- ↑ Sullivan, Andrew (May 30, 2014). "Not Your Father's Global Uprising". Retrieved June 2, 2014.
- ↑ mdwardlab (October 17, 2013). "GDELT and ICEWS, a short comparison". Predictive Heuristics. Archived from the original on July 17, 2014. Retrieved June 18, 2014.
- ↑ Beieler, John (October 28, 2013). "Noise in GDELT". Retrieved June 21, 2014.
- ↑ Hanna, Alex (February 24, 2014). "Assessing GDELT with handcoded protest data". Bad Hessian. Retrieved June 21, 2014.