داده شناسی نجومی
دادهشناسی نجومی یک رشته مطالعاتی بین رشتهای است که شامل ترکیبی از نجوم، علم داده، یادگیری ماشین، انفورماتیک و فناوریهای اطلاعات/ارتباطات [۲] است. این رشته ارتباط نزدیکی با آمار نجومی دارد.
زمینه
[ویرایش]دادهشناسی نجومی عمدتاً بر توسعه ابزارها، روشها و کاربردهای علوم محاسباتی، علم داده، یادگیری ماشین و آمار برای تحقیق و آموزش در نجوم دادهگرا متمرکز است.[۳] تلاشهای اولیه در این جهت شامل کشف دادهها، توسعه استانداردهای ابرداده، مدلسازی دادهها، توسعه فرهنگ لغات دادههای نجومی، دسترسی به دادهها، بازیابی اطلاعات[۴]، یکپارچهسازی دادهها، و دادهکاوی[۵] در ابتکارات رصدخانه مجازی نجومی بود.[۶][۷] برای توسعه بیشتر این رشته و شناخته شدن آن و موقعیتهایش در سال 2009، همراه با تایید جامعه نجوم، مقاله ای به شورای تحقیقات ملی (ایالات متحده آمریکا) ارائه شد.[۸] آن مقاله موقعیت مبنایی را برای توضیح دقیقتر ابعاد و بخشهای این رشته در مقاله مجله انفورماتیک Astroinformatics: Data-Oriented Astronomy Research and Education ارائه کرد. در سال 2012 نیز دو مقاله [۹][۱۰] به شورای انجمن نجوم آمریکا ارائه شد که منجر به ایجاد گروههای کاری رسمی در دادهشناسی نجومی و اخترآمار برای حرفه نجوم در ایالات متحده و جاهای دیگر شد.[۱۱]
دادهشناسی نجومی به عنوان یک زمینه تحقیقاتی متمایز از کار در زمینههای بیوانفورماتیک و ژئوانفورماتیک و توسط فعالیت های جیم گری (دانشمند کامپیوتر) در زمینه eScience[۱۲] در تحقیقات مایکروسافت الهام گرفته شد، که میراث آن از طریق جوایز eScience جیم گری ادامه یافت.[۱۳]
اگرچه تمرکز اصلی دادهشناسی نجومی بر مجموعه گسترده توزیع شده در سراسر جهان از پایگاههای اطلاعاتی نجومی دیجیتال، آرشیو تصاویر و ابزارهای تحقیقاتی است، اما این رشته اهمیت مجموعه دادههای قدیمی را نیز به رسمیت میشناسد که با استفاده از فناوریهای مدرن برای حفظ و تحلیل مشاهدات نجومی تاریخی از انها بهره میبرد. برخی از کارشناسان این حوزه به دیجیتالی کردن مشاهدات و تصاویر نجومی بدست آمده زمان حال یا گذشته در یک پایگاه داده بزرگ از طریق واسط های مبتنی بر اینترنت کمک می کنند.[۱۴] هدف دیگر کمک به توسعه روشها و نرمافزارهای جدید برای اخترشناسان و همچنین کمک به تسهیل فرآیند و تجزیه و تحلیل حجم رو به رشد سریع دادهها در زمینه نجوم است.[۱۵]
دادهشناسی نجومی به عنوان "پارادایم چهارم" تحقیقات نجومی توصیف می شود.[۱۶] حوزههای تحقیقاتی بسیاری درگیر دادهشناسی نجومی هستند، مانند دادهکاوی، یادگیری ماشین، آمار، تجسم، مدیریت دادههای علمی، و علم معنایی.[۱۷] داده کاوی و یادگیری ماشین به دلیل تمرکز بر "کشف دانش از داده ها" و "یادگیری از داده ها" نقش مهمی در اختر انفورماتیک به عنوان یک رشته تحقیقاتی علمی ایفا می کنند.[۱۸][۱۹]
مقدار دادههای جمعآوریشده از بررسیهای آسمان نجومی در طول دهه گذشته از گیگابایت به ترابایت افزایش یافته است و پیشبینی میشود که در دهه آینده به صدها پتابایت با تلسکوپ بزرگ سینوپتیک و به اگزابایت با آرایه کیلومتر مربعی افزایش یابد.[۲۰] ] این انبوهی از دادههای جدید، تحقیقات مؤثر نجومی را قادر میسازد و به چالش میکشد. بنابراین، رویکردهای جدید مورد نیاز است و تا حدی میتوان گفت به این دلیل، علم داده محور در حال تبدیل شدن به یک رشته دانشگاهی شناخته شده است. در نتیجه، نجوم و سایر رشتههای علمی در حال توسعه زیرشاخههای مبتنی بر اطلاعات و دادههای فشرده هستند تا جایی که این زیرشاخهها اکنون به رشتههای تحقیقاتی مستقل و برنامههای دانشگاهی کامل تبدیل شدهاند (یا قبلاً تبدیل شدهاند). در حالی که بسیاری از مؤسسات آموزشی از برنامههای تحقیقاتی در زمینه دادهشناسی نجومی برخوردار نیستند، چنین برنامههایی به احتمال زیاد در آینده نزدیک توسعه خواهند یافت.
انفورماتیک اخیراً به عنوان "استفاده از داده های دیجیتال، اطلاعات و خدمات مرتبط برای تحقیق و تولید دانش" تعریف شده است. با این حال تعریف معمول این حوزه بدین صورت میباشد: "انفورماتیک رشته سازماندهی، دسترسی، یکپارچه سازی و استخراج داده ها از منابع متعدد برای کشف و پشتیبانی تصمیم گیری است." بنابراین، رشته دادهشناسی نجومی شامل بسیاری از تخصصهای مرتبط با طبیعت از جمله مدلسازی داده، سازماندهی دادهها و غیره است. همچنین ممکن است شامل روشهای تبدیل و عادیسازی برای یکپارچهسازی دادهها و تجسم اطلاعات، و همچنین استخراج اطلاعات، تکنیکهای نمایهسازی، بازیابی اطلاعات و دادهکاوی باشد. پروژههای علمی شهروندی (مانند باغ وحش کهکشان) همچنین به کشف نوآوریهای بسیار ارزشمند، برچسبگذاری ویژگیها و خصوصیات اشیاء در مجموعه دادههای بزرگ نجومی کمک میکنند. همه این تخصصها در کنار مجموعههای مختلف دادههای عظیم، تحقیقات مشترک و استفاده مجدد از دادهها، امکان اکتشافات علمی در محیطهای پژوهشی و یادگیری را فراهم میکنند.
دادهشناسی نجومی یک زمینه طبیعی برای ادغام آموزش و پژوهش فراهم می کند.[۲۱] اکنون میتوان از تجربیات بدست آمده در تحقیقات انجام شده برای ایجاد و رشد علم داده استفاده کرد.[۲۲] همچنین این حوزه کاربردهای بسیار دیگری مانند استفاده مجدد از دادههای آرشیوی برای پروژههای جدید، پیوندهای ادبیات-داده، بازیابی هوشمند اطلاعات، و بسیاری موارد دیگر دارد.[۲۳]
منابع
[ویرایش]- ↑ "Largest Galaxy Proto-Supercluster Found - Astronomers using ESO's Very Large Telescope uncover a cosmic titan lurking in the early Universe". www.eso.org. Retrieved 18 October 2018.
- ↑ Astroinformatics and digitization of astronomical heritage بایگانیشده در ۲۰۱۷-۱۲-۲۶ توسط Wayback Machine, Nikolay Kirov. The fifth SEEDI International Conference Digitization of cultural and scientific heritage, May 19–20, 2010, Sarajevo. Retrieved 1 November 2012.
- ↑ Borne, Kirk D. (12 May 2010). "Astroinformatics: data-oriented astronomy research and education". Earth Science Informatics. 3 (1–2): 5–17. doi:10.1007/s12145-010-0055-2. S2CID 207393013.
- ↑ Borne, Kirk (2000). "Science User Scenarios for a Virtual Observatory Design Reference Mission: Science Requirements for Data Mining". arXiv:astro-ph/0008307.
- ↑ Borne, Kirk (2008). "Scientific Data Mining in Astronomy". In Kargupta, Hillol; et al. (eds.). Next generation of data mining. London: CRC Press. pp. 91–114. ISBN 9781420085860.
- ↑ Borne, Kirk D (2003). "Distributed data mining in the National Virtual Observatory". In Dasarathy, Belur V (ed.). Data Mining and Knowledge Discovery: Theory, Tools, and Technology V. Data Mining and Knowledge Discovery: Theory, Tools, and Technology V. Vol. 5098. pp. 211–218. doi:10.1117/12.487536. S2CID 28195520.
- ↑ Laurino, O.; D’Abrusco, R.; Longo, G.; Riccio, G. (21 December 2011). "Astroinformatics of galaxies and quasars: a new general method for photometric redshifts estimation". Monthly Notices of the Royal Astronomical Society. 418 (4): 2165–2195. arXiv:1107.3160. Bibcode:2011MNRAS.418.2165L. doi:10.1111/j.1365-2966.2011.19416.x. S2CID 7115554.
- ↑ Borne, Kirk (2009). "Astroinformatics: A 21st Century Approach to Astronomy". Astro2010: The Astronomy and Astrophysics Decadal Survey. 2010: P6. arXiv:0909.3892. Bibcode:2009astro2010P...6B.
- ↑ Borne, Kirk. "Astroinformatics in a Nutshell". asaip.psu.edu. The Astrostatistics and Astroinformatics Portal, Penn State University. Retrieved 11 January 2016.
- ↑ Feigelson, Eric. "Astrostatistics in a Nutshell". asaip.psu.edu. The Astrostatistics and Astroinformatics Portal, Penn State University. Retrieved 11 January 2016.
- ↑ Feigelson, E.; Ivezić, Ž.; Hilbe, J.; Borne, K. (2013). "New Organizations to Support Astroinformatics and Astrostatistics". Astronomical Data Analysis Software and Systems Xxii. 475: 15. arXiv:1301.3069. Bibcode:2013ASPC..475...15F.
- ↑ "Online Science". Talks by Jim Gray. Microsoft Research. Retrieved 11 January 2015.
- ↑ "Jim Gray eScience Award". Microsoft Research.
- ↑ Astroinformatics in Canada, Nicholas M. Ball, David Schade. Retrieved 1 November 2012.
- ↑ "'Astroinformatics' helps Astronomers explore the sky". Phys.org. Heidelberg University. Retrieved 11 January 2015.
- ↑ Hey, Tony (October 2009). "The Fourth Paradigm: Data-Intensive Scientific Discovery". Microsoft Research.
- ↑ Borne, Kirk (2013). "Virtual Observatories, Data Mining, and Astroinformatics". Planets, Stars and Stellar Systems. pp. 403–443. doi:10.1007/978-94-007-5618-2_9. ISBN 978-94-007-5617-5.
- ↑ Ball, N.M.; Brunner, R.J. (2010). "Data Mining and Machine Learning in Astronomy". International Journal of Modern Physics D. 19 (7): 1049–1106. arXiv:0906.2173. Bibcode:2010IJMPD..19.1049B. doi:10.1142/S0218271810017160. S2CID 119277652.
- ↑ Borne, K; Becla, J; Davidson, I; Szalay, A; Tyson, J. A; Bailer-Jones, Coryn A.L (2008). "The LSST Data Mining Research Agenda". AIP Conference Proceedings. pp. 347–351. arXiv:0811.0167. doi:10.1063/1.3059074. S2CID 118399971.
- ↑ Ivezić, Ž; Axelrod, T; Becker, A. C; Becla, J; Borne, K; Burke, D. L; Claver, C. F; Cook, K. H; Connolly, A; Gilmore, D. K; Jones, R. L; Jurić, M; Kahn, S. M; Lim, K.-T; Lupton, R. H; Monet, D. G; Pinto, P. A; Sesar, B; Stubbs, C. W; Tyson, J. A; Bailer-Jones, Coryn A.L (2008). "Parametrization and Classification of 20 Billion LSST Objects: Lessons from SDSS". AIP Conference Proceedings. AIP Conf. Proc. Vol. 1082. pp. 359–365. arXiv:0810.5155. doi:10.1063/1.3059076. S2CID 117914490.
- ↑ Borne, Kirk (2009). "The Revolution in Astronomy Education: Data Science for the Masses". Astro2010: The Astronomy and Astrophysics Decadal Survey. 2010: P7. arXiv:0909.3895. Bibcode:2009astro2010P...7B.
- ↑ "Using Data in the Classroom". Science Education Resource Center at Carleton College. National Science Digital Library. Retrieved 11 January 2016.
- ↑ Borne, Kirk. Astroinformatics: Data-Oriented Astronomy (PDF). George Mason University, USA. Retrieved January 21, 2015.