Χρήση δεδομένων από κοινωνικά δίκτυα για ανάλυση και πρόβλεψη ακραίων καιρικών φαινομένων: Συστηματική Ανασκόπηση

Αδαμάρας, Βασίλειος (2025-06)

Thesis

Η παρούσα διπλωματική εργασία αποτελεί μια συστηματική ανασκόπηση της διεθνούς βιβλιογραφίας σχετικά με τη χρήση δεδομένων από κοινωνικά δίκτυα και ειδικότερα από το Twitter/X για την ανάλυση και πρόβλεψη ακραίων καιρικών φαινομένων. Μεταξύ 2020-2025 εντοπίστηκαν 47 μελέτες, οι οποίες συλλέχθηκαν και αξιολογήθηκαν με το πρωτόκολλο PRISMA, βάσει σαφών κριτηρίων ένταξης και αποκλεισμού. Η μεθοδολογία ακολουθεί μικτή προσέγγιση, συνδυάζοντας ποσοτική σύγκριση μετρικών με ποιοτική θεματική σύνθεση των ερευνητικών κενών. Τα αποτελέσματα δείχνουν εκθετική αύξηση του ερευνητικού ενδιαφέροντος μετά το 2020, με κορύφωση το 2023. Οι πλημμύρες αποτελούν το συχνότερο αντικείμενο (32%), ακολουθούμενες από τροπικούς κυκλώνες, καύσωνες, πυρκαγιές και κατολισθήσεις. Η γεωγραφική κάλυψη παραμένει άνιση, καθώς τα περισσότερα tweets προέρχονται από αστικά κέντρα ανεπτυγμένων χωρών, αφήνοντας αγροτικές περιοχές και φαινόμενα, όπως η ξηρασία υπο-εκπροσωπούμενα. Μία μερίδα μελετών συνδυάζει τα κοινωνικά δεδομένα με δορυφορικές ή αισθητηριακές πηγές, ενισχύοντας την εγκυρότητα των ευρημάτων. Σε τεχνολογικό επίπεδο, τα κλασικά μοντέλα SVM και Random Forest χρησιμοποιούνται για γρήγορο φιλτράρισμα, όμως οι καλύτερες επιδόσεις επιτυγχάνονται με σύγχρονα μοντέλα βαθιάς μάθησης, BERT, transformers και υβριδικά δίκτυα κειμένου-εικόνας, αυξάνοντας την ακρίβεια ανάκτησης κρίσιμων πληροφοριών και αιτημάτων βοήθειας. Παράλληλα υιοθετούνται αρχιτεκτονικές Μεγάλα Δεδομένα (Big Data) pipelines μέσω χρήσης εργαλείων, όπως το Spark και το Hadoop για επεξεργασία σε πραγματικό χρόνο. Οι κύριοι άξονες εφαρμογής περιλαμβάνουν έγκαιρη ανίχνευση συμβάντων, αυτόματη εξαγωγή αιτημάτων διάσωσης, εκτίμηση ζημιών υποδομών και σε ποσοστό 30%, ανάλυση συναισθήματος για αποτύπωση ψυχοκοινωνικού αντίκτυπου. Παρά τα οφέλη, αναδεικνύονται σοβαρές προκλήσεις όπως υψηλός «θόρυβος» και σαρκασμός στα σύντομα μηνύματα, περιορισμένος γεωεντοπισμός (<2%), αλγοριθμικές μεροληψίες και ζητήματα ιδιωτικότητας των χρηστών. Η επισκόπηση επισημαίνει επίσης την έλλειψη κοινών προτύπων αξιολόγησης, καθώς μόνον το 42% των μελετών δημοσιοποιεί ανοικτά τα σύνολα δεδομένων και τον κώδικα. Τέλος, υπογραμμίζεται η ανάγκη συνεχούς επικύρωσης των προβλέψεων σε συνεργασία με τις τοπικές αρχές πολιτικής προστασίας, ώστε οι αλγοριθμικές εξαγωγές και τα αποτελέσματα να μετατρέπονται άμεσα σε επιχειρησιακές αποφάσεις. Συνολικά, τα κοινωνικά δίκτυα μπορούν να λειτουργήσουν ως συμπληρωματικός «αισθητήρας των πολιτών» για έγκαιρη προειδοποίηση και εκτίμηση επιπτώσεων. Η εργασία εισηγείται (α) ανάπτυξη πολυτροπικών, ερμηνεύσιμων μοντέλων AI, (β) ενοποίηση των κοινωνικών δικτυών με δορυφορικά και IoT δεδομένα, (γ) ανοικτά σύνολα δεδομένων και (δ) διεπιστημονική συνεργασία επιστημόνων, μετεωρολόγων και νομικών, ενισχυμένη από καμπάνιες ενημέρωσης των πολιτών