Μελέτη μεθόδων τεχνητής νοημοσύνης για τη πρόβλεψη χρονοσειρών θαλάσσιας επιφανειακής θερμοκρασίας και εφαρμογή στο Βόρειο Αιγαίο
ENGLISH ABSTRACT Most of our planet is covered by sea. Sea surface temperature (SST) plays a crucial role in the balance of the environment. SST prediction as accurate as possible is extremely important for timely response to the negative effects of climate change and beyond. This study focuses on modern data-driven artificial intelligence technologies for producing SST predictive models. To map previous research for this topic, the PRISMA guidelines were adopted and a literature review of 27 publications was conducted. From these, it emerged that the research community is turning its interest to models based mostly on LSTM and CNN neural networks for SST forecasting. The predictive ability of the models is evaluated with error indicators (such as RMSE, MAE, MAPE, etc.) and the results of the relevant literature are presented aggregated. To conduct the experimental procedure, the problem was defined as a prediction problem of future SST time series values, and an LSTM network was developed with the Python programming language. In this context, almost 41 years of daily satellite data (25/08/1981 to 16/05/2022) for a point in the North Aegean, were extracted from the reprocessing and optimal interpolation MED-REP-L4 product of the Copernicus Marine Service and used for training and testing the experimental model. The experimental model was tested over a total of nearly six years in one-day ahead forecasting, making use of the previous twelve. The results showed that the proposed model has satisfactory accuracy compared to the previous related research, with a total RMSE error of 0.453°C and an MAE of 0.315°C. Its performance, was further compared with two models based on statistical techniques and two machine learning models, for the same dataset. From the comparative results, it emerges that even in a shallow architecture of a hidden layer, created in the context of this work, the proposed LSTM model yields better values in all error indices than the rest of the models, without being significantly different, but demonstrating highly predictable performance, thus laying a strong foundation for its ability and further improvement
Thesis
Το μεγαλύτερο μέρος του πλανήτη μας, καλύπτεται από θάλασσα. Η θερμοκρασία της επιφάνειας της θάλασσας (SST), κατέχει καίριο ρόλο στην ισορροπία του περιβάλλοντος. Η όσο το δυνατόν πιο ακριβής πρόβλεψη SST, είναι εξαιρετικά σημαντική για την έγκαιρη ανταπόκριση στις αρνητικές επιπτώσεις της κλιματικής αλλαγής και όχι μόνο. Η παρούσα μελέτη, εστιάζει στους σύγχρονους τεχνολογικούς τρόπους της τεχνητής νοημοσύνης, που βασίζονται σε δεδομένα, για την παραγωγή προγνωστικών μοντέλων της SST. Για την χαρτογράφηση των προηγούμενων ερευνών στο θέμα αυτό, υιοθετήθηκαν οι κατευθυντήριες γραμμές του προτύπου PRISMA και διενεργήθηκε η βιβλιογραφική ανασκόπηση 27 δημοσιεύσεων. Από αυτές, προέκυψε ότι η ερευνητική κοινότητα στρέφει το ενδιαφέρον της, σε μοντέλα που βασίζονται στα νευρωνικά δίκτυα LSTM και CNN ως επί το πλείστων για την πρόβλεψη SST. Η προγνωστική ικανότητα των μοντέλων αξιολογείται με δείκτες σφάλματος (όπως RMSE, ΜΑΕ, MAPE κ.α.) και τα αποτελέσματα της σχετικής βιβλιογραφίας παρουσιάζονται συγκεντρωτικά. Για τη διεξαγωγή της πειραματικής διαδικασίας, το πρόβλημα ορίστηκε ως πρόβλημα πρόβλεψης μελλοντικών τιμών χρονοσειράς SST και αναπτύχθηκε ένα δίκτυο LSTM με την γλώσσα προγραμματισμού Python. Στο πλαίσιο αυτό, ημερήσια δορυφορικά δεδομένα σχεδόν 41 ετών (25/08/1981 έως 16/05/2022) για σημείο του Βορείου Αιγαίου, αντλήθηκαν από το προϊόν επανεπεξεργασίας και βέλτιστης παρεμβολής MED-REP-L4 του Copernicus Marine Service και χρησιμοποιήθηκαν για την εκπαίδευση και δοκιμή του πειραματικού μοντέλου. Το πειραματικό μοντέλο δοκιμάστηκε συνολικά σε σχεδόν έξι χρόνια στην πρόβλεψη μιας ημέρας, κάνοντας χρήση των προηγούμενων δώδεκα. Τα αποτελέσματα έδειξαν, ότι το προτεινόμενο μοντέλο έχει ικανοποιητική ακρίβεια σε σχέση με τις προηγούμενες σχετικές έρευνες, με συνολικό σφάλμα RMSE 0,453°C και MAE 0,315°C. Η απόδοση του συγκρίθηκε επιπλέον, με δύο μοντέλα που βασίζονται σε στατιστικές τεχνικές και δύο μηχανικής μάθησης, για το ίδιο σύνολο δεδομένων. Από τα συγκριτικά αποτελέσματα, προκύπτει ότι ακόμη και σε μια ρηχή αρχιτεκτονική ενός κρυφού επιπέδου, που δημιουργήθηκε στα πλαίσια της παρούσας εργασίας, το προτεινόμενο μοντέλο LSTM αποδίδει καλύτερες τιμές σε όλους τους δείκτες σφάλματος σε σχέση με τα υπόλοιπα μοντέλα, χωρίς όμως να διαφέρουν σημαντικά, αλλά καταδεικνύοντας την εξαιρετικά υπολογίσιμη απόδοση, θέτοντας έτσι ισχυρά θεμέλια για την ικανότητά του και την περαιτέρω βελτίωσή του.