Behavioral Finance Meets Data Analytics: Predicting Market Trends with Sentiment Analysis and Information Theory
Thesis
Η παρούσα διπλωματική εργασία εξετάζει τη συμβολή της Συμπεριφορικής Χρηματοοικονομικής και της Ανάλυσης Δεδομένων στην πρόβλεψη των τάσεων των χρηματοπιστωτικών αγορών, με έμφαση στην ανάλυση συναισθήματος (Sentiment Analysis) και στην εφαρμογή της Θεωρίας Πληροφορίας (Information Theory). Βασικός στόχος είναι η αξιολόγηση της αποτελεσματικότητας συνδυαστικών μοντέλων που ενσωματώνουν συναισθηματικά και πληροφοριακά χαρακτηριστικά. Η μεθοδολογία περιλαμβάνει τη συλλογή και επεξεργασία δεδομένων τιμών μετοχών και σχετικών ειδήσεων για την περίοδο 2022–2024 (εκπαίδευση) και το πρώτο εξάμηνο του 2025 (δοκιμή). Η ανάλυση επικεντρώνεται σε έξι τεχνολογικές μετοχές: Apple (AAPL), Microsoft (MSFT), Nvidia (NVDA), Tesla (TSLA), Meta (META) και Amazon (AMZN). Χρησιμοποιήθηκαν τέσσερα μοντέλα μηχανικής μάθησης: Logistic Regression, Random Forest, XGBoost και Support Vector Machines (SVM). Η αξιολόγηση πραγματοποιήθηκε με χρήση των δεικτών Accuracy, Precision, Recall και F1-score, καθώς και μέσω confusion matrices και ανάλυσης της σημασίας των χαρακτηριστικών. Τα αποτελέσματα ανέδειξαν το μοντέλο SVM ως το καλύτερο συνολικά, καταγράφοντας τη μεγαλύτερη ακρίβεια (0.769) και F1-score (0.696), καθώς και την υψηλότερη επίδοση σε recall (0.717). Το Random Forest κατέγραψε σταθερές αποδόσεις σε όλους τους δείκτες, με αξιοσημείωτη ισορροπία μεταξύ precision και recall, ενώ το Logistic Regression υστέρησε. Η προσθήκη του ημερήσιου δείκτη συναισθήματος FinBERT και της εντροπίας Shannon ενίσχυσε σημαντικά την προγνωστική ικανότητα όλων των μοντέλων. Συμπερασματικά, η εργασία αναδεικνύει την αξία μιας πολυδιάστατης προσέγγισης που συνδυάζει στοιχεία ψυχολογίας, ανάλυσης συναισθήματος και θεωρίας πληροφορίας στην πρόβλεψη αγοραστικών τάσεων. Τονίζεται η ανάγκη για περαιτέρω έρευνα σε υβριδικά μοντέλα που θα ενισχύσουν την προγνωστική ισχύ έναντι της πολυπλοκότητας και της αβεβαιότητας των χρηματοπιστωτικών αγορών.