Customer Segmentation and Behavior Prediction in Energy Using Clustering and Predictive Analytics
ENGLISH ABSTRACT The liberalization of the electricity market and the increasing availability of smart meter consumption data have intensified competition among energy providers and created a strong need for effective customer behavior understanding. Energy companies are required to identify high-risk customers early and implement targeted retention strategies. This thesis proposes an integrated analytical framework for customer segmentation and behavior prediction in the low-voltage electricity sector using machine learning techniques. Initially, RFM analysis is applied to extract behavioral features, followed by customer clustering using the K-Means algorithm. Cluster quality is evaluated using the Elbow and Silhouette methods, while churn rate differences across customer groups are examined. Subsequently, predictive models including Logistic Regression and Random Forest are developed to estimate churn probability, addressing class imbalance through the SMOTE technique. The results demonstrate that combining segmentation with predictive analytics significantly improves the identification of high-risk customers and enables interpretation of the factors associated with customer attrition. Furthermore, incorporating customer segments into prediction models enhances their business applicability. The proposed approach supports the development of targeted retention strategies, optimization of pricing policies, and the transition of energy companies toward data-driven decision making.
Thesis
Η απελευθέρωση της αγοράς ηλεκτρικής ενέργειας και η αυξανόμενη διαθεσιμότητα δεδομένων κατανάλωσης από έξυπνους μετρητές έχουν εντείνει τον ανταγωνισμό μεταξύ παρόχων και την ανάγκη για αποτελεσματική κατανόηση της συμπεριφοράς των πελατών. Οι εταιρείες ενέργειας καλούνται να εντοπίζουν εγκαίρως πελάτες υψηλού κινδύνου αποχώρησης και να προσαρμόζουν στοχευμένες στρατηγικές διαχείρισης και διατήρησης. Η παρούσα διπλωματική εργασία προτείνει ένα ολοκληρωμένο αναλυτικό πλαίσιο τμηματοποίησης και πρόβλεψης συμπεριφοράς πελατών ηλεκτρικής ενέργειας χαμηλής τάσης, αξιοποιώντας τεχνικές μηχανικής μάθησης. Αρχικά εφαρμόζεται ανάλυση RFM για την εξαγωγή χαρακτηριστικών συμπεριφοράς και στη συνέχεια πραγματοποιείται ομαδοποίηση πελατών με τον αλγόριθμο K-Means. Η ποιότητα των συστάδων αξιολογείται με τις μεθόδους Elbow και Silhouette, ενώ εξετάζεται η διαφοροποίηση του ποσοστού αποχώρησης ανά ομάδα πελατών. Στο επόμενο στάδιο αναπτύσσονται προγνωστικά μοντέλα Logistic Regression και Random Forest για την εκτίμηση της πιθανότητας αποχώρησης, λαμβάνοντας υπόψη το πρόβλημα ανισορροπίας κλάσεων μέσω της τεχνικής SMOTE. Τα αποτελέσματα δείχνουν ότι ο συνδυασμός τμηματοποίησης και προγνωστικής ανάλυσης βελτιώνει σημαντικά την ικανότητα εντοπισμού πελατών υψηλού κινδύνου και επιτρέπει την ερμηνεία των χαρακτηριστικών που σχετίζονται με τη διακοπή συνεργασίας. Επιπλέον, η ενσωμάτωση των ομάδων πελατών στα μοντέλα πρόβλεψης ενισχύει τη χρηστικότητα των αποτελεσμάτων για επιχειρησιακή αξιοποίηση. Η προτεινόμενη προσέγγιση συμβάλλει στην ανάπτυξη στοχευμένων στρατηγικών διατήρησης πελατών, στη βελτιστοποίηση τιμολογιακών πολιτικών και στη μετάβαση των ενεργειακών εταιρειών σε μοντέλα λειτουργίας βασισμένα σε δεδομένα.
