Αξιοποίηση Μεγάλων Δεδομένων για Επιχειρηματική Ανάλυση: Βελτιστοποίηση των Διαδικασιών Λήψης Αποφάσεων

Παπαδόπουλος, Παναγιώτης (2025-01)

Thesis

Τα μεγάλα δεδομένα αναφέρονται στον όγκο δομημένων και μη δομημένων στοιχείων που παράγουν οι άνθρωποι και οι μηχανές και σε αυτά μπορεί να περιλαμβάνονται οι αναρτήσεις στα κοινωνικά δίκτυα, τα δεδομένα αισθητήρων, οι οικονομικές συναλλαγές και κάθε είδος κατάσταση που παράγει στοιχεία. Τα μεγάλα δεδομένα είναι σημαντικά για τις επιχειρήσεις, καθώς παρέχουν ανεκτίμητες γνώσεις και πληροφορίες που ενισχύουν σημαντικά τις διαδικασίες λήψης αποφάσεων. Επηρεάζουν διάφορες πτυχές μιας επιχείρησης, από τις στρατηγικές δέσμευσης πελατών έως τη διαχείριση αποθεμάτων. Η μελέτη των τεχνικών βελτιστοποίησης έδειξε ότι η διαχείριση και η επεξεργασία των μεγάλων δεδομένων από τους οργανισμούς έχει συντελέσει στην αποδοτικότερη λειτουργία των οργανισμούς σε πολλούς τομείς. Τεχνικές όπως η κατάτμηση δεδομένων είναι ζωτικής σημασίας για μεγάλης κλίμακας κατανεμημένα συστήματα, απαιτώντας προσεκτική σχεδίαση για αποφυγή ανισορροπίας. Επίσης η διαχείριση ευρετηρίων και μεταδεδομένων είναι αποτελεσματική για συχνές ερωτήσεις, αλλά απαιτεί τακτική συντήρηση για να διατηρηθεί επεκτάσιμη αλλά και η επεξεργασία στη μνήμη είναι ιδανική για αναλύσεις σε πραγματικό χρόνο, αν και περιορίζεται από τους διαθέσιμους πόρους μνήμης. Η ανάλυση μεγάλων δεδομένων επέτρεψε στους οργανισμούς να χειρίζονται τεράστια σύνολα δεδομένων και να αποκαλύπτουν πολύτιμες πληροφορίες που προηγουμένως ήταν ανέφικτες λόγω υπολογιστικών περιορισμών. Η ανάλυση δεδομένων είναι η διαδικασία εξέτασης συνόλων δεδομένων για την εξαγωγή συμπερασμάτων σχετικά με τις πληροφορίες που περιέχουν και ο πρωταρχικός στόχος της ανάλυσης δεδομένων είναι η υποστήριξη της λήψης αποφάσεων με την παροχή αξιοποιήσιμων πληροφοριών. Οι τρεις κύριοι τύποι μοντέλων ανάλυσης δεδομένων είναι η περιγραφική, η προγνωστική και η συντακτική ανάλυση, καθένας από τους οποίους εξυπηρετεί έναν μοναδικό σκοπό και παρέχει διαφορετικές γνώσεις. Εργαλεία όπως το Apache Hadoop και το Apache Spark εστιάζουν στην επεξεργασία μεγάλων δεδομένων, ενώ τεχνολογίες όπως το Amazon Lambda και το Google Cloud Functions προσανατολίζονται σε serverless υπολογιστικά μοντέλα. Οι προαναφερθείσες μεθοδολογίες και τεχνικές συντελούν στην βελτιστοποίηση της λήψης τεκμηριωμένων και επαληθευμένων αποφάσεων με στόχο την ανάπτυξη της επιχείρησης.