Μελέτη και υλοποίηση αλγορίθμων τεχνητής νοημοσύνης για την επεξεργασία φυσικής γλώσσας
ENGLISH ABSTRACT Natural language processing is a rapidly growing branch of artificial intelligence that deals with the interaction of computers and humans and the computer's ability to recognize human (natural) language, weather in written or oral form. This ability is of great importance to businesses because a large part of all the unstructured data generated by the internet is in natural language. Natural language processing research combines more than one science, such as computer science, linguistics, psychology etc. This paper’s aim is to study and present some of the most well-known natural language processing algorithms, after first implementing them from scratch in the Python programming language. It should be emphasized that no NLP library was used since the ultimate purpose of this thesis is, as mentioned above, the in-depth study of various algorithms but also the further learning of the Python language.
Thesis
Η επεξεργασία της φυσικής γλώσσας είναι ένας ραγδαία αναπτυσσόμενος κλάδος της τεχνητής νοημοσύνης που ασχολείται με την αλληλεπίδραση των υπολογιστών και ανθρώπων και την ικανότητα του υπολογιστή να αναγνωρίσει την ανθρώπινη (φυσική) γλώσσα, είτε αυτή είναι σε γραπτή μορφή είτε σε προφορική. Η ικανότητα αυτή είναι μεγάλης σημασίας για επιχειρήσεις γιατί ένα μεγάλο μέρος όλων των αδόμητων δεδομένων που δημιουργεί το διαδίκτυο είναι στην φυσική γλώσσα. Η έρευνα στην επεξεργασία φυσικής γλώσσας συνδυάζει περισσότερες από μία επιστήμες, όπως η επιστήμη των υπολογιστών, η γλωσσολογία, η ψυχολογία κλπ. Στόχος της εργασίας είναι να μελετήσει και να παρουσιάσει κάποιους από τους πιο γνωστούς αλγόριθμους της επεξεργασίας φυσικής γλώσσας, αφού πρώτα γίνει η, από το μηδέν υλοποίηση τους στην προγραμματιστική γλώσσα Python. Να τονισθεί ότι δεν χρησιμοποιήθηκε καμία βιβλιοθήκη που υπάρχει στο διαδίκτυο μιας και ο απώτερος σκοπός της παρούσας διατριβής είναι, όπως προαναφέρθηκε η μελέτη σε βάθος διαφόρων αλγόριθμων αλλά και παράλληλα η περαιτέρω εκμάθηση της γλώσσας Python.