Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/9642
Title: Χρήση τεχνικών εξόρυξης από κείμενο (text mining) στον εντοπισμό κύριων τάσεων σε σύνολο κειμένων : εφαρμογή στον εντοπισμό κύριων ερευνητικών πεδίων στο σύνολο των ερευνητικών έργων του ΕΛΚΕ του Πανεπιστημίου Πατρών
Other Titles: Use of technical mining from text (text mining) in identifying the main trends in total text : application in identifying main research fields in all research projects of the special account for research funds of the University of Patras
Authors: Αγγελόπουλος, Κωνσταντίνος
Keywords: Εξόρυξη γνώσης
Εξόρυξη κειμένου
Ομαδοποίηση
Αλγόριθμοι
Keywords (translated): Data mining
Text mining
Clustering
Algorithms
Abstract: Τα τελευταία χρόνια με την ανάπτυξη του παγκόσμιου ιστού, των ψηφιακών βιβλιοθηκών και των βάσεων δεδομένων έχει δημιουργηθεί ένα τεράστιο πρόβλημα συσσώρευσης μεγάλου όγκου κειμένων και πληροφοριών. Το φαινόμενο αυτό έχει απασχολήσει πάρα πολλούς χρήστες που προσπαθούν να εξαγάγουν γρήγορα και εύκολα χρήσιμες πληροφορίες από μεγάλες συλλογές κειμένων. Η δυσκολία έγκειται στην αδυναμία επεξεργασίας όλης αυτής της διαθέσιμης πληροφορίας και των μεγάλων κειμενικών πόρων με απώτερο σκοπό την αδυναμία εξαγωγής χρήσιμων ή νέων γνώσεων και συμπερασμάτων. Προκειμένου να αντιμετωπισθεί το παραπάνω πρόβλημα, έχουν αναπτυχθεί αρκετές τεχνικές για την οργάνωση, την ανάλυση και την εξαγωγή νέας γνώσης από μεγάλους όγκους κειμένων. Μία από αυτές τις τεχνικές είναι η εξόρυξη γνώσης από κείμενα (Text Mining). Μία από τις σημαντικότερες μεθόδους της εξόρυξης γνώσης από κείμενα (Text Mining) είναι η ομαδοποίηση, η οποία ως σκοπό έχει την οργάνωση μεγάλου όγκου κειμένων σε ομάδες (clusters) βάση ορισμένων κριτηρίων ομοιότητας, βοηθώντας καθοριστικά στην ανάλυσή τους και στην εξαγωγή νέων γνώσεων από αυτά. Σκοπός της παρούσας μεταπτυχιακής εργασίας είναι η συλλογή των ερευνητικών προγραμμάτων από την Επιτροπή Ερευνών (ΕΛΚΕ) του Πανεπιστημίου Πατρών και η εφαρμογή της τεχνικής εξόρυξης γνώσης από κείμενα (Text Mining) με απώτερο σκοπό την εξαγωγή συμπερασμάτων για το ποια είναι τα κύρια ερευνητικά πεδία του Πανεπιστημίου Πατρών. Πιο αναλυτικά στο πρώτο κεφάλαιο γίνεται μία σύντομη ανασκόπηση σχετικά με την εξόρυξη γνώσης από κείμενα (Text Mining) και περιγράφονται οι στόχοι, οι μέθοδοι και τα εργαλεία που χρησιμοποιεί. Στο δεύτερο κεφάλαιο παρουσιάζεται η διαδικασία προ-επεξεργασίας των κειμένων καθώς και ο τρόπος αναπαράστασης αυτών. Στο τρίτο κεφάλαιο περιγράφονται η διαδικασία της ομαδοποίησης, σημαντικοί αλγόριθμοι ομαδοποίησης και διάφορα μέτρα ομοιότητας. Στο τέταρτο κεφάλαιο περιγράφεται η διαδικασία συλλογής και προ-επεξεργασίας των ερευνητικών προγραμμάτων καθώς επίσης και η εφαρμογή του λογισμικού Text Mining, QDA Miner, σε συνδυασμό με το λογισμικό ανάλυσης περιεχομένου, Wordstat, προκειμένου τα εν λόγω ερευνητικά προγράμματα να ομαδοποιηθούν σε ομάδες (clusters) με απώτερο σκοπό την εξαγωγή κατάλληλων συμπερασμάτων, ώστε να αποφανθεί όπως προαναφέραμε, ποια είναι τα κύρια ερευνητικά πεδία του Πανεπιστημίου Πατρών. Η εν λόγω εργασία κλείνει με την ανάλυση των αποτελεσμάτων και τις προτάσεις για μελλοντική έρευνα.
Abstract (translated): In recent years with the development of the Web, digital libraries and databases has created a huge problem accumulation of large volumes of text and information. This phenomenon has occupied too many users trying to quickly and easily extract useful information from large text collections. The difficulty lies in the inability of all processing of this information available and large textual resources with the aim of export weakness or useful new knowledge and conclusions. To address the above problem, we have developed several techniques for organizing, analyzing and export of new knowledge from large volumes of text. One of these techniques is the extraction of knowledge from texts (Text Mining). One of the most important methods of knowledge extraction from text (Text Mining) is a grouping, which aim is the large volume organize text into groups (clusters) based on certain similarity criteria, helping decisively in their analysis and to draw new knowledge from these. The purpose of this postgraduate thesis is the collection of research projects by the Research Committee of the University of Patras and the application of the technique of extraction of knowledge from texts (Text Mining) with the aim of drawing conclusions as to what the main research fields of the University of Patras. More detail in the first chapter gives a brief overview on the mining of texts (Text Mining) and describes the objectives, methods and tools used. The second chapter presents the process of text preprocessing and how such representation. The third chapter describes the process of clustering, significant clustering algorithms and various similarity measures. The fourth chapter describes the process of collection and pre-processing of research programs as well as the software application Text Mining, QDA Miner, combined with content analysis software, Wordstat, so that these research projects be grouped into groups (clusters) with the ultimate purpose of enabling appropriate conclusions, in order to rule as mentioned above, what are the main research fields of the University of Patras. This paper ends with an analysis of the results and suggestions for future research.
Appears in Collections:Τμήμα Διοίκησης Επιχειρήσεων (ΜΔΕ)



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.