ΓΛΩΣΣΑ ΠΟΛΙΤΙΚΗ ΠΟΜΑΚΙΚΑ ΤΡΑΓΟΥΔΙΑ ΜΕΙΟΝΟΤΙΚΗ ΕΚΠΑΙΔΕΥΣΗ ΦΩΤΟΓΡΑΦΙΕΣ ΙΣΤΟΡΙΑ ΠΟΜΑΚΩΝ ΠΟΜΑΚΙΚΟ ΔΕΛΤΙΟ ΕΙΔΗΣΕΩΝ ΠΟΜΑΚΟΧΩΡΙΑ ΞΑΝΘΗΣ ΒΙΝΤΕΟ ΔΗΜΟΣΙΑ ΕΚΠΑΙΔΕΥΣΗ ΑΡΘΡΑ ΣΤΟΝ ΤΥΠΟ ΓΛΑΥΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ ΠΟΜΑΚΙΚΑ ΠΑΡΑΜΥΘΙΑ ΣΜΙΝΘΗ ΠΟΛΙΤΙΣΤΙΚΟΣ ΣΥΛΛΟΓΟΣ ΠΟΜΑΚΩΝ ΘΡΑΚΗ ΕΚΔΗΛΩΣΕΙΣ ΔΗΜΑΡΙΟ ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΜΥΚΗ ΜΑΘΗΜΑΤΑ ΠΟΜΑΚΙΚΗΣ ΠΟΙΗΣΗ ΜΕΙΟΝΟΤΗΤΑ ΓΙΟΡΤΕΣ ΕΧΙΝΟΣ ΕΚΠΑΙΔΕΥΤΙΚΟ ΥΛΙΚΟ ΕΚΛΟΓΕΣ ΙΣΤΟΡΙΑ ΛΑΟΓΡΑΦΙΑ ΩΡΑΙΟΝ ΚΙΜΜΕΡΙΑ ΜΑΝΤΑΙΝΑ ΕΞΙΣΛΑΜΙΣΜΟΣ ΠΟΜΑΚΩΝ ΠΡΟΣΗΛΙΟ ΠΕΤΡΙΝΑ ΓΕΦΥΡΙΑ ΠΟΜΑΚΟΙ ΠΡΟΞΕΝΕΙΟ ΘΕΡΜΕΣ ΜΕΤΑΦΡΑΣΕΙΣ ΣΑΤΡΕΣ ΤΑΥΤΟΤΗΤΑ ΤΕΜΕΝΗ ΧΑΡΤΕΣ ΚΟΤΥΛΗ ΟΙΚΟΝΟΜΙΑ ΤΟΠΩΝΥΜΙΑ ΦΥΣΗ ΑΣΚΥΡΑ ΚΕΝΤΑΥΡΟΣ ΚΟΜΟΤΗΝΗ ΜΟΥΦΤΕΙΑ ΠΑΡΟΙΜΙΕΣ ΠΑΧΝΗ ΣΥΝΕΔΡΙΑ ΛΙΒΑΔΙ ΑΡΧΑΙΟΛΟΓΙΑ ΚΑΤΑΓΩΓΗ ΜΑΓΕΙΡΙΚΗ ΣΥΝΕΝΤΕΥΞΕΙΣ ΑΛΜΑ ΒΟΥΛΓΑΡΙΚΗ ΡΟΔΟΠΗ ΘΡΗΣΚΕΙΑ ΚΑΛΟΤΥΧΟ ΝΕΡΟΜΥΛΟΙ ΓΟΡΓΟΝΑ ΚΕΧΡΟΣ ΛΕΞΙΚΟΓΡΑΦΙΑ ΟΙΚΟΛΟΓΙΑ ΠΑΝΕΛΛΗΝΙΟΣ ΣΥΛΛΟΓΟΣ ΠΟΜΑΚΩΝ ΑΙΜΟΝΙΟ ΑΝΘΡΩΠΙΝΑ ΔΙΚΑΙΩΜΑΤΑ ΑΡΘΡΑ ΙΕΡΟΔΙΔΑΣΚΑΛΟΙ ΙΣΛΑΜ ΚΑΘΗΜΕΡΙΝΗ ΖΩΗ ΚΟΤΙΝΟ ΚΥΚΝΟΣ ΜΕΔΟΥΣΑ ΜΗΤΡΙΚΗ ΓΛΩΣΣΑ MYKH ΑΝΑΠΤΥΞΗ ΔΗΜΟΓΡΑΦΙΑ ΕΘΙΜΑ ΕΘΝΟΛΟΓΙΑ ΕΙΔΗΣΕΙΣ ΕΚΚΛΗΣΙΕΣ ΕΝΔΥΜΑΣΙΑ ΕΡΑΝΟΣ ΘΕΟΤΟΚΟΣ ΚΑΡΔΑΜΟΣ ΚΕΝΤΡΟ ΠΟΜΑΚΙΚΩΝ ΕΡΕΥΝΩΝ ΚΟΤΑΝΗ ΛΙΒΑΣ ΜΕΛΙΒΟΙΑ ΜΟΥΣΙΚΗ ΜΠΕΚΤΑΣΙΣΜΟΣ ΟΝΟΜΑΤΑ ΠΑΡΑΔΟΣΙΑΚΟΙ ΧΟΡΟΙ ΠΟΡΤΑ ΡΕΥΜΑ ΡΟΜΑ ΡΟΥΣΣΑ ΣΥΛΛΟΓΟΣ ΠΟΜΑΚΩΝ ΓΛΑΥΚΗΣ ΣΥΝΘΗΚΗ ΛΩΖΑΝΝΗΣ ΤΟΥΡΙΣΜΟΣ ΧΛΟΗ ΑΙΩΡΑ ΑΚΡΑΙΟΣ ΑΛΙΚΟΧΩΡΙ ΑΝΕΚΔΟΤΑ ΒΑΚΟΥΦΙΑ ΒΑΣΙΛΙΚΑ ΓΕΩΡΓΙΑ ΓΙΑΛΙΣΤΕΡΟ ΔΡΑΣΤΗΡΙΟΤΗΤΕΣ ΕΚΔΡΟΜΕΣ ΕΚΚΛΗΣΙΑΣΜΟΙ ΕΠΙΣΚΕΨΕΙΣ ΖΑΓΑΛΙΣΑ ΖΑΦΕΙΡΙΟ ΖΟΥΜΠΟΥΛΙ ΖΩΓΡΑΦΙΚΗ ΘΕΑΤΡΟ ΚΑΠΝΟΚΑΛΛΙΕΡΓΕΙΑ ΚΕΤΙΚΙΟ ΚΙΔΑΡΙΣ ΚΙΡΡΑ ΚΟΥΖΙΝΑ ΚΤΗΝΟΤΡΟΦΙΑ ΛΟΓΟΤΕΧΝΙΑ ΜΕΓΑΛΟΧΩΡΙ ΜΕΤΑΝΑΣΤΕΥΣΗ ΜΥΡΤΙΣΚΗ ΝΗΠΙΑΓΩΓΕΙΑ ΝΤΟΚΙΜΑΝΤΕΡ ΟΔΟΙΠΟΡΙΚΟ ΟΡΓΑΝΗ ΠΕΛΕΚΗΤΟ ΠΛΑΓΙΑ ΠΡΙΟΝΙ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΠΡΟΣΕΥΧΕΣ Πάχνη ΡΥΜΗ ΣΕΛΕΡΟ ΣΙΔΗΡΟΧΩΡΙ ΣΙΡΟΚΟ ΣΟΥΝΙΟ ΣΥΝΤΑΓΕΣ ΣΩΣΤΗΣ ΤΑΞΙΔΙΑ ΤΕΜΕΝΟΣ ΤΟΥΡΚΙΑ ΥΔΡΟΧΩΡΙ ΥΠΟΥΡΓΕΙΟ ΕΞΩΤΕΡΙΚΩΝ ΥΦΑΝΤΟΥΡΓΙΑ ΧΡΥΣΟ

Κυριακή, 31 Αυγούστου 2014

Ηλεκτρονικός συλλαβιστής για τα πομάκικα (PomLex Hyphenator)


ΑΝΑΔΗΜΟΣΙΕΥΣΗ ΑΠΟ ΤΟ
POMLEX.COM

Παρασκευή, 1 Νοεμβρίου 2013

PomLex Hyphenator (Optimized)

Με μια απλή αντικατάσταση του map container της STL (Standard Template Library) με το unordered_map του TR1 (C++ Technical Report 1),  που ενσωματώθηκε πρόσφατα στη C++11, καθώς και κάποιες μικροδιορθώσεις  στον κώδικα, με την απομάκρυνση κυρίως κάποιων "πλεονασμών", κατάφερα να διπλασιάσω σχεδόν την ταχύτητα του συλλαβιστή PomLex.

Ο συλλαβισμός 97.000 λέξεων (159.000 μεμονωμένων συλλαβισμών) σε σώμα κειμένου με 160.000 λέξεις επιτυγχάνεται μόλις σε 1,2 δευτερόλεπτα, ταχύτητα που θα ζήλευαν ακόμα και εμπορικά πακέτα συλλαβιστών γραμμένα από επαγγελματίες προγραμματιστές.

Για να έχετε μια τάξη μεγέθους, με έναν πρόχειρο υπολογισμό που έκανα, αυτό μεταφράζεται σε κείμενο 330 περίπου σελίδων μεγέθους Α4 με πλήρη στοίχιση (προεπιλεγμένα περιθώρια – 2,54 εκ. κατακόρυφα και 3,17 εκ. οριζόντια), μονό διάστημα γραμμής και γραμματοσειρά Andika 12 στιγμών.

Μετά απ’ αυτό νομίζω πως δεν χρειάζεται να το «σκαλίσω» άλλο το πράγμα, ούτε να «εκμηδενίσω» τους χρόνους είναι στις προθέσεις μου.  Και πώς θα μπορούσε, εξάλλου, να γίνει κάτι τέτοιο;  Ένας μελλοντικός στόχος όμως θα ήταν η ενσωμάτωση του συστήματος συλλαβισμού, μαζί με κάποιον «ορθογράφο» ίσως, σε κάποιον δημοφιλή, ανοιχτού κώδικα κατά προτίμηση, επεξεργαστή κειμένου, είτε ως πρόσθετο είτε απ’ ευθείας στο σώμα του πηγαίου κώδικα.

Οι αριθμοί που εμφανίζονται στις εικόνες είναι, βεβαίως, ενδεικτικοί, καθώς η ίδια η ταχύτητα του υπολογιστή παίζει καθοριστικό ρόλο.  Οι μετρήσεις έγιναν σε διπύρηνο μηχάνημα με επεξεργαστή Intel Core 2 6400 στα 2.13 GHz με 2 GB RAM και λειτουργικό σύστημα Windows 7 (32-bit)

Ο συλλαβιστής θα μπορούσε να συλλαβίσει κείμενο σε οποιαδήποτε σχεδόν γλώσσα του κόσμου (με κάποια επιφύλαξη για τα σύνθετα συστήματα γραφής, όπως Κινέζικα, Αραβικά, Εβραϊκά κλπ.) με τους κατάλληλους κώδικες συλλαβισμού.



Κι εδώ ένα στιγμιότυπο με τον συλλαβιστή PomLex να τρέχει σε ένα τετραπύρηνο turbo laptop με επεξεργαστή Intel Core i7-3630QM στα 2.40 GHz με 16GB RAM σε λειτουργικό Windows 8 (64-bit).  Η διαφορά στην ταχύτητα είναι σοκαριστική.




ΠΗΓΗ: Pomlex



ΣΥΓΓΡΑΦΕΑΣ ΤΟΥ ΠΑΡΑΠΑΝΩ ΚΕΙΜΕΝΟΥ Ο ΠΟΜΑΚΟΣ ΛΕΞΙΚΟΓΡΑΦΟΣ
 ΡΙΤΒΑΝ ΚΑΡΑ-ΧΟΤΖΑ

Ο Ριτβάν Καραχότζα γεννήθηκε στις 15/9/1973 στην Ξάνθη. Είναι απόφοιτος της Ειδικής Παιδαγωγικής Ακαδημίας Θεσσαλονίκης (διετούς φοιτήσεως) και από το 2008 εργάζεται στο χώρο της μειονοτικής εκπαίδευσης. Από τα φοιτητικά του χρόνια (δύο δεκαετίες περίπου) στον ελεύθερο χρόνο του ασχολείται με την καταγραφή και κωδικοποίηση της μητρικής τους γλώσσας, της Πομακικής.  Παράλληλα, σε ερασιτεχνικό επίπεδο και για τις ανάγκες του λεξικού κυρίως, ασχολείται και με τους υπολογιστές γενικότερα και τον προγραμματισμό ειδικότερα (html, xml,asp, asp.net, php, vb.net, c++, sql). Κατά τη διάρκεια της στρατιωτικής του θητείας και στα πλαίσια του προγράμματος της Κοινωνικής Προσφοράς των Ενόπλων Δυνάμεων εργάστηκε μαζί με μια ομάδα φιλολόγων και συστρατιωτών του για τη σύνταξη του Πομακικού – Ελληνικού Λεξικού, του Ελληνικού – Πομακικού Λεξικού, της Γραμματικής και του Συντακτικού της Πομακικής Γλώσσας, τα οποία εκδόθηκαν από το Δ’ Σώμα Στρατού υπό τη Διοίκηση του Στρατηγού Μανούσου Παραγιουδάκη. Εκτός από την Πομακική και την Ελληνική, γνωρίζει λίγα Βουλγαρικά, λίγα Τουρκικά και κατανοεί κάποια γραπτά Αγγλικά. Προτού διοριστεί στο Δημόσιο έχει εργαστεί στον τραπεζικό τομέα (υπάλληλος στην πρώην Εθνική Κτηματική Τράπεζα της Ελλάδος), στον κατασκευαστικό (εργάτης οικοδόμος, βοηθός τοπογράφου) και στον τομέα της τυπογραφίας. Είναι παντρεμένος και πατέρας τεσσάρων παιδιών.