Ποιο είναι το πρόγραμμα ABBYY FineReader 12. Πώς λειτουργεί: FineReader

Αυτή τη φορά θα σας πω πώς να μετατρέψετε έγγραφα χαρτιού στο Ηλεκτρονική προβολή Μορφή pdf, καθώς και ένα έγγραφο χαρτιού για μεταφορά στον υπολογιστή για να αλλάξει το κείμενο. Έτσι, ας ξεκινήσουμε.
Έχω ένα έγγραφο χαρτιού στα χέρια μου.

Σάρωση σε PDF.

Εργασία: Μεταφορά στον υπολογιστή (μεταφράστε σε ηλεκτρονική μορφή) Αυτό το έγγραφο. Επιπλέον, πρέπει να κάνετε με τέτοιο τρόπο ώστε να είναι αδύνατο να το αλλάξετε στο μέλλον (περίπου να μιλάτε για να κάνετε μια φωτογραφία του εγγράφου). Στη συνέχεια, αυτό το ηλεκτρονικό έγγραφο πρέπει να σταλεί μέσω ταχυδρομείου στη διεύθυνση ηλεκτρονικού ταχυδρομείου. Επιπλέον, ο πελάτης ζητά Μορφή pdf.

Πρότυπα:
1) Χάω το έγγραφο μέσω του σαρωτή
2) Αποθήκευση της προκύπτουσας εκτύπωσης σε μορφή PDF στον υπολογιστή σας.
3) Στέλνω το ληφθέν αρχείο μέσω ταχυδρομείου
Στη δουλειά μου, χρησιμοποιώ 2 προγράμματα για την επίλυση μιας τέτοιας εργασίας:
Foxit phantom ή ABBYY FineReader.. Για κατανόηση, εφαρμόζω τα στιγμιότυπα οθόνης:
Στο Foxit Phantom, όταν ενεργοποιηθεί ο σαρωτής, πρέπει να επιλέξετε το αρχείο PDF-Create PDF-από το σαρωτή στο κύριο μενού ...
Θα εμφανιστεί η σάρωση και μια πρόταση για την αποθήκευση του αρχείου. Επιλέξτε μια θέση που γράφει το όνομα του αρχείου και αποθηκεύστε.

Στο ABBYY FineReader, υπάρχουν τεράστια κουμπιά στη γραμμή εργαλείων. Ένας από αυτούς ονομάζεται σαρωμένος σε PDF. Το χρησιμοποιούμε.

Εάν πρέπει να σαρώσετε ένα έγγραφο πολλαπλών σελίδων, σύμφωνα με τα στάδια:
1) Πατήστε το κουμπί στο Number 1 Σάρωση

Παίρνουμε ένα σαρωμένο έγγραφο

Συγκεντρώμαστε επίσης μια άλλη σελίδα (κάντε ξανά κλικ στο κουμπί στο Number 1 Scan).
2) Αποθηκεύουμε στο PDF



Ως αποτέλεσμα, έχουμε ένα έτοιμο έγγραφο πολλαπλών σελίδων με τη μορφή αρχείου PDF.

Τώρα Αυτό το αρχείο Μπορείτε να στείλετε ένα μήνυμα ηλεκτρονικού ταχυδρομείου.

Αναγνωρίζοντας το κείμενο

Εργασία: Μεταφράστε ένα έγγραφο χαρτιού σε ηλεκτρονική μορφή (στον υπολογιστή)

Πρότυπα:
1) Σάρωση (κουμπί 1 σάρωση)

2) Αναγνώριση (κουμπί 2 για να αναγνωρίσετε όλα)

Αναγνώριση Πρέπει να καταλάβετε πώς η διαδικασία της μετάφρασης φωτογραφιών (εικόνες) στο κείμενο (γράμματα, αριθμούς, σημεία). Εάν φωτογραφήσατε μια σελίδα κειμένου, στη συνέχεια, μετά την αναγνώριση, το 99% του κειμένου με το χαρτί μετατρέπεται σε ηλεκτρονικό κείμενο. Το ηλεκτρονικό κείμενο μπορεί ήδη να αλλάξει στον υπολογιστή όπως θέλετε.

3) Εξοικονόμηση επεξεργαστής κειμένου (4 Κουμπί αποθήκευσης)
Σας συμβουλεύω να επιλέξετε να μεταφέρετε όλες τις σελίδες στο Microsoft Word

Λαμβάνω

Θα ήθελα να επισημάνω Σημαντικές στιγμές Με τη διαδικασία αναγνώρισης. Υπάρχουν αποχρώσεις κατά την εργασία.
Αμέσως μετά την αναγνώριση, σας συμβουλεύω να εξετάσετε το αποτέλεσμα. Ειδικά στα μπλοκ που δημιουργεί το πρόγραμμα FineAder.

Αυτές είναι περιοχές που διατίθενται σε ένα ορθογώνιο πλαίσιο. Τα πλαίσια είναι διαφορετικά χρώματα. Εάν το κόκκινο χρώμα τότε αυτό το μπλοκ αναγνωρίζεται ως εικόνα. Εάν το μαύρο χρώμα είναι το κείμενο. Μπλοκ είναι διαφορετικών τύπων. Ο τύπος μπλοκ μπορεί να βρεθεί κάνοντας κλικ στο δεξί κουμπί του ποντικιού και επιλέγοντας αλλαγή του τύπου μπλοκ.

Μικρό τέχνασμα: Μπορείτε να επιλέξετε μια αυθαίρετη περιοχή και να επισημάνετε οποιοδήποτε τύπο μπλοκ. Για παράδειγμα, επιλέξτε το τμήμα του κειμένου που είναι κακώς αναγνωρισμένο χρησιμοποιώντας το αριστερό πλήκτρο του ποντικιού (πιέσεις, κρατήστε και τραβήξτε, το πλαίσιο αλλάζει το μέγεθος).

Ως αποτέλεσμα, το έγγραφο στο Word θα έχει ένα μπλοκ κειμένου και μια εικόνα μπλοκ. Η εικόνα μπλοκ θα έχει μια απολύτως αμετάβλητη προβολή. Αυτή τη μέθοδο Χρησιμοποιώ κατά την εξοικονόμηση σφραγίδων, Μη τυποποιημένες γραμματοσειρές, εικόνες, φωτογραφίες.

PS: γνώσεις και δεξιότητες για να συνεργαστείτε με το PDF, τη σάρωση και την αναγνώριση εγγράφων πολύ συχνά αποσυνδεδεμένα στην εργασία γραφείου. Γνώση - Αποθηκεύει το χρόνο σας!

Ορισμός της δομής του εγγράφου

Το ABBYY FineReader παρουσιάζει μια επαναστατική νέα προσέγγιση για την αναγνώριση εγγράφων. Τώρα το έγγραφο αναλύεται και επεξεργάζεται εξ ολοκλήρου και δεν δημοσιεύτηκε, ο οποίος επιτρέπει στον τελικό δελτίο να κατανοεί τέτοια στοιχεία της εσωτερικής δομής του ως την κορυφή και την κορυφή και Κατώτατα υποσέλιδα, υποσημειώσεις, υπογραφές για εικόνες και διαγράμματα, στυλ, γραμματοσειρές κλπ. Τα στοιχεία του εγγράφου πηγής αποκαθίστανται στο προκύπτον έγγραφο. Για παράδειγμα, κατά την αποταμίευση λέξεων, τα άνω και τα κάτω υποστήματα, οι υποσημειώσεις αναπαράγονται ως κατάλληλα αντικείμενα στο Word.

Εξαιρετική ποιότητα αναγνώρισης και ακριβής σχεδιασμός

Το σύστημα οπτικής αναγνώρισης ABBYY FineReader αναγνωρίζει με ακρίβεια και διατηρεί πλήρως τον αρχικό σχεδιασμό οποιουδήποτε εγγράφου (συμπεριλαμβανομένου του κειμένου στο παρασκήνιο των εικόνων, με έγχρωμο κείμενο σε έγχρωμο φόντο, με ροή για σχέδια κειμένου κλπ.)

Αναγνώριση πολυγλωσσικών εγγράφων

Το ABBYY FineReader αναγνωρίζει τα έγγραφα σε 188 γλώσσες, συμπεριλαμβανομένων των ρωσικών, αγγλικών, γερμανικών, γαλλικών, ισπανικών, ιταλικών, σουηδικών, φινλανδικών, βουλγαρικών, ουγγρικών, σλοβακίας, τσεχικής, Μπασκίρ, Λευκορωσίας, Καζακν, Κινέζικα, ουκρανικά, κλπ. Το κείμενο του εγγράφου μπορεί να καταρτιστεί σε δύο ή περισσότερες γλώσσες. Ο χρήστης μπορεί να καθορίσει τη γλώσσα αναγνώρισης του για κάθε μπλοκ τύπου ή για κάθε κυτταρικό κύτταρο.

Ευφυής αναγνώριση εγγράφων PDF

Όπως γνωρίζετε, ορισμένα αρχεία PDF περιέχουν το λεγόμενο στρώμα κειμένου και τα περιεχόμενά του ενδέχεται να μην συμμορφώνονται πλήρως με το έγγραφο ορατό στην οθόνη. FineReader Προ-αναλύει τα περιεχόμενα του αρχείου και για κάθε μπλοκ κειμένου κάνει μια λύση: να το αναγνωρίσετε ή να αφαιρέσετε το αντίστοιχο κείμενο από το στρώμα κειμένου. Έτσι, είναι δυνατόν να αυξηθεί η ποιότητα της αναγνώρισης και η μείωση του χρόνου επεξεργασίας.

Αναγνώριση ψηφιακών φωτογραφιών των εγγράφων

Τώρα για αναγνώριση, δεν είναι απαραίτητο να εξοπλίσετε τον υπολογιστή με τον σαρωτή. Το ABBYY FineReader σάς επιτρέπει να αναγνωρίσετε φωτογραφίες εγγράφων που έγιναν από μια ψηφιακή φωτογραφική μηχανή (συνιστάται η χρήση ψηφιακής φωτογραφικής μηχανής με ανάλυση μήτρας 4 mpix και υψηλότερη).

Υπάρχουν πολλές περιπτώσεις όταν είναι πιο βολικό να χρησιμοποιήσετε τη φωτογραφική μηχανή για να χρησιμοποιήσετε την κάμερα, αντί του σαρωτή. Για παράδειγμα, κατά τη διάρκεια μιας επιχειρηματικής συνάντησης έξω από το γραφείο, όταν αναγνωρίζετε σημάδια ή διαφημίσεις, στη βιβλιοθήκη, ειδικά όταν εργάζεστε με παχιά ή παλιά βιβλία. Για να μην αναφέρουμε το γεγονός ότι η ψηφιακή φωτογραφική μηχανή λειτουργεί πολλές φορές πιο γρήγορα από οποιονδήποτε σαρωτή.

Αναγνώριση υπερσύνδεσμος

Αυτά τα έγγραφα μπορούν να αποθηκευτούν στο Microsoft Word, PDF και HTML Formats. Επιπλέον, σε αναγνωρισμένο κείμενο μπορείτε να προσθέσετε τις δικές σας υπερσυνδέσεις.

Όταν αναγνωρίζετε τα αρχεία PDF, εκτός από τους εξωτερικούς συνδέσμους, η εσωτερική (σε άλλες σελίδες του ίδιου εγγράφου) αποκαθίσταται.

Αναγνώριση οθόνης

Ο αναγνώστης οθόνης ABBYY περιλαμβάνεται στο πακέτο συστήματος. Αυτό είναι ένα απλό Ι. Βολική εφαρμογή Σχεδιασμένο για να αναγνωρίζει το κείμενο από οποιαδήποτε περιοχή οθονών. Abbyy screenshot αναγνώστη μεταφράζεται σε κείμενο επεξεργάσιμης μορφής που δεν μπορούν να αντιγραφούν Στη συμβατική μέθοδο - Μηνύματα συστήματος, επιγραφές σε κυλίνδρους flash κ.λπ. Και τα δύο αναγνωρισμένα στιγμιότυπα κειμένου και οθόνης μπορούν να αποθηκευτούν ως αρχείο ή να μεταφερθούν στο πρόχειρο.

Αναγνώριση γραμμωτού κώδικα

Το ABBYY FineReader υποστηρίζει αναγνώριση γραμμωτού κώδικα, συμπεριλαμβανομένου του δισδιάστατου τύπου PDF-417.

Ιστορία Το ABBYY FineReader ήταν πάνω από 20 χρόνια. Η εταιρεία επετείου 2013 σημείωσε την απελευθέρωση του πλήρους (σε σύγκριση με το Express Edition από το 2009) ABBYY FINEREADER PRO για Mac, και μετά από δύο μήνες, τον Φεβρουάριο του 2014, έλαβε το "δώρο" του και Χρήστες των Windows - ABBYY FineReader 12 Επαγγελματίας και Εταιρείας. Επιτρέψτε μου να σας υπενθυμίσω ότι η προηγούμενη έκδοση εμφανίστηκε το 2011, και δυόμισι χρόνια πολύς χρόνος - ας καταλάβουμε πόσο σημαντικές αλλαγές είναι.

γενικές πληροφορίες

Οι απαιτήσεις συστήματος για τη νέα έκδοση δεν άλλαξαν εντελώς. Η πλατφόρμα μπορεί να εξυπηρετήσει τα παράθυρα ή Windows Server Ξεκινώντας από το XP και το 2003, αντίστοιχα. Ερώματα υλικού στις τρέχουσες ώρες και είναι μέτρια μέτρια: ένας επεξεργαστής οποιουδήποτε bit με συχνότητα 1 GHz, μνήμη τυχαίας προσπέλασης Όχι λιγότερο από 1 GB συν 512 MB ανά υπολογισμό πυρήνα κλπ. Πολλοί αύξησαν μόνο την ανάγκη για χώρο στο δίσκο - τώρα δεν απαιτείται να εγκαταστήσετε 700 και 850 MB (συν, ακόμα 700 MB για τα αρχεία εργασίας).

Φυσικά, είναι περίπου Ελάχιστες απαιτήσεις; Όλοι οι επαγγελματικές δυνατότητες ABBYY 12 θα αποκαλυφθούν μόνο σε σχετικά σύγχρονα συστήματα. Συγκεκριμένα, σας υπενθυμίζω ότι το πρόγραμμα μπορεί να παραδώσει αποτελεσματικά την επεξεργασία μεμονωμένων σελίδων, χρησιμοποιεί όλους τους πυρήνες του επεξεργαστή και φορτώνει οποιονδήποτε επεξεργαστή κατά σχεδόν 100%. Αλλά δεν είναι πραγματικά άπληστοι για το RAM, και ακόμη και 32-bit παραμένει.

Η διαδικασία εγκατάστασης δεν έχει αλλάξει: το ελάχιστο των ερωτήσεων και των επιλογών. Συμπεριλαμβάνεται με τον ABBYY FineReader 12 Professional, υπάρχει ακόμα συσκευή ανάγνωσης οθόνης ABBYY, το οποίο γίνεται αποτελεσματικό μόνο μετά την εγγραφή του χρήστη.

Μετά από αυτό, η πρόσβαση στην τεχνική υποστήριξη θα ανοίξει επίσης.

Ακόμη και με βάση αυτές τις μέτριες πληροφορίες, μπορεί να θεωρηθεί ότι έχουμε το αποτέλεσμα της εξέλιξης. Κατά συνέπεια, στο μέλλον επικεντρωθώ στην περιγραφή των αλλαγών σε σύγκριση με Προηγούμενη έκδοσηπου μπορεί να χωριστεί σε δύο κύριες ομάδες: εργασία με το πρόγραμμα (διεπαφή, Βοηθητικά εργαλεία, χρηστικότητα) και OCR (ποιότητα και απόδοση της ίδιας της αναγνώρισης).

Εργασία με το πρόγραμμα

Το ABBYY FineReader 12 Professional δείχνει κάποια βελτίωση στη διεπαφή χρήστη. Αυτό είναι αμέσως αξιοσημείωτο στο παράθυρο εργασιών που ανοίγει από προεπιλογή όταν ξεκινήσει το πρόγραμμα. Προφανώς μιμείται την έννοια των πλακιδίων των Windows 8.x και προσαρμόζεται για τον έλεγχο των δακτύλων, ειδικά επειδή το πρόγραμμα υποστηρίζει επίσης τις κύριες χειρονομίες όπως η κύλιση και η κλιμάκωση. Στην πραγματικότητα, οι αλλαγές που επηρεάζονται μόνο η "πρόσοψη" και ακόμη και εν μέρει - δίπλα στα πλακάκια είναι δίπλα στους συνήθεις ελέγχους και στη διαδικασία διαμόρφωσης οποιουδήποτε σεναρίου θα πρέπει να αντιμετωπίσει τα τυποποιημένα παράθυρα διαλόγου. Η συνεργασία μαζί τους είναι αρκετά προβληματική, ειδικά σε 8-10 οθόνες, οι οποίες γίνονται δημοφιλείς με τα δισκία των Windows.

Για να υποβάλετε ότι ο χρήστης ενός τέτοιου tablet που είναι εφοδιασμένος με την κάμερα μπορεί να θελήσει γρήγορα "εν κινήσει" για να εισαγάγει κάποιο είδος τυπωμένου εγγράφου, πραγματικά εύκολο. Εν τω μεταξύ, τα πάντα Ιστορία των WindowsΑπό την πρώτη έκδοση του Tablet PC, επιβεβαιώνει την σημασία της προσαρμογής στον έλεγχο αφής της τυπικής διεπαφής επιφάνειας εργασίας. Προφανώς, για τους σκοπούς αυτούς, είναι πολύ πιο σωστό να δημιουργηθεί ένα ειδικό κέλυφος που αντιστοιχεί σε όλους τους κανόνες του μετρό, αλλά χρησιμοποιώντας τον ίδιο "κινητήρα". Ένα παράδειγμα αυτής της λύσης είναι ο Internet Explorer από τα Windows 8.x. Επιπλέον, η ABBYY έχει ακόμη κάποια πλάτη με τη μορφή της ABBYY FineReader Touch για τα Windows 8, η οποία χρησιμοποιεί την υπηρεσία Cloud της εταιρείας.

Εάν αποσπάστε την αποσπά την είσοδο αφής, τότε εξακολουθούν να υπάρχουν αλλαγές στην κατηγορία αυτή - από την πλήρη αναμενόμενη ενημέρωση των παραθύρων ανοίγματος / συντήρησης, τα οποία, μεταξύ άλλων, παρέχουν εύκολη πρόσβαση στο Αποθήκευση σύννεφων (Εάν υπάρχει ένας κατάλληλος παράγοντας και φάκελος στο σύστημα), μέχρι αρκετά πιο σημαντικά και χρήσιμα.

Επεξεργασία σελίδας στο ABBYY FineReader 12 Professional τώρα εκτελείται στο παρασκήνιο. Αυτό συνεπάγεται την απουσία του πρώτου modal παράθυρο Με την κατάσταση των λειτουργιών (τώρα ο ρόλος αυτός αναπαράγεται από τη συμβολοσειρά κατάστασης στο κάτω μέρος της οθόνης) και, κατά συνέπεια, τη διαθεσιμότητα πρόσβασης στη διεπαφή. Έτσι, ο χρήστης έχει τη δυνατότητα να συνεργαστεί με το πρόγραμμα παράλληλα με τη διαδικασία αναγνώρισης (εάν είναι σίγουρα αρκετό καιρό), για παράδειγμα, αντιγράψτε τα θραύσματα του προκύπτοντος κειμένου ή ακόμα και να προσαρμόζουν τη σήμανση των σελίδων - το τελευταίο θα είναι στο ουρά και επεξεργασία.

Σε αντίθεση με την προηγούμενη έκδοση, δεν απενεργοποιεί επίσης τις σελίδες όπως αναγνωρίζεται ή όταν ξεκινήσει το έγγραφο, εάν η αυτόματη αναγνώριση είναι απενεργοποιημένη. Στο ABBYY FineReader 12 Professional, το έγγραφο φορτώνεται και χωρίζεται σε σελίδες σχεδόν αμέσως, και τα σκίτσα τους είναι χτισμένα μόνο καθώς μετακινούνται χειροκίνητα στο αριστερό παράθυρο. Μεταξύ άλλων, εξοικονομούν υπολογιστικούς πόρους και, αρκετά αισθητή σε μεγάλα έγγραφα πολλαπλών σελίδων.

Οι υπόλοιπες αλλαγές στην κατηγορία αυτή δεν είναι τόσο ενδιαφέρουσες, αν και μπορούν να έρθουν σε εύχρηστα σε μερικά σενάρια, έτσι ώστε να είναι σύντομα γι 'αυτούς.

Εάν δεν χρειάζεται να επεξεργαστείτε το έγγραφο εξ ολοκλήρου, αλλά μόνο για να παραθέσετε μεμονωμένα μέρη, τότε μπορείτε να απενεργοποιήσετε όλες τις αυτόματες λειτουργίες και να επιλέξετε τα απαραίτητα θραύσματα οποιωνδήποτε τύπων, να τα αντιγράφετε αμέσως στο πρόχειρο - με την ανάλυση και την αναγνώριση θα πραγματοποιηθεί επάνω η μύγα.

Για να αποκτήσετε ένα αποτέλεσμα με μια απλούστερη δομή από το πρωτότυπο, μπορείτε να απενεργοποιήσετε τη συμφιλίωση των υποσημειώσεων, των υποσημειώσεων και άλλων στοιχείων διάταξης. Αυτό μπορεί να είναι χρήσιμο, για παράδειγμα, κατά την προετοιμασία ηλεκτρονικών βιβλίων.

Συνεχίζοντας σχετικά με τα ηλεκτρονικά βιβλία - ABBYY FineReader 12 Professional υποστηρίζει μορφές EPUB 2.0.1 και 3.0.

Οι παράμετροι μετατροπής στο XLSX επεκτείνονται, για παράδειγμα, έχει τη δυνατότητα να καθαρίζει τη μορφοποίηση ή την αποθήκευση εικόνων.

Κατά την αποθήκευση των προκύπτοντων εγγράφων στο PDF με ένα στρώμα κειμένου, μπορείτε τώρα να χρησιμοποιήσετε τη νέα τεχνολογία ABBYY Precial Scan, η οποία είναι να εξομαλύνετε τους χαρακτήρες στις εικόνες αρχικών σελίδων. Διατίθεται, παρεμπιπτόντως, μόνο σε λειτουργία χρώματος.

Η επίδραση της δουλειάς της είναι επαρκής αξιοσημείωτη, αν και όχι πάντα, να πω, "ακαδημαϊκό". Ωστόσο, η αναγνωσιμότητα των εξομαλυνόμενων χαρακτήρων σε κάθε περίπτωση πρέπει να είναι υψηλότερη και μέσα Αυτό το παράδειγμα Το πρωτότυπο είναι πραγματικά πολύ χαμηλής ποιότητας.


Ocr

Τώρα ας ασχοληθούμε με ποιες βελτιώσεις σημειώθηκαν στους ίδιους τους μηχανισμούς αναγνώρισης.

Οι προγραμματιστές αναφέρουν το επόμενο στάδιο βελτίωσης της τεχνολογίας ADRT, η οποία, υπενθυμίζει, αναλύει και αναδημιουργεί τη λογική δομή του εγγράφου. Δηλώνεται ότι άρχισε να λειτουργεί πολύ πιο ακριβής, ειδικά με πίνακες, καταλόγους, διαγράμματα. Επιδείξτε αυτά τα επαρκή παραδείγματα δεν είναι τόσο απλή, αλλά όχι αδύνατη. Εδώ, για παράδειγμα, τα αποτελέσματα αναγνώρισης (με προεπιλεγμένες ρυθμίσεις) της ίδιας σελίδας στο ABBYY FineReader 11 Professional (στην κορυφή) και ABBYY FineReader 12 Professional (κάτω).


Η παλιά έκδοση που διατίθεται και επεξεργάστηκε μόνο το κύριο μπλοκ κειμένου, πιθανώς λόγω της χαμηλής ποιότητας του πρωτοτύπου, εξετάστε τα υπόλοιπα στοιχεία "σκουπίδια". Νέο, αντίθετα, εντοπίστηκε σωστά τον κατάλογο και προσπάθησε να το αναδημιουργήσει. Το αποτέλεσμα, ωστόσο, δεν είναι ιδανικό: το γεγονός ότι δεν μπορούν να αναγνωριστούν όλοι οι δείκτες, και πάλι, που αποδίδονται στην ποιότητα της εικόνας, αλλά το πρόγραμμα, προφανώς, ακόμα δεν κατάλαβε ότι θα ήταν μπροστά από αυτό, αλλιώς, αλλιώς δεν θα ερμηνεύσει τους αριθμούς ως γράμματα. Παρ 'όλα αυτά, η πρόοδος αφορά τα πιο ποιοτικά πρωτότυπα τέτοιων καταγγελιών, μπορεί να μην ήταν.

Αλλά πώς ο πίνακας "σιωπηλός" επεξεργάζεται χωρίς διαχωριστικές γραμμές - ABBYY FineReader 11 επαγγελματίας (στην κορυφή) και ABBYY FineReader 12 Professional (παρακάτω).


Είναι σαφώς δει ότι η παλιά έκδοση, σε αντίθεση με το νέο, δεν έβλεπε τη δομή του πίνακα και περιορίστηκε σε ένα σύνολο μη συνδεδεμένων μπλοκ κειμένου. Μην είστε τεμπέλης για να κάνετε κλικ στις εικόνες και να συγκρίνετε τα αποτελέσματα αναγνώρισης - ABBYY FineReader 12 Professional είναι κοντά στο ιδανικό.

Δυστυχώς, δεν συμβαίνει πάντα και ήδη στις γειτονικές σελίδες του ABBYY FineReader 12 Professional έδειξε αποτελέσματα παρόμοια με την ABBYY FineReader 11 Professional. Αν και το ADRT θα πρέπει να παρακολουθεί τα ίδια "καπάκια" και να καταλάβει ότι μπροστά του ένα είδος ρέοντος πίνακα.

Αλλά εξακολουθεί να είναι σαφώς αξιοσημείωτο ότι οι ενημερωμένοι αλγόριθμοι δίνουν προσοχή σε περισσότερες λεπτομέρειες από ό, τι νωρίτερα. Στη διαδικασία δοκιμής παρατηρήθηκε το ABBYY FineReader 12, για παράδειγμα, ακόμη και μια προσπάθεια ερμηνείας ως πίνακας με ταξινομημένη τοποθέτηση πληροφοριών κειμένου σε αυτό. Πολύ πιο συχνά επίσης μια νέα έκδοση προσπαθεί να αναδημιουργήσει διάφορα διαγράμματα και συστήματα με βάση το Ιστορικόόχι από μεμονωμένα γραφικά και μπλοκ κειμένου.

Υπάρχουν μερικά ακόμη νέα προϊόντα που έχουν σχεδιαστεί για να ενισχύσουν την ποιότητα επαγγελματικής αναγνώρισης της ABBYY 12. Όπως γνωρίζετε, μία από τις προϋποθέσεις για αυτό είναι η ποιότητα του πρωτοτύπου, ειδικά αν ληφθεί χρησιμοποιώντας μη σαρωτή, αλλά κάμερες. Αυτός είναι ο λόγος για τον οποίο εμφανίστηκαν σε ένα μέσο προ-επεξεργασίας πρωτότυπων. Στη νέα έκδοση, η λίστα τους έχει επεκταθεί, κόβοντας κατά μήκος των άκρων σελίδων, φωτισμού και ευθυγράμμισης της φωτεινότητας του φόντου, αφαίρεση των χρωμάτων αντικειμένων. Το τελευταίο μπορεί να είναι χρήσιμο, για παράδειγμα, για την επεξεργασία εγγράφων με σφραγίδες και σφραγίδες. Επιπλέον, τώρα ο χρήστης μπορεί να συνδεθεί Διάφορες μέθοδοι Μεμονωμένα.

Η γλωσσική υποστήριξη βελτιώνεται επίσης. Πρώτον, το ρωσικό αλφάβητο εμφανίστηκε με το άγχος, δεύτερον, δηλώνει αύξηση της ποιότητας της αναγνώρισης των κινεζικών, ιαπωνικών και κορεατικών (έως και 20%), αραβικά (έως και 60%), εβραϊκά (έως και 10%) - Αυτό επιτυγχάνεται, προφανώς, βελτιώνοντας και πρόσθετα ταξινομητές κατάρτισης.

Λοιπόν, τέλος, ένα από τα πιο καύσιμα ζητήματα για πολλούς αναγνώστες: εάν έχει αναπτυχθεί η ταχύτητα του προγράμματος; Είναι λογικό να απαντήσετε σε αυτή την ερώτηση, ειδικά με τους αριθμούς, όχι τόσο απλές - πάρα πολλές γλώσσες, καθένα από τα οποία έχει τις δικές του αποχρώσεις. Πολύ μεγάλη ποικιλία πρωτοτύπων. Πάρα πολλοί άγνωστοι παράγοντες επιρροής στο έργο αλγορίθμων. Επομένως, ακόμη και οι ίδιοι οι προγραμματιστές είναι πολύ συγκρατημένοι για την απόδοση της ABBYY FineReader 12 επαγγελματικές επιδόσεις κατά 10-15%.

Τέτοιοι αριθμοί λαμβάνονται συνήθως από τα αποτελέσματα της επεξεργασίας επαρκώς μεγάλων συστοιχιών εγγράφων και, κατά συνέπεια, είναι κάτι σαν τη "μέση θερμοκρασία στο νοσοκομείο". Επομένως, είναι χρήσιμο λεπτομερέστερα τυχόν περιπτώσεις επίδειξης, για παράδειγμα, παρόμοια με τα δύο που ακολουθούν:

  • Σαρωμένο σε χρώμα με ανάλυση 300 DPI 10 σελίδες ενός φυλλαδίου μορφής πλήρους χρώματος A4. Ποιότητα Καλή, Γλώσσες Ρωσικά και Αγγλικά, Συγκρότημα Mock?
  • PDF με γραφικές εικόνες 138 σελίδων ενός βιβλίου που περιέχει ένα μικρό αριθμό χρωμάτων και ασπρόμαυρων απεικονίσεων, αρκετοί πίνακες. Η ποιότητα είναι χαμηλή (ξεκινώντας, προφανώς, με την "τυφλή" εκτύπωση σε ένα χαρτί βιβλίο), τις γλώσσες της Ουκρανίας και της Ρωσίας, μια απλή διάταξη.

Και τα δύο έγγραφα αναγνωρίστηκαν σε λειτουργία χρώματος και το δεύτερο είναι επίσης σε μαύρο και άσπρο, ο οποίος προοριζόταν να μιμηθεί τη διαδικασία παρασκευής Ηλεκτρονικό βιβλίο. Όλες οι προεπιλεγμένες ρυθμίσεις αφέθηκαν αμετάβλητες, με εξαίρεση το σύνολο των γλωσσών και, κατά συνέπεια, λειτουργικές λειτουργίες. Ως δοκιμαστικό πολύγωνο, ένας υπολογιστής με επεξεργαστή I5-3450 και χρησιμοποιήθηκε 8 GB μνήμης. Τα αποτελέσματα παρουσιάζονται στον ακόλουθο πίνακα:

Όπως μπορεί να φανεί, για επιτάχυνση του PDF ακόμη και υπερβαίνει το υποσχεμένο 15% - ίσως, είναι μόνο μία από τις ειδικές περιπτώσεις που είναι καλά κατάλληλες για τις τελευταίες βελτιστοποιήσεις σε αλγορίθμους αναγνώρισης. Πρέπει να ληφθεί υπόψη ότι τα προγράμματα, γενικά μιλώντας, έχουν κάνει διαφορετικό ποσό εργασίας. Κοιτάξτε τουλάχιστον την απεικόνιση πάνω από την επεξεργασία των πινάκων - είναι δύσκολο να πούμε ποια από τις εκδόσεις έπρεπε να είναι πιο δύσκολη.

Όσον αφορά τον αριθμό των σφαλμάτων, συμπίπτει σχεδόν και στις δύο εκδόσεις, αν και ήταν αισθητή που μερικές φορές αμφιβολίες προκαλούν διαφορετικά θραύσματα και σύμβολα - φαίνεται να αποδεικνύουν αλγορίθμους κατάρτισης. Σε κάθε περίπτωση, οι περισσότεροι από τους αβέβαιους αναγνωρισμένους χαρακτήρες εντοπίστηκαν σωστά χρησιμοποιώντας λεξικά και τα "χονδροειδή" σφάλματα (η εσφαλμένη ερμηνεία ειδικών και διακοσμητικών συμβόλων, κειμένου στο διάγραμμα κ.λπ.) συμπίπτουν. Έτσι η διαφορά μπορεί να θεωρηθεί ότι εξαφανίζεται.

Ένα άλλο ερώτημα είναι πόσο η αύξηση της απόδοσης είναι γενικά σημαντική; Προφανώς, τα κέρδη είναι μισή λεπτό σε 138 σελίδες που πρέπει να ελέγχονται ούτως ή άλλως και μπορεί να διορθωθούν, υπάρχει λίγο αξίζει τον κόπο. Εάν οι εργασίες παρόμοιες με τις εργασίες δοκιμής υποτίθεται ότι διεξάγονται σε περίπτωση, τότε η απόδοση μπορεί να μην ανησυχεί με ακρίβεια. Ένα άλλο πράγμα είναι, αν πρόκειται για την επεξεργασία εκτός σύνδεσης μεγάλων ποσοτήτων εγγράφων, η οποία είναι διαθέσιμη στο ABBYY FineReader 12 Corporate. Σε αυτή την περίπτωση, η εξοικονόμηση του 15% του χρόνου είναι ήδη αρκετά αισθητή.

Περίληψη

Παρά το γεγονός ότι η νέα ABBYY FineReader 12 Professional δεν υπόσχονται τίποτα επαναστατικό, τουλάχιστον μερικές αλλαγές που αξίζει όλα αυτά αξίζει όλα τα είδη έπαινο. Πρώτα απ 'όλα, πρόκειται για μια ενίσχυση της τεχνολογίας ADRT όσον αφορά την αναγνώριση πίνακα, τα διαγράμματα και γενικά λογική δομή Σελίδες που σε ορισμένες περιπτώσεις καθιστούν απαραίτητο να λαμβάνουν δραστικά καλύτερα αποτελέσματα, καθώς και τη λειτουργία επεξεργασίας φόντου, η οποία ανοίγει νέα χαρακτηριστικά για διαδραστική εργασία με μεγάλα έγγραφα.

Υπάρχουν επίσης πολλές άλλες αλλαγές, αν και είναι λιγότερο σημαντικές. Η κίνηση προς την υποστήριξη του αισθητήριου ελέγχου σήμερα είναι σίγουρα δικαιολογημένη, αλλά η διαδρομή επιλέγεται φαύλα - να παρέχει σε μία διεπαφή η ίδια βολική λειτουργία με το ποντίκι και τα δάχτυλα είναι απίθανο ίσως. Ωστόσο, ενώ τα δισκία των Windows προσπαθούν απλώς να σπάσουν στην αγορά και οι προγραμματιστές από την ABBYY εξακολουθούν να έχουν χρόνο.

Τιμές για το ABBYY FineReader 12 Professional:

  • boxed έκδοση: 4990 ρούβλια;
  • Λήψη έκδοσης: 4490 ρούβλια;
  • Ενημέρωση: 2690 ρούβλια.

Ως συνήθως, η απάντηση στην ερώτηση "αξίζει να αλλάξει Παλιά εκδοχή Σε νέα; " εξαρτάται από την περίσταση. Σε κάθε περίπτωση, αξίζει να θεωρηθεί ότι ο κύκλος ζωής του FineReader είναι αρκετά μεγάλος και αν κάποια από τις περιγραφείσες βελτιώσεις παίζουν σημαντικό ρόλο για εσάς, στη συνέχεια σε 2-3 χρόνια, το κόστος ενημέρωσης θα πληρώσει σίγουρα - αν όχι ουσιαστικά, τότε ηθικά. Για να λύσετε, αυτή η ερώτηση θα βοηθήσει τελικά.

Γεια. Σήμερα θα μιλήσω για το πώς να χρησιμοποιήσετε το πρόγραμμα ABBYY FineReader να αναγνωρίσει το κείμενο C Image που θα μπορούσατε να πάρετε ως αποτέλεσμα της σάρωσης. Το σαρωμένο κείμενο σας θα είναι πλήρως στο έγγραφο του Microsoft Word και αυτό το αναγνωρισμένο κείμενο μπορεί να επεξεργαστεί! Η αναγνώριση του κειμένου χρησιμοποιώντας το ABBYY FineReader μπορεί να είναι χρήσιμο για εκείνους που σπουδάζουν, συνεργάζονται με κείμενα και μεταφράσεις. Το πρόγραμμα, δυστυχώς, καταβάλλεται. Κάπως προσπαθώ να δοκιμάσω μία από τις δωρεάν επιλογές για παρόμοια προγράμματα, αλλά πολύ καλά σαρωμένο κείμενο είναι απλά τρομερό ... και να αναγνωρίσει το κείμενο στο ABBYY FineReader Αποδεικνύεται αρκετά υψηλής ποιότητας! Τώρα θα σας δείξω πώς να χρησιμοποιήσετε το ABBYY FineReader για να αναγνωρίσετε γρήγορα το κείμενο από την εικόνα.

Το ABBYY FineReader έχει Δοκιμαστική έκδοση Για 30 ημέρες με τη δυνατότητα να αναγνωρίσετε έως και 100 σελίδες και να αποθηκεύσετε όχι περισσότερες από 3 σελίδες από το έγγραφο. Εκείνοι. Κατά τη διάρκεια αυτής της περιόδου, μπορείτε να δείτε τις δυνατότητες του προγράμματος και να πάρετε μια σταθμισμένη λύση - είτε χρειάζεται, αν αξίζει να το αγοράσετε είτε όχι.

Πώς να εγκαταστήσετε το ABBYY FineReader!

Πριν χρησιμοποιήσετε το ABBYY FineReader, πρέπει να εγκατασταθεί. Εξετάστε τη διαδικασία εγκατάστασης αυτού του προγράμματος ...

Για να ξεκινήσετε, επιλέξτε τη γλώσσα του προγράμματος. Κάντε κλικ στο "OK".

Δεχόμαστε τους όρους της συμφωνίας άδειας χρήσης (εάν το επιθυμείτε, μπορείτε να διαβάσετε τη συμφωνία άδειας χρήσης εάν ενδιαφέρεστε για το τι υπάρχει). Κάντε κλικ στο κουμπί "Επόμενο".

Στη συνέχεια, πρέπει να επιλέξετε τη λειτουργία εγκατάστασης. Κάτω από την κανονική λειτουργία, το πρόγραμμα δεν θα σας ρωτήσει και θα ορίσει αυτό που το πρόγραμμα καθορίζεται από προεπιλογή, δηλαδή όλα τα εξαρτήματα: ABBYY FineReader για αναγνώριση κειμένου, στοιχείο για προγράμματα Το γραφείο της Microsoft. και ένα στοιχείο για την Εξερεύνηση των Windows (επιτρέποντάς σας να αναγνωρίσετε γρήγορα τις εικόνες χωρίς να ανοίξετε ένα ξεχωριστά πρόγραμμα). Σας συμβουλεύω να επισημάνετε μια επιλεκτική εγκατάσταση για να ρυθμίσετε όσο χρειάζεστε. Ειδικά δεν χρειάζονται 15 λεπτά :) κάτω από το φάκελο υποδεικνύεται όταν το πρόγραμμα θα εγκατασταθεί. Συνιστάται να αφήσετε την προεπιλεγμένη επιλογή έτσι ώστε να μην υπάρχουν προβλήματα κατά τη χρήση του προγράμματος. Κάντε κλικ στο κουμπί "Επόμενο".

Συστατικά προγράμματος. Αυτό το παράθυρο θα εμφανιστεί σε περίπτωση που επιλέξετε τη ρύθμιση "Custom". Τα εξαρτήματα είναι κάτι σαν βοηθητικές εφαρμογές εφαρμογής. Η πρώτη συνιστώσα "ενσωμάτωση με Προγράμματα της Microsoft Γραφείο Ι. Αγωγός των Windows" Αυτό το στοιχείο θα εμφανιστεί στο μενού του Microsoft Office και εάν κάνετε κλικ στην εικόνα στον υπολογιστή σας Κάντε δεξί κλικ Ποντίκια, τότε θα υπάρχει ένα στοιχείο με αυτό το πρόγραμμα. Αυτός είναι ο τρόπος με τον οποίο το μενού σας θα μοιάζει με το Microsoft Office μετά την προσθήκη αυτού του συστατικού.

Αλλά τι θα συμβεί αν κάντε δεξί κλικ στην εικόνα:

Εκείνοι. Εμφανίζεται ένα μενού στο οποίο μπορείτε να κάνετε μια γρήγορη αναγνώριση κειμένου με την αποστολή αποτελεσμάτων σε Word, Excel ή PDF.

Το δεύτερο στοιχείο θα σας επιτρέψει να αναγνωρίσετε το κείμενο από την οθόνη του υπολογιστή. Αυτό σημαίνει ότι μπορείτε να κάνετε ένα στιγμιότυπο οθόνης και να αναγνωρίσετε επίσης το κείμενο. Εάν δεν θέλετε να εγκαταστήσετε ένα από αυτά τα στοιχεία, ή δεν θέλετε να εγκαταστήσετε και τα δύο, τότε πρέπει να κάνετε κλικ στο κάτω βέλος και να επιλέξετε "Αυτό το στοιχείο δεν θα είναι διαθέσιμο." Στη συνέχεια, το στοιχείο δεν θα εγκατασταθεί. Άφησα και τα δύο.

Επόμενα 4 σημεία. Το 1ο σημαίνει ότι οι πληροφορίες σχετικά με τον τρόπο χρήσης του προγράμματος ABBYY FineReader θα μεταφερθούν στον προγραμματιστή. Αυτό το στοιχείο συμβουλεύω να μην σημειώσουμε ότι το πρόγραμμα δεν δημοσιεύεται και πάλι στο διαδίκτυο για λόγους αποστολής πληροφοριών σχετικά με την εργασία με αυτό. Επιπλέον, ποτέ δεν γνωρίζετε ποιες άλλες πληροφορίες θα σταλούν :) Το 2ο στοιχείο δημιουργεί μια συντόμευση προγράμματος στην επιφάνεια εργασίας. 3RD σημαίνει ότι το πρόγραμμα θα ξεκινήσει όταν ο υπολογιστής είναι ενεργοποιημένος και η 4η θα ελέγξει τις ενημερώσεις του προγράμματος. Αφήνω μόνο το δεύτερο και απέναντι αφήνει ένα τσιμπούρι. Κλείστε όλες τις εφαρμογές του Microsoft Office, επειδή απαιτεί τον εγκαταστάτη και κάντε κλικ στο "Set".

Πρέπει να περιμένετε μερικά λεπτά για να εκκινήσετε και να κάνετε κλικ στο "Next".

Όλες οι εγκαταστάσεις ολοκληρώθηκαν! Πατήστε "έτοιμο".

Πώς να αναγνωρίσετε το κείμενο με μια σαρωμένη ή οποιαδήποτε άλλη εικόνα χρησιμοποιώντας το ABBYY FineReader;

Εξετάστε τον τρόπο χρήσης του προγράμματος. Για παράδειγμα, έχετε σαρωμένο κείμενο. Τώρα, για να αναγνωρίσετε το κείμενο στο ABBYY FineReader, ανοίξτε το πρόγραμμα. Κάντε κλικ στην επιλογή "Άνοιγμα".

Επιλέξτε την εικόνα που χρειάζεστε και κάντε κλικ στο Άνοιγμα.

Όταν ανοίγετε το επιθυμητό έγγραφο, το ABBYY FineReader θα αρχίσει να αναγνωρίζει το κείμενο. Όσο περισσότερο έγγραφο, τόσο μεγαλύτερη η αναγνώριση θα διαρκέσει. Η αναγνώριση μιας σελίδας μπορεί να διαρκέσει μερικά δευτερόλεπτα.

Μετά την αναγνώριση του κειμένου, θα αποθηκεύσετε μόνο το αποτέλεσμα Το έγγραφο της Microsoft Λέξη έτσι ώστε να μπορείτε να επεξεργαστείτε τίποτα σε αυτό. Για να το κάνετε αυτό, κάντε κλικ στο κουμπί "Αποθήκευση" επάνω πάνελ Εργαλεία και, στη συνέχεια, επιλέξτε σε ποιο φάκελο θα αποθηκευτεί Έγγραφο λέξη. και με ποιο όνομα.

Εάν είστε συνδεδεμένοι σε ένα σαρωτή υπολογιστή, μπορείτε να ξεκινήσετε τη σάρωση απευθείας από το πρόγραμμα και μετά την οποία το σαρωμένο έγγραφο θα αναγνωριστεί αμέσως. Για να το κάνετε αυτό, στην επάνω γραμμή εργαλείων, κάντε κλικ στο κουμπί Σάρωση. Στη συνέχεια, οι ενέργειες θα εξαρτηθούν από το πρόγραμμα προγράμματος οδήγησης για τον εκτυπωτή σας. Πρέπει μόνο να ακολουθήσετε τις οδηγίες του οδηγού σάρωσης.

Όπως μπορείτε να δείτε, όλα είναι πολύ απλά και γρήγορα. Τώρα ξέρετε πώς να χρησιμοποιήσετε το ABBYY FineReader για να αναγνωρίσετε το κείμενο από εικόνες! Ελπίζω ότι αυτές οι πληροφορίες θα βοηθήσουν σημαντικά πολλούς :) καλή τύχη!

Παρόλο που οι προκαταβολές που εκδίδονται από την τεχνητή νοημοσύνη (AI) τα τελευταία 50 χρόνια, ούτε ο Ioth έφερε τις "έξυπνες" μηχανές στις γνωστικές δυνατότητες ενός ατόμου, αρνούνται εντελώς τις επιτυχίες προς αυτή την κατεύθυνση θα ήταν άδικο. Το πιο προφανές και φωτεινό παράδειγμα είναι το σκάκι (για να μην αναφέρουμε πιο απλά παιχνίδια). Ο υπολογιστής δεν μπορεί να μιμηθεί τη σκέψη μας, αλλά είναι αρκετά ικανό να αντισταθμιστεί αυτός ο χώρος με μεγάλο όγκο εξειδικευμένης μνήμης και την ταχύτητα κατάσβεσης. Ο Vladimir Kramnik περιέγραψε το παιχνίδι να νικήσει το 2006. Deep Fritz προγράμματα ως "απάνθρωπη" με την έννοια ότι συχνά αντιφάσκει ότι καθορίζονται (ανθρώπινοι) κανόνες στρατηγικής και τακτικής.

Λίγο πάνω από ένα χρόνο πριν, ο επόμενος IBM Brainchild, σε μια στιγμή βάλτε την αρχή της νίκης θριαμβευτικής σκακιού των υπολογιστών (το διάσημο βαθύ μπλε), που ονομάζεται Watson έκανε μια νέα ανακάλυψη, με ένα μεγάλο διαχωρισμό της νίκης δύο πρωταθλητών του δημοφιλούς Αμερικανικό κουίζ κιτριδίας. Είναι σημαντικό, ωστόσο, ότι, μολονότι η Watson εξέφρασε ανεξάρτητα τις απαντήσεις, οι ερωτήσεις εξακολουθούσαν να μεταδίδονται σε μορφή κειμένου. Αυτό υποδηλώνει ότι η επιτυχία σε πολλούς τομείς της εφαρμογής AI - η αναγνώριση ομιλίας και των εικόνων, της μετάφρασης της μηχανής - είναι αρκετά μέτρια, αν και δεν μας εμποδίζει σήμερα να τα εφαρμόσουμε στην πράξη. Οι μεγαλύτερες επιτυχίες, ίσως, δείχνουν συμβόλαιο οπτικών συστημάτων αναγνώρισης (OCR, οπτική αναγνώριση χαρακτήρων), με τις οποίες σχεδόν όλοι οι χρήστες του υπολογιστή είναι σίγουρα εξοικειωμένοι με ούτως ή άλλως. Επιπλέον, οι ρωσικές εξελίξεις στον τομέα αυτό καταλαμβάνουν μια αξιόλογη θέση στον κόσμο - εννοώ το ABBYY FineReader.

Ένα κομμάτι ιστορίας

Η τρέχουσα έκδοση του ABBYY FineReader έχει αριθμό 11, δηλ. Η εφαρμογή έχει περάσει αρκετή μακροπρόθεσμη ανάπτυξη και ακόμη και η ιστορία αυτής της διαδικασίας είναι ένα συγκεκριμένο ενδιαφέρον. Χωρίς να διεκδικήσει ένα εξαντλητικό χρονικό, θα δώσω μόνο τα κύρια ορόσημα κατά την τελευταία δεκαετία, κατά τη διάρκεια της οποίας είμαι περισσότερο ή λιγότερο παρακολούθησε το FineReader:

ΕτοςΕκδοχήΚύρια χαρακτηριστικά
2003 7.0 Η αύξηση της ακρίβειας αναγνώρισης είναι έως και 25%. Τα περισσότερα από όλα αυτά αντικατοπτρίστηκαν σε τραπέζια, ιδιαίτερα πολύπλοκα, με ζωγραφισμένα κύτταρα, κρυμμένους διαχωριστές κ.λπ.
2005 8.0 Περαιτέρω βελτιστοποίηση αλγορίθμων αναγνώρισης, που στοχεύουν κυρίως στην εργασία όχι με σαρώσεις εγγράφων, αλλά με ψηφιακές φωτογραφίες. Για αυτό, υπάρχουν πρόσθετα χαρακτηριστικά της παρασκευής πρωτοτύπων (εξάλειψη της παραμόρφωσης, η ευθυγράμμιση των συμβολοσειρών κ.λπ.).
2007 9.0 Η εμφάνιση της τεχνολογίας ADRT, η οποία λαμβάνει υπόψη τη λογική δομή ολόκληρου του εγγράφου (πολλαπλών σελίδων) και είναι σε θέση να διαθέσει επαναλαμβανόμενα στοιχεία (κεφάλια), συνδέστε τα "ρέοντα" αντικείμενα (πίνακες) κ.λπ.
2009 10.0 Περαιτέρω βελτίωση των αλγορίθμων ADRT και αναγνώρισης, βελτίωση της ακρίβειας της επεξεργασίας πρωτοτύπων χαμηλής ανάλυσης έως και 30%.
2011 11.0 Η εστίαση είναι η ταχύτητα του προγράμματος. "Η δεύτερη έλευση" του ασπρόμαυρου καθεστώτος, το οποίο στα πρωτότυπα Καλής ποιότητας Δίνει πρόσθετη επιτάχυνση στο 30%.

Φυσικά, ταυτόχρονα, ο FineReader επεκτείνει την υποστήριξη των μορφών εγγράφων, τα ενσωματωμένα εργαλεία και η διεπαφή βελτιώθηκε, βελτιώθηκε η αναψυχή της δομής των πρωτοτύπων κλπ., Και οι ειδικές στιγμές συνδέονται άμεσα με τις τεχνολογίες OCR και Αποδεικνύει καλά τη διαδικασία Scakical Development, η οποία είναι χαρακτηριστική των σύνθετων συστημάτων υψηλής τεχνολογίας, όταν μετά την επόμενη "ανακάλυψη" ακολουθεί μια ορισμένη περίοδο "πατώντας" απαραίτητη για τη βελτίωση των νέων αλγορίθμων. Αντιπροσωπεύουν τη μεγάλη αξία οποιουδήποτε προγράμματος OCR και επομένως λεπτομερείς πληροφορίες Είναι εξαιρετικά σπάνιες γι 'αυτούς. Ωστόσο, η ABBYY συμφώνησε να ανοίξει το πέπλο της μυστικότητας και σήμερα έχουμε την ευκαιρία να εξετάσουμε τον ιερό FineReader.

Βασικές αρχές

Έτσι, δεδομένου ότι η OCR αναφέρεται στο πεδίο του AI, είναι αρκετά λογικό να επιδιώκουν οι προγραμματιστές να μιμηθούν τουλάχιστον τις δραστηριότητες του εγκεφάλου μας σε κάποιο βαθμό. Φυσικά, η συσκευή του οπτικού μας συστήματος είναι απίστευτα δύσκολη, αλλά οι βασικές "μεγάλες γεννημένες" αρχές της λειτουργίας της μελετώνται επαρκώς, συνήθως διακρίνουν τρεις:

  1. Ακεραιότητα (ακεραιότητα) - Το αντικείμενο θεωρείται ως σύνολο των τμημάτων του και (για οπτικές εικόνες) χωρικών σχέσεων μεταξύ τους. Με τη σειρά του, τα μέρη λαμβάνουν ερμηνείες μόνο στη σύνθεση ολόκληρου του αντικειμένου. Αυτή η αρχή συμβάλλει στην οικοδόμηση και την αποσαφήνιση της υπόθεσης, η γρήγορη κοπή απίθανο.
  2. Σκοπιμότης - Δεδομένου ότι οποιαδήποτε ερμηνεία των δεδομένων επιδιώκει ορισμένο στόχο, τότε η αναγνώριση είναι η διαδικασία υποψηφιότητας των υποθέσεων σχετικά με το αντικείμενο και τους σκόπιμους ελέγχους. Το σύστημα που ενεργεί σύμφωνα με την αρχή αυτή δεν θα αποθηκεύσει μόνο την εξοικονόμηση ενέργειας υπολογισμού, αλλά είναι λιγότερο λάθος.
  3. Προσαρμοστικότητα (προσαρμοστικότητα) - Το σύστημα διατηρεί τις πληροφορίες που συσσωρεύονται κατά τη λειτουργία και το χρησιμοποιεί και πάλι, δηλ. Αυτο-μάθηση. Αυτή η αρχή σάς επιτρέπει να δημιουργήσετε και να συσσωρεύετε νέες γνώσεις και να αποφύγετε την επαναφορά των ίδιων εργασιών.

Το FineReader είναι το μόνο σύστημα OCR στον κόσμο, το οποίο ενεργεί σύμφωνα με τις αρχές που περιγράφονται παραπάνω σε όλα τα στάδια της επεξεργασίας εγγράφων. Η κατάλληλη τεχνολογία καλείται IPA. - Σύμφωνα με τα πρώτα γράμματα των αγγλικών όρων. Για παράδειγμα, σύμφωνα με την αρχή της ακεραιότητας, το κομμάτι εικόνας θα ερμηνευτεί ως σύμβολο μόνο εάν όλα τα δομικά μέρη αυτών των αντικειμένων είναι παρούσες σε αυτό και βρίσκονται σε ορισμένες σχέσεις. Βοηθά στην αντικατάσταση της προτομής μεγάλου αριθμού προτύπων (αναζητώντας μια περισσότερο ή λιγότερο κατάλληλη) στοχοθετημένη δοκιμή εύλογης ποσότητας υποθέσεων και στηριζόμενη στις προηγουμένως συσσωρευμένες πληροφορίες σχετικά με τα πιθανά χαρακτηριστικά του χαρακτήρα σε ένα αναγνωρίσιμο έγγραφο.

Ωστόσο, οι αρχές της ΜΠΒ χρησιμοποιούνται κατά την ανάλυση όχι μόνο θραυσμάτων που αντιστοιχούν (πιθανώς) μεμονωμένους χαρακτήρες, αλλά και ολόκληρη η εικόνα πηγής της σελίδας. Τα περισσότερα συστήματα OCR βασίζονται στην αναγνώριση της ιεραρχικής δομής του εγγράφου, δηλαδή η σελίδα χωρίζεται σε βασικά δομικά στοιχεία, όπως πίνακες, εικόνες, μπλοκ κειμένου, τα οποία, με τη σειρά τους, χωρίζονται σε άλλα χαρακτηριστικά αντικείμενα - κύτταρα, Παραγράφους - και ούτω καθεξής, μέχρι τους μεμονωμένους χαρακτήρες.

Μια τέτοια ανάλυση μπορεί να διεξαχθεί με δύο κύριους τρόπους: από την προαναφερθείσα, δηλ. Από στοιχεία συστατικών σε μεμονωμένους χαρακτήρες, ή, αντίθετα, από κάτω. Τις περισσότερες φορές χρησιμοποιείται ένας από αυτούς, αλλά η ABBYY έχει αναπτύξει έναν ειδικό αλγόριθμο. Mda. (Ανάλυση πολυεπίπερου εγγράφων, ανάλυση πολλαπλών επιπέδων), η οποία συνδυάζει και τα δύο. Εν ολίγοις, μοιάζει με αυτό: η δομή της σελίδας αναλύεται από την εποπτική μέθοδο και η αναψυχή του ηλεκτρονικού εγγράφου στο τέλος της αναγνώρισης συμβαίνει από τη βάση προς τα πάνω, αλλά σε όλα τα επίπεδα υπάρχει ένας πρόσθετος μηχανισμός ανατροφοδότησης . Ως αποτέλεσμα, η πιθανότητα χονδροειδούς σφαλμάτων που σχετίζονται με την εσφαλμένη αναγνώριση αντικειμένων υψηλού επιπέδου μειώνεται δραματικά.

Adrt.

Ιστορικά, τα συστήματα OCR που αναπτύχθηκαν από την αναγνώριση των μεμονωμένων χαρακτήρων. Αυτή η εργασία εξακολουθεί να είναι η πιο σημαντική και πιο δύσκολη, είναι με αυτό που συνδέονται οι πιο πολύπλοκοι αλγόριθμοι. Ωστόσο, σύντομα έγινε σαφές ότι στην απόφασή της θα μπορούσε να βοηθήσει τις πληροφορίες υψηλότερου επιπέδου (για παράδειγμα, τη γλώσσα του εγγράφου και την ορθότητα της γραφής αναγνωρισμένων λέξεων) - έτσι εμφανίστηκε ο έλεγχος συμφραζομένων και λεξιλογίου. Στη συνέχεια, η επιθυμία να διατηρηθεί η μορφοποίηση και η αναδημιουργία της φυσικής δομής (δηλ., Η αμοιβαία διάταξη διαφόρων αντικειμένων) του εγγράφου οδήγησε στην ανάγκη για μια λεπτομερή ανάλυση ολόκληρης της σελίδας. Είναι σαφές ότι επηρεάζει επίσης σημαντικά τη συνολική ποιότητα αναγνώρισης, διότι συμβάλλει στη σωστή επεξεργασία της διάταξης πολλαπλών γραμμών, των πινάκων και άλλων τεχνικών της "μη γραμμικής" διάταξης του κειμένου.

Οι περισσότεροι σύγχρονοι OCR ενεργούν σε αυτά τα τρία επίπεδα - σύμβολα, λέξεις, σελίδες, - εξάσκηση, όπως ήδη αναφέρθηκε, προσεγγίζει από πάνω προς τα κάτω ή κάτω. Ωστόσο, η ABBYY, σύμφωνα με τις αρχές της ΜΠΒ, εισήγαγε ένα άλλο επίπεδο στο FineReader - ολόκληρο το έγγραφο πολλαπλών σελίδων. Πρώτα απ 'όλα, χρειάστηκε σωστή αναπαραγωγή μιας λογικής δομής, η οποία στα σύγχρονα έγγραφα γίνεται όλο και πιο περίπλοκη. Αλλά υπάρχουν επιπλέον μπόνους: αυξανόμενη ακρίβεια και επιταχύνοντας την επεξεργασία των επαναλαμβανόμενων αντικειμένων, πιο σωστή αναγνώριση (και ως εκ τούτου η αναγνώριση) "ρέει" από τη σελίδα στη σελίδα αντικειμένου.

Ήταν γι 'αυτό που αναπτύχθηκε. Adrt. (Προσαρμοσμένη τεχνολογία αναγνώρισης εγγράφων) - Τεχνολογία ανάλυσης και σύνθεσης του εγγράφου σε λογικό επίπεδο. Τελικά, βοηθά να αποφασίσει όσο το δυνατόν περισσότερο το αποτέλεσμα του FineReader στο πρωτότυπο. Για να το κάνετε αυτό, αναλύεται η εικόνα του συνόλου του εγγράφου και οι αναγνωρισμένες λέξεις συνδυάζονται σε ομάδες (συμπλέγματα) ανάλογα με την επιγραφή, το περιβάλλον και τη θέση στη σελίδα. Έτσι, το πρόγραμμα φαίνεται να βλέπει τη "λογική" της διάταξης του εγγράφου και μπορεί να ενοποιήσει περαιτέρω την εκτέλεση του αποτελέσματος.

Χάρη στην ADRT, FineReader, ξεκινώντας από την έκδοση 9.0, έμαθε να ανιχνεύει, να αναγνωρίζει και να αναπαράγει τα ακόλουθα δομικά μέρη και στοιχεία μορφοποίησης εγγράφων:

  • Κύριο κείμενο.
  • Κορυφαία και κάτω υποσέλιδα.
  • Αριθμοί σελίδων;
  • τίτλους ενός επιπέδου.
  • πίνακας περιεχομένων;
  • Ένθετα κειμένου ·
  • Υπογραφές σε σχέδια.
  • πίνακες;
  • υποσημειώσεις;
  • Υπογραφή / Ζώνες εκτύπωσης.
  • Γραμματοσειρές και στυλ.

Διαδικασία αναγνώρισης

Σύμφωνα με τον αλγόριθμο MDA, η πραγματική αναγνώριση αρχίζει στην κορυφή προς τα κάτω, από το επίπεδο της σελίδας. Είναι σαφές ότι οι πιο λανθασμένες λύσεις θα γίνουν στα αρχικά στάδια αυτής της διαδικασίας, τόσο περισσότερο θα είναι στα ακόλουθα. Αυτός είναι ο λόγος για τον οποίο η ακρίβεια αναγνώρισης είναι τόσο εξαρτημένη από την ποιότητα των πρωτοτύπων, αλλά και οι αλγόριθμοι για την προεπεξεργασία τους μπορεί να είναι απαραίτητες. Επομένως, καθώς η δημοτικότητα των εγγράφων χρώματος αναπτύσσεται σε FineReader, εμφανίστηκε μια διαδικασία προσαρμοστικής διχαλίωσης (προσαρμοστική δισαρχία, Ab). Εάν σαρώσετε αμέσως σε ασπρόμαυρη λειτουργία, όπου υπάρχουν υδατογραφήματα ή το κείμενο βρίσκεται σε ένα υπόστρωμα υφής ή χρώματος, τότε η εικόνα θα εμφανίζεται πάντα στην εικόνα, η οποία θα είναι πάντα δύσκολη η διαχωρισμό από την "χρήσιμη" εικόνα (Εφόσον. πληροφορίες πηγής που έχει χαθεί ήδη γι 'αυτόν). Αυτός είναι ο λόγος για τον οποίο ο FineReader προτιμά να δουλεύει με εικόνες χρώματος ή ημίτονο, μετασχηματίζοντας ανεξάρτητα τους σε ασπρόμαυρο (αυτή η διαδικασία ονομάζεται διφασμένη). Αλλά αυτό δεν είναι όλα. Δεδομένου ότι τα χρώματα του κειμένου και το υπόβαθρο ενδέχεται να διαφέρουν μέσα στη σελίδα και ακόμη και μεμονωμένες γραμμές, το AB υπογραμμίζει τις λέξεις με περισσότερα ή λιγότερο πανομοιότυπα χαρακτηριστικά και επιλέγει τις παραμέτρους βέλτιστες από την άποψη της αναγνώρισης. Σε αυτό είναι ότι η προσαρμοστικότητα του αλγορίθμου είναι συνεπής, η οποία είναι επομένως ένα παράδειγμα χρήσης ανατροφοδότησης στο MDA. Είναι σαφές ότι η αποτελεσματικότητα του ΑΒ εξαρτάται έντονα από το σχεδιασμό των εγγράφων πηγής - στη δοκιμαστική βάση της ABBYY αυτός ο αλγόριθμος έχει αυξημένη ακρίβεια αναγνώρισης κατά 14,5%.

Αλλά το πιο ενδιαφέρον, φυσικά, αρχίζει όταν η διαδικασία αναγνώρισης μειώνεται στα χαμηλότερα επίπεδα. Η λεγόμενη διαδικασία γραμμικής διαίρεσης σπάει σειρές για λέξεις και λέξεις σε μεμονωμένα γράμματα. Περαιτέρω, σύμφωνα με την αρχή της ΜΠΒ, ένα σύνολο υποθέσεων (δηλ. Πιθανές επιλογές Το γεγονός ότι αυτό είναι το σύμβολο στον οποίο οι χαρακτήρες σπάσουν από τη λέξη κλπ.) Και παρέχοντας κάθε εκτίμηση πιθανότητας, μεταδίδει στην είσοδο του μηχανισμού αναγνώρισης συμβόλων. Το τελευταίο αποτελείται από μια σειρά από λεγόμενου ΤαξινομητέςΚαθένα από τα οποία αποτελεί επίσης μια σειρά υποθέσεων που κατατάσσονται στον υποτιθέμενο βαθμό πιθανότητας. Το πιο σημαντικό χαρακτηριστικό οποιουδήποτε ταξινομητή είναι η μέση θέση της σωστής υπόθεσης. Είναι σαφές ότι τόσο υψηλότερο είναι, τόσο λιγότερη εργασία για τους επόμενους αλγορίθμους - για παράδειγμα, έλεγχος λεξιλογίου. Αλλά για επαρκώς καθιερωμένους ταξινομητές, τέτοια χαρακτηριστικά ως ακρίβεια της αναγνώρισης στις τρεις πρώτες υποθέσεις ή μόνο στην πρώτη - δηλαδή, περίπου η ικανότητα να μαντέψει τη σωστή απάντηση από τρεις ή από μία προσπάθεια είναι να μαντέψει. Το ABBYY στα συστήματά του εφαρμόζει τους ακόλουθους τύπους ταξινομητής: Raster, Sign, υπογράψτε διαφορά, το περίγραμμα, το περίγραμμα, τη δομική και δομική διαφορά - τα οποία ομαδοποιούνται σε δύο λογικά επίπεδα.

Λειτουργική αρχή Rk., ή ένας ταξινομητής ράστερ, με βάση τη σύγκριση εικονοστοιχείων της εικόνας του συμβόλου με τα πρότυπα. Οι τελευταίες σχηματίζονται ως αποτέλεσμα της κατάθεσης των εικόνων από το δείγμα εκπαίδευσης και δίδονται σε κάποια τυποποιημένη μορφή. Συνεπώς, για αναγνωρίσιμες εικόνες, το μέγεθος, το πάχος των στοιχείων, η κλίση είναι επίσης προ-κανονικοποιημένη. Αυτός ο ταξινομητής χαρακτηρίζεται από ευκολία εφαρμογής, ταχύτητα και αντοχή σε ελαττώματα απεικόνισης, αλλά παρέχει σχετικά χαμηλή ακρίβεια και γι 'αυτό χρησιμοποιείται στο πρώτο στάδιο - να δημιουργηθεί γρήγορα μια λίστα υποθέσεων.

Σημάδι ταξινομητής ( Υπολογιστής), ως εξής από το όνομά του, βασίζεται στην παρουσία σημείων ενός ή άλλου συμβόλου στην εικόνα. Εάν μόνο τέτοια σημάδια Ν, κατόπιν κάθε υπόθεση μπορεί να αντιπροσωπεύεται από ένα σημείο στον Ν-διαστατικό χώρο. Συνεπώς, η ακρίβεια της υπόθεσης θα αξιολογηθεί από την απόσταση από αυτήν μέχρι το σημείο που αντιστοιχεί στο πρότυπο (ο οποίος μελετάται επίσης στο δείγμα εκπαίδευσης). Είναι σαφές ότι οι τύποι και ο αριθμός των σημείων καθορίζουν σε μεγάλο βαθμό την ποιότητα της αναγνώρισης, έτσι υπάρχουν συνήθως αρκετά πολλά από αυτά. Αυτός ο ταξινομητής είναι επίσης σχετικά γρήγορος και απλός, αλλά όχι πολύ ανθεκτικός σε διαφορετικά ελαττώματα εικόνας. Επιπλέον, ο υπολογιστής λειτουργεί από την αρχική εικόνα, αλλά κάποιο μοντέλο, αφαίρεση, δηλ. Δεν λαμβάνει υπόψη μέρος των πληροφοριών: Ας πούμε ότι το γεγονός της παρουσίας ορισμένων σημαντικών στοιχείων δεν μιλάει τίποτα για την αμοιβαία θέση τους. Για το λόγο αυτό, ο υπολογιστής χρησιμοποιείται όχι αντ 'αυτού, και μαζί με τη Δημοκρατία του Καζακστάν.

Ταξινομητής ( Κκ) Είναι μια συγκεκριμένη περίπτωση με υπολογιστή και χαρακτηρίζεται από το ότι αναλύει τα περιγράμματα του προβλεπόμενου συμβόλου που απομονώνεται από την εικόνα προέλευσης. Γενικά, η ακρίβειά της είναι χαμηλότερη από αυτή ενός πλήρους υπολογιστή.

Διαφορικός ταξινομητής συμπτωμάτων ( Pdk) Είναι επίσης παρόμοιο με έναν υπολογιστή, ωστόσο, χρησιμοποιείται αποκλειστικά να γίνει διάκριση μεταξύ αντικειμένων παρόμοιων μεταξύ τους, όπως "m" και "rn". Συνεπώς, αναλύει μόνο εκείνες τις περιοχές όπου οι διακρίσεις είναι κρυμμένες και δεν υποβάλλονται μόνο στην είσοδο, όχι μόνο τις εικόνες πηγής, αλλά και τις υποθέσεις που σχηματίζονται στα αρχικά στάδια της αναγνώρισης. Η αρχή της εργασίας του, ωστόσο, είναι κάπως διαφορετική από τον υπολογιστή. Στο στάδιο της κατάρτισης στον Ν-διαστατικό χώρο, σχηματίζονται δύο "σύννεφα" (σημεία σημεία) πιθανών τιμών για κάθε μία από τις δύο επιλογές, στη συνέχεια υπερπλανικό, χωρίζοντας τα "σύννεφα" μεταξύ τους και περίπου ισοδύναμο από αυτούς . Το αποτέλεσμα της αναγνώρισης εξαρτάται από το οποίο το μισό χώρο είναι το σημείο που αντιστοιχεί στην εικόνα προέλευσης.

Το ίδιο το MPC δεν πιέζει τις υποθέσεις, αλλά καθορίζει μόνο το διαθέσιμο (ο κατάλογος των οποίων γενικά ταξινομείται από τη μέθοδο φυσαλίδων), έτσι ώστε να μην πραγματοποιηθεί άμεση αξιολόγηση της αποτελεσματικότητάς της και είναι έμμεσα με τα χαρακτηριστικά του ολόκληρο το πρώτο επίπεδο αναγνώρισης OCR. Ωστόσο, είναι σαφές ότι εξαρτάται από την ορθότητα των επιλεγμένων σημείων και της αντιπροσωπευτικότητας του δείγματος προτύπων, την παροχή του τι είναι ένα μάλλον επίπονο έργο.

Δομικός διαφορικός ταξινομητής ( Sdk) Αρχικά εφαρμόστηκε για να επεξεργαστεί χειρόγραφα κείμενα. Το καθήκον του είναι να διακρίνει τέτοια παρόμοια αντικείμενα ως "C" και "g". Έτσι, το SDK βασίζεται στα σημεία που είναι χαρακτηριστικά κάθε ζεύγους χαρακτήρων, η διαδικασία της εκπαίδευσής του είναι ακόμη πιο περίπλοκη από αυτή του MPC και η ταχύτητα της εργασίας είναι χαμηλότερη από αυτή των προηγούμενων ταξινομητών.

Δομικός ταξινομητής ( Sc.Πρόκειται για ένα θέμα υπερηφάνειας της ABBYY, αρχικά σχεδιάστηκε για να αναγνωρίσει το λεγόμενο κείμενο χειροτεχνίας, δηλ. Όταν ένα άτομο γράφει "τυπωμένα" γράμματα, αλλά στη συνέχεια χρησιμοποιείται για τυπωμένο. Χρησιμοποιείται στα τελικά στάδια της αναγνώρισης και εισέρχεται σε ισχύ σπάνια, δηλαδή, μόνο όταν τουλάχιστον δύο υποθέσεις έρχονται σε αυτό με επαρκώς υψηλές πιθανότητες.

Τα ποιοτικά χαρακτηριστικά όλων των ταξινομούμενων συναρμολογούνται στον ακόλουθο πίνακα. Ωστόσο, μας επιτρέπουν μόνο να αξιολογήσουμε την αποτελεσματικότητα των αλγορίθμων σε σχέση μεταξύ τους, δεδομένου ότι δεν είναι απόλυτα, αλλά λαμβάνονται με βάση την επεξεργασία ενός συγκεκριμένου δείγματος δοκιμής. Μπορεί να ζητήσει την εντύπωση ότι στα τελευταία στάδια αναγνώρισης, ο αγώνας πηγαίνει κυριολεκτικά για τα συμφέροντα του ποσοστού, αλλά στην πραγματικότητα κάθε ταξινομητής συμβάλλει σημαντικά στη βελτίωση της ακρίβειας αναγνώρισης - έτσι, για παράδειγμα, το SC μειώνει τον αριθμό του αριθμού των σφάλματα σε απτό 20%.

Rk.ΥπολογιστήςΚκPDC *Sdk **Sc **
Ακρίβεια των πρώτων τριών επιλογών,%99,29 99,81 99,30 99,87 99,88 -
Ακρίβεια της πρώτης επιλογής,%97,57 99,13 95,10 99,26 99,69 99,73

* Αξιολόγηση του συνολικού αλγορίθμου OCR πρώτου επιπέδου ABBYY
** Αξιολόγηση για ολόκληρο τον αλγόριθμο μετά την προσθήκη ενός κατάλληλου ταξινομητή

Ωστόσο, είναι περίεργο ότι, παρά τη αρκετά υψηλή ακρίβεια, ο ίδιος ο αλγόριθμος αναγνώρισης δεν υποβάλλει τελική απόφαση. Σύμφωνα με την αρχή MDA, οι υποθέσεις επεκτείνονται σε κάθε λογικό επίπεδο και ο αριθμός τους μπορεί να αυξηθεί σε γεωμετρική εξέλιξη. Συνεπώς, ο συνεπής έλεγχος όλων των υποθέσεων είναι απίθανο να είναι αποτελεσματικός και ως εκ τούτου στα συστήματα OCR ABBYY χρησιμοποιεί τη μέθοδο των υποθέσεων διάρθρωσης, δηλ. Αναθέτοντας τα σε ένα ή ένα άλλο μοντέλο. Οι τελευταίοι υπάρχουν μερικές δεκάδες, αυτό είναι μόνο μερικοί από τους τύπους τους: λέξη, λεπτή λέξη, αραβικοί αριθμοί, ρωμαϊκά στοιχεία, διευθύνσεις διευθύνσεων, κοινή έκφραση - και σε κάθε μία μπορεί να περιλαμβάνει πολλά συγκεκριμένα μοντέλα (για παράδειγμα, τη λέξη σε ένα από τα διάσημες γλώσσες, Λατινικά, Κυριλλικά κ.λπ.).

Όλες οι τελικές ενέργειες εκτελούνται από την υπόθεση που χτίστηκε σε μοντέλα. Για παράδειγμα, ο έλεγχος συμφραζομένων θα καθορίσει τη γλώσσα του εγγράφου και αμέσως θα μειώσει σημαντικά την πιθανότητα μοντέλων χρησιμοποιώντας εσφαλμένα αλφάβητα και το λεξιλόγιο αντισταθμίζει τα σφάλματα με απροσδιόριστη αναγνώριση ορισμένων συμβόλων: έτσι, η λέξη "στροφή" υπάρχει στο Λεξικό Αγγλικής Γλώσσας - Σε αντίθεση με το "tum" (σε ούτως ή άλλως, δεν είναι μεταξύ των δημοφιλών). Αν και η προτεραιότητα του λεξικού είναι υψηλότερη από εκείνη του κάθε ταξινομητή, δεν είναι απαραίτητα η τελευταία περίπτωση και στη γενική περίπτωση δεν σταματά περαιτέρω ελέγχους: πρώτον, όπως αναφέρθηκε παραπάνω, υπάρχει ένα μοντέλο μιας μη-συνοδευτικής λέξης, Δεύτερον, μια ειδική οργάνωση λεξικών επιτρέπει μια υψηλή πιθανότητα μεριδίων να αναλάβει αν κάποια άγνωστη λέξη αναφέρεται σε μία γλώσσα. Παρ 'όλα αυτά, ο έλεγχος λεξιλογίου (και η πληρότητα των λεξικών) έχει σημαντική επίδραση στο αποτέλεσμα της αναγνώρισης και στις δοκιμές της ίδιας της ABBYY μειώνει τον αριθμό των σφαλμάτων σχεδόν δύο φορές.

Όχι μόνο ocr

Τα τυπωμένα έγγραφα απέχουν πολύ από τα μόνα ενδιαφέροντα όσον αφορά την ψηφιοποίηση και την αυτόματη επεξεργασία τους. Πολύ συχνά δουλεύει με έντυπα, δηλ. Τα έγγραφα με προκαθορισμένα και σταθερά πεδία, τα οποία γεμίζουν με το χέρι, αλλά σχετικά τακτοποιημένα (αποκαλούμενα χειροποίητα σύμβολα) - μπορεί να χρησιμοποιηθεί το παράδειγμα διαφόρων ερωτηματολογίων. Η τεχνολογία επεξεργασίας τους έχει ξεχωριστό όνομα - ICR. (Ευφυής αναγνώριση χαρακτήρων) - και είναι σημαντικά διαφορετική από την OCR. Επομένως, επειδή στην περίπτωση αυτή, το καθήκον δεν είναι να ανακατασκευαστεί ολόκληρο το έγγραφο, αλλά στην εκχύλιση συγκεκριμένων δεδομένων από αυτό, αποσυντίθεται σε δύο κύριες υποτάξεις: η εύρεση των επιθυμητών πεδίων και στην πραγματικότητα αναγνωρίζουν το περιεχόμενό τους.

Αυτή είναι μια αρκετά συγκεκριμένη περιοχή και η ABBYY προσφέρει ένα εντελώς ξεχωριστό λογισμικό ABBYY FlexicApture για αυτό. Έχει σχεδιαστεί για να δημιουργεί αυτοματοποιημένα και ημιαυτόματα συστήματα, αναλαμβάνει τη ρύθμιση σε συγκεκριμένους τύπους εγγράφων για τα οποία δημιουργούνται ειδικά πρότυπα, μπορούν να βρουν έξυπνα διάφορα πεδία σε σελίδες και να επαληθεύσουν τα δεδομένα σε αυτά κλπ. Ωστόσο, οι αλγόριθμοι είναι οι αλγόριθμοι είναι οι αλγόριθμοι είναι οι αλγόριθμοι είναι οι αλγόριθμοι για την αναγνώριση των χαρακτήρων, παρόμοια με εκείνα που χρησιμοποιούνται στο FineReader, και Γενικό σύστημα Εξαιρετικά παρόμοια:

Ωστόσο, εξακολουθεί να έχει μια σημαντική διαφορά: ένας δομικός ταξινομητής είναι υποχρεωτικός συμμετέχων στη διαδικασία - αυτό οφείλεται στις ιδιαιτερότητες των χαρακτήρων χειροτεχνίας. Επιπλέον, η ICR αναλαμβάνει μεγάλο αριθμό ειδικών πρόσθετων ελέγχων: για παράδειγμα, αν το σύμβολο είναι γεμάτο ή αν τα αναγνωρισμένα σύμβολα σχηματίζουν πραγματικά την ημερομηνία.

Συνεχίζοντας το θέμα:
Linux.

Ο χρήστης στην ορολογία των προδιαγραφών) είναι ένα λογισμικό στο πλάι του συνδρομητή, το οποίο σας επιτρέπει να λαμβάνετε, να στείλετε, να δείτε και να επεξεργαστείτε ...

Νέα άρθρα
/
Δημοφιλής