Abbyy FineReader 12 programı nedir? Nasıl çalışır: FineReader

Bu sefer size kağıt belgelerini nasıl çevireceğinizi söyleyeceğim elektronik görünüm PDF formatı, ayrıca metni değiştirmek için bilgisayara aktarmak için bir kağıt belgenin yanı sıra. Yani, başlayalım.
Ellerimde bir kağıt belgem var.

PDF'de tarama.

Görev: Bilgisayara aktarın (elektronik forma dönüştürün) Bu belge. Dahası, böyle bir şekilde yapmanız gerekir, böylece gelecekte değiştirilmesi imkansızdır (kabaca konuşma yapmanız gerekir. Daha sonra bu elektronik belge posta ile e-posta adresine gönderilmelidir. Dahası, müşteri ister pDF formatı.

Standartlar:
1) Belgeyi tarayıcı aracılığıyla özlüyorum
2) Elde edilen baskıyı PDF formatında bilgisayarınıza kaydetme.
3) Alınan dosyayı posta ile gönderirim
İşimde, böyle bir görevi çözmek için 2 program kullanıyorum:
Foxit hayalet veya ABBYY FineReader.. Anlama için ekran görüntülerini uyguladım:
Foxit Phantom'da, tarayıcı etkinleştirildiğinde, ana menüdeki tarayıcıdan dosya oluşturma PDF-CREATE seçeneğini seçmelisiniz ...
Tarama yapacak ve dosyayı kaydetme önerisi görünecektir. Dosya adını yazan ve kaydetme bir yer seçin.

ABBYY FineReader'da, araç çubuğunda büyük düğmeler var. Bunlardan biri PDF'de tarandı. Kullandık.

Aşamalara göre çok sayfalı bir belgeyi taramanız gerekiyorsa:
1) 1 numaralı taramadaki düğmeye basın.

Taranan bir belge alıyoruz

Ayrıca başka bir sayfayı tararız (1 numaralı taramada düğmeye tekrar tıklayın).
2) PDF'de tasarruf ediyoruz



Sonuç olarak, bir PDF dosyası formunda hazır bir çok sayfalı belge elde ediyoruz.

Şimdi bu dosya Bir e-posta gönderebilirsiniz.

Metin tanınan

Görev: Bir kağıt belgesini elektronik forma dönüştürün (bilgisayardan)

Standartlar:
1) Tarama (düğme 1 tarama)

2) Tanıma (tümünü tanımak için 2 düğme)

Tanınma, çeviri fotoğraflarının (resimlerin) metinde (harfler, sayılar, işaretler) nasıl olduğunu anlamanız gerekir. Bir metin sayfasını fotoğrafladıysanız, ardından tanımlandıktan sonra, kağıtlı metnin% 99'u elektronik bir metne dönüşür. Elektronik metin zaten bilgisayarda istediğiniz kadar değiştirilebilir.

3) içinde tasarruf metin düzeltici (4 Kaydet düğmesi)
Microsoft Word'deki tüm sayfaları aktarmayı seçmenizi tavsiye ederim.

Teslim almak

Ben belirtmek istiyorum Önemli anlar Tanıma prosedürü ile. Çalışırken nüanslar var.
Tanıma hemen sonra, sonuca bakmanı tavsiye ederim. Özellikle FineReader programının yarattığı bloklarda.

Bunlar dikdörtgen bir çerçevede tahsis edilen alanlardır. Çerçeveler farklı renklerdir. Kırmızı renkte o zaman bu blok bir resim olarak tanınır. Siyah renk metin ise. Bloklar farklı tiplerde. Blok tipi sağ fare düğmesine tıklayarak ve blok türünü değiştirerek tıklayarak bulunabilir.

Küçük Hile: Keyfi bir alan seçebilir ve her türlü bloğu işaretleyebilirsiniz. Örneğin, sol fare düğmesi (basılı tutun ve çekin, çerçeve boyutunu değiştirir), örneğin, sol fare düğmesi kullanılarak bilinen metnin bölümünü seçin.

Sonuç olarak, Word'deki belge bir metin bloğu ve blok resmine sahip olacaktır. Blok resmin kesinlikle değişmeyen bir görüşe sahip olacak. Bu method Mühürleri kurtarırken kullanıyorum, standart olmayan yazı tipleri, resimler, fotoğraflar.

Not: PDF ile çalışmak için bilgi ve beceriler, belgeleri tarayın ve tanımak, ofis çalışmalarında sık sık ayrılır. Bilgi - zamanınızı kaydeder!

Belge Yapısının Tanımı

ABBYY FineReader, belgeleri tanımak için devrimci yeni bir yaklaşım sunuyor. Şimdi belge tamamen analiz edilir ve tamamen işlenir ve finedanın iç yapısının bu tür unsurlarını üst ve alt altbilgiler, dipnotlar, resimler ve diyagramlar için imzalar, stiller, fontlar, vb. Kaynak belgenin elemanları ortaya çıkan belgede geri yüklenir. Örneğin, Word'de kaydederken, üst ve alt altbilgiler, dipnotlar, Word'de uygun nesneler olarak oynatılır.

Mükemmel tanıma kalitesi ve doğru tasarım

ABBYY FineReader Optik tanıma sistemi, herhangi bir belgenin orijinal tasarımını doğru bir şekilde tanır ve en önemlisi (resimlerin arka planındaki metinler dahil, renkli bir arka planda, metin desenleri, vb.

Çok dilli belgelerin tanınması

ABBYY FineReader, Rusça, İngilizce, Almanca, Fransızca, İspanyolca, İtalyanca, İsveççe, Fince, Bulgarca, Macarca, Slovakça, ÇEK, Beşkır, Belarus, Kazakça, Çince, Ukrayna vb. Dahil olmak üzere 188 dilde belgeleri tanır. Belgenin metni iki veya daha fazla dilde derlenebilir. Kullanıcı, her tür bir blok için veya her hücre hücresi için tanıma dilini belirleyebilir.

Akıllı PDF Belge Tanıma

Bildiğiniz gibi, bazı PDF dosyaları adı verilen metin katmanını içerir ve içerikleri ekranda görünen belgeye tam olarak uymayabilir. FineReader Pre-Analizes Dosyanın içeriği ve her metin bloğu için bir çözüm yapar: BT'yi tanıyın veya ilgili metni metin katmanından çıkarın. Böylece, tanıma kalitesini arttırmak ve işlem süresini azaltmak mümkündür.

Dokümanların dijital fotoğraflarının tanınması

Şimdi tanıma için, bilgisayarı tarayıcıya donatmak gerekli değildir. ABBYY FineReader, dijital bir kamera tarafından yapılan belgelerin fotoğraflarını tanımanıza olanak sağlar (4 MPIX ve daha yüksek bir matris çözünürlüğüne sahip bir dijital kamera kullanılması önerilir).

Kamerayı tarayıcı yerine, kamerayı kullanmak için daha uygun olduğunda birçok dava vardır. Örneğin, ofis dışındaki bir iş toplantısı sırasında, özellikle kalın veya eski kitaplarla çalışırken, kütüphanede belirtileri veya reklamları tanırken. Dijital kameranın herhangi bir tarayıcıdan birkaç kez daha hızlı çalıştığı gerçeğinden bahsetmiyorum.

Tanıma köprüsü

Bu tür belgeler Microsoft Word, PDF ve HTML formatlarında kaydedilebilir. Ayrıca, tanınan metinde kendi köprünüzü ekleyebilirsiniz.

PDF dosyalarını tanırken, harici bağlantılara ek olarak, dahili (aynı belgenin diğer sayfalarında) geri yüklenir.

Ekranlarhotov tanıma

ABBYY Screenshot Reader, sistem paketine dahil edilmiştir. Bu basit bir I. uygun uygulama Herhangi bir ekran alanından metni tanımak için tasarlanmıştır. ABBYY Screenshot Reader, kopyalanamayan düzenlenebilir format metinlerine çevirir. geleneksel yöntemde - Sistem mesajları, flaş silindirlerinde yazılar vb. Hem tanınan metin hem de ekran anlık görüntüsü bir dosya olarak kaydedilebilir veya panoya aktarılabilir.

Barkod tanıma

ABBYY FineReader, iki boyutlu tip PDF-417 de dahil olmak üzere barkod tanıma destekler.

Tarih ABBYY FineReader 20 yıldan fazla olmuştur. Yıldönümü 2013 şirketi, (2009'dan itibaren Express Edition'a kıyasla) Abbyy FineReader Pro, Mac için ve birkaç ay sonra, Şubat 2014'te, "hediye", "hediye" aldı. windows kullanıcıları - ABBYY FineReader 12 profesyonel ve kurumsal. Önceki sürümün 2011'de göründüğünü ve iki buçuk yıl çok fazla zamanın göründüğünü hatırlatayım.

Genel bilgi

Yeni sürüm için sistem gereksinimleri tamamen değişmedi. Platform pencerelere hizmet verebilir veya Windows Server Sırasıyla XP ve 2003'ten başlayarak. Mevcut zamanlarda donanım sorguları ve mütevazı derecede mütevazı: 1 GHz frekansı ile herhangi bir bitin bir işlemci, rasgele erişim belleği Bilgisayar çekirdeği başına 1 GB'den az 512 MB'tan daha az 512 MB, vb. Birkaç sadece disk alanına olan ihtiyacı arttırdı - şimdi 700 ve 850 MB (artı, hala çalışma dosyaları için 700 MB) yüklemek gerekli değildir.

Doğal olarak, minimum Gereksinimler; Tüm ABBYY FineReader 12 profesyonel özellikleri yalnızca nispeten modern sistemlerde ortaya çıkacaktır. Özellikle, programın bireysel sayfaların işlenmesini etkili bir şekilde paralelleştirebileceğini, tüm işlemci çekirdeklerini kullandığını ve herhangi bir işlemciyi neredeyse% 100'e yüklediğini hatırlatıyorum. Ama bu gerçekten RAM'e açgözlü değil, hatta 32 bit kalıyor.

Kurulum prosedürü değişmedi: minimum soru ve seçenek. ABBYY FineReader 12 Professional ile birlikte, yalnızca kullanıcıyı kaydettikten sonra verimli olan hala ABBYY ekran görüntüsü okuyucu var.

Bundan sonra, teknik desteğe erişim de açık olacaktır.

Bu mütevazı bilgi temelinde bile, evrim sonucuna sahip olduğumuzu varsayılabilir. Buna göre, gelecekte değişikliklerin açıklamasına odaklanıyorum. Önceki versiyonBu iki ana gruba ayrılabilir: programla çalışın (arayüz, yardımcı aletler, kullanılabilirlik) ve OCR (tanımanın kalitesi ve performansı).

Programla Çalışma

ABBYY FineReader 12 Professional, kullanıcı arayüzünde bazı iyileştirici gösterir. Bu, program başlatıldığında varsayılan olarak açılan görev penceresinde hemen farkedilir. Belli ki, Windows 8.x fayans kavramını taklit eder ve özellikle programın kaydırma ve ölçeklendirme gibi ana hareketleri de desteklemesi nedeniyle, parmakları kontrol etmek için uyarlanır. Aslında, değişiklikler sadece "cepheyi" etkiledi ve kısmen bile - fayansların yanında olağan kontrollere bitişik ve herhangi bir senaryoyu yapılandırma sürecinde standart iletişim kutuları ile ilgilenmek zorunda kalacak. Onlarla çalışmak, özellikle Windows tabletleri ile popüler hale gelen 8-10 ekranlarda oldukça problemlidir.

Kamera ile donatılmış böyle bir tabletin kullanıcısının, bir tür yazdırılan belgeyi tanıtmak için hızlı bir şekilde "gidin", gerçekten kolay bir şekilde "gidin" dedi. Bu arada, her şey windows tarihiTablet PC'nin ilk baskısından, standart masaüstü arayüzünün dokunmatik kontrolüne adaptasyonun anlamsızlığını doğrular. Görünüşe göre, bu amaçlar için, tüm metro kanonlarına karşılık gelen ancak aynı "motoru" kullanan özel bir kabuk oluşturmak için çok daha doğrudur. Bu çözüme bir örnek, Windows 8.x'ten Internet Explorer'dır. Ayrıca, ABBYY, Şirket'in bulut hizmetini kullanan Windows 8 için ABBYY FineReader Dokunması biçiminde bile kesin bir sıraya sahiptir.

Dokunmatik girişten uzaklaşırsanız, o zaman bu sınıfta hala değişiklikler var - diğer şeylerin yanı sıra, açılış / koruma pencerelerinin tamamen beklenen güncellemesinden, bulut depolama (Eğer sistemde uygun bir ajan ve klasör varsa), daha önemli ve faydalı olanlara kadar.

Abbyy FineReader 12 profesyonelinde sayfa işleme şimdi arka planda gerçekleştirilir. Bu, eskiden yokluğunu ifade eder. modal pencere İşlemlerin durumu (şimdi bu rol, ekranın altındaki durum dizgisi tarafından oynanır) ve buna göre, arayüze erişimin kullanılabilirliği. Böylece, kullanıcı, programla tanıma işlemine paralel olarak (kesinlikle yeterince uzunsa), örneğin ortaya çıkan metnin parçalarını kopyalayın veya hatta sayfaların işaretini ayarlayabilme yeteneğine sahiptir. Sonuncusu sıra ve işlenmiş.

Önceki sürümün aksine, otomatik tanıma devre dışı bırakılırsa, sayfaları tanınırken veya belge başlatıldığında da kapatmaz. ABBYY FineReader 12 profesyonelinde, belge neredeyse anında yüklenir ve sayfalara bölünmüş ve eskizleri sadece sol bölmede manuel olarak kaydırdıkları için inşa edilmiştir. Diğer şeylerin yanı sıra, hesaplamalı kaynakları ve büyük çok sayfalı belgelerde oldukça belirgin bir şekilde tasarruf sağlar.

Bu sınıftaki kalan değişiklikler çok ilginç değildir, ancak bazı senaryolarda kullanışlı olmalarına rağmen, onlar hakkında kısa.

Belgeyi tamamen işleme koymamız gerekiyorsa, ancak yalnızca bireysel yerleri alıntılamak için, tüm otomatik işlemleri kapatabilir ve herhangi bir türden gerekli parçaları seçebilirsiniz, hemen bunları panoya kopyalamak - analiz ve tanıma ile ilgili olarak Sinek.

Orijinalden daha basit bir yapıya sahip bir sonuç elde etmek için, altbilgilerin, dipnotların ve diğer yerleşim elemanlarının uzlaştırılmasını kapatabilirsiniz. Bu, örneğin e-kitap hazırlarken yararlı olabilir.

E-kitaplar hakkında devam etmek - ABBYY FineReader 12 Professional EPUB 2.0.1 ve 3.0 formatlarını destekler.

XLSX'deki dönüşüm parametreleri uzatılır, örneğin, biçimlendirmeyi temizleme veya resim kaydedeme yeteneğine sahiptir.

Elde edilen belgeleri PDF'ye bir metin katmanı ile kaydederken, şimdi orijinal sayfalardaki karakterleri pürüzsüzleştirmek için şimdi yeni ABBYY hassas tarama teknolojisini kullanabilirsiniz. Bu arada, sadece renk modunda mevcuttur.

Çalışmalarının etkisi, her zaman olmasa da, "akademik" olarak olmasa da gözle görülür. Bununla birlikte, herhangi bir durumda düzleştirilmiş karakterlerin okunabilirliği daha yüksek olmalı ve bu örnek Orijinal gerçekten çok düşük kaliteli.


OCR

Şimdi, tanıma mekanizmalarında hangi iyileştirmeler gerçekleştiğiyle uğraşalım.

Geliştiriciler, ADRT teknolojisini geliştirmenin bir sonraki aşamasını rapor eder, hangi, belgenin mantıksal yapısını hatırlatır, analiz eder ve yeniden yaratır. Özellikle tablolar, listeler, diyagramlarla çok daha doğru çalışmaya başladığı ilan edildi. Bu yeterli örnekleri gösterin, bu kadar basit değil, imkansız değil. Örneğin, örneğin, Abbyy FineReader 11 Professional (üstte) ve ABBYY FineReader 12 Professional (alttan) aynı sayfalık tanıma sonuçları (varsayılan ayarlarla).


Eski versiyon, muhtemelen orijinalin düşük kalitesinden dolayı, kalan elemanları "çöp" olarak düşünün, yalnızca ana metin bloğunu tahsis eder ve işlenir. Yeni, aksine, listeyi doğru şekilde tanımladı ve yeniden oluşturmaya çalıştı. Bununla birlikte, sonuç ideal değildir: Tüm belirteçlerin tanınmadığının, tekrar, görüntünün kalitesine atfedilemez, ancak program, görünüşte, hala önünde olacağını anlamadı, aksi takdirde sayıları harf olarak yorumlamazdı. Bununla birlikte, ilerleme, bu tür şikayetlerin nitel orijinalleri üzerindedir, olmayabilir.

Ancak "örtük" tablo, satırları ayırmadan nasıl işlenir - ABBYY FineReader 11 Professional (üstte) ve ABBYY FineReader 12 Professional (aşağıda).


Yenenin aksine, eski sürümün, tablo yapısını hiç görmediği ve bir dizi ilgisiz metin bloğu ile sınırlandırıldığı açıkça görülmektedir. Görüntülere tıklamak ve tanıma sonuçlarını karşılaştırmak için tembel olmayın - Abbyy FineReader 12 profesyonel ideal yakındır.

Ne yazık ki, her zaman olmuyor ve zaten ABBYY FineReader 12'nin komşu sayfalarında ABBYY FineReader 11 Professional'a benzer sonuçlar geldi. Her ne kadar Adrt aynı "kapakları" izlemeli ve bunun önünde bir tür akan tablo.

Ancak yine de, güncellenmiş algoritmaların öncekinden daha fazla ayrıntıya dikkat ettiği açıkça belirgindir. Abbyy FineReader Test etme sürecinde 12 profesyonel, örneğin, bunun üzerine metin bilgilerinin sipariş edilmesine sahip bir tablo olarak yorumlama girişiminde bile gözlendi. Çok daha sık da yeni bir sürüm, çeşitli çizelgeleri ve şemaları yeniden oluşturmaya çalışıyor. arka fonbireysel grafik ve metin bloklarından değil.

ABBYY FineReader 12 profesyonel tanıma kalitesini geliştirmek için tasarlanmış bazı yeni ürünler var. Bildiğiniz gibi, bunun için ön şartlardan biri, özellikle tarayıcı olmayan, ancak kameralar kullanılarak elde edilirse, orijinalin kalitesidir. Bu nedenle, bir zamanlar FineReader'da orijinallerin ön işlenmesinin bir yoludur. Yeni sürümde, listeleri genişletildi, sayfaların kenarları boyunca düzeltildi, arka plan parlaklığını aydınlatıp hizalama, renk öğelerinin kaldırılması. Sonuncusu, örneğin, mühürler ve pullarla belgeleri işlemek için faydalı olabilir. Ek olarak, şimdi kullanıcı bağlanabilir Çeşitli metodlar Bireysel olarak.

Dil desteği de geliştirilmiştir. Birincisi, Rus alfabesi stresle ortaya çıktı, ikincisi, Çin, Japon ve Korece (% 20'ye varan), Arapça (% 60'a varan), İbranice (% 10'a kadar) tanınmada bir artış bildirildi. - Bu, görünüşe göre, geliştirerek ve ek eğitim sınıflandırıcılarıyla elde edilir.

Sonunda, birçok okuyucu için en yakıcı sorunlardan biri: Programın hızının büyüdüğü mü? Bu soruyu, özellikle de çok basit olmayan sayılarla cevaplamak makuldür - her biri kendi nüansları olan çok fazla dil; Çok çeşitli orijinaller; Algoritmaların çalışmaları üzerinde çok fazla bilinmeyen etki faktörü. Bu nedenle, geliştiricilerin bile, ABBYY FineReader 12 profesyonel performansın performansı hakkında bile% 10-15 oranında sınırlandırılmıştır.

Bu tür sayılar genellikle yeterince büyük belgeler dizilerinin işlenmesinin sonuçları ile elde edilir ve buna göre, "hastanedeki ortalama sıcaklık" gibi bir şeydir. Bu nedenle, herhangi bir gösteri vakası, örneğin aşağıdakilere benzer şekilde daha ayrıntılı olarak faydalıdır:

  • 300 dpi 10 sayfalık bir tam renkli A4 formatlı kitapçık çözünürlüğe sahip renkte taranır. Kaliteli, diller, Rusça, İngilizce, karmaşık alay;
  • PDF Küçük sayıda renk ve siyah beyaz resimler içeren bir kitabın 138 sayfasının grafik görüntüleri ile birkaç tablo. Kalite düşüktür (görünüşe göre, bir kağıt kitapta "kör" yazdırarak), Ukrayna ve Rusça, basit bir düzen dilleri.

Her iki belge de renk modunda tanındı ve ikincisi de, hazırlık sürecini taklit etmek için tasarlanmış olan siyah ve beyazdır. e-kitap. Tüm varsayılan ayarlar, Dil seti ve buna göre işletim modları hariç, değişmeden bırakıldı. Bir test poligonu olarak, I5-3450 işlemcili bir PC ve 8 GB bellek kullanıldı. Sonuçlar aşağıdaki tabloda sunulur:

Görülebileceği gibi, PDF ivmesi için bile vaat edilen% 15'i aşıyor - belki de, tanıma algoritmalarındaki en son optimizasyonlar için iyi olan özel durumlardan sadece bir tanesidir. Genel olarak konuşan programların farklı bir çalışma yaptıklarını akılda tutulmalıdır. En azından masaların işlenmesinin üzerindeki resmin üzerine bakın - ne kadar zor olduğum sürümlerden hangisinin olduğunu söylemek zor.

Hataların sayısına gelince, neredeyse her iki versiyonda da aynı olmasına rağmen, bazen şüphelerin farklı parçalara ve sembollere neden olduğu fark edilirse de, eğitim algoritmalarının kanıtı gibi görünüyor. Her durumda, belirsizce tanınan karakterlerin çoğu, sözlükleri kullanarak kesinlikle doğru şekilde tanımlanmıştır ve "kaba" hataları (özel ve dekoratif sembollerin yanlış yorumlanması, grafikteki metin vb.) Karşılaştı. Böylece fark kaybolan kabul edilebilir.

Başka bir soru, performans artışının genellikle ne kadar önemli olduğudur? Görünüşe göre, kazançlar, yine de kontrol edilmesi gereken 138 sayfada yarım dakikadır ve düzeltilebilir, biraz değer var. Test görevlerine benzer işler, durumun vesilesiyle gerçekleştirilmesi gerekiyorsa, performans doğru bir şekilde endişelenemez. Başka bir şey, ABBYY FineReader 12'de mevcut olan büyük miktarda belgelerin çevrimdışı işlenmesi söz konusudur. Bu durumda, zamanın% 15'inin tasarrufu zaten oldukça farkedilir.

Özet

Yeni ABBYY FineReader 12 profesyonelinin devrimci hiçbir şeye söz verilmediğini, en azından birkaç değişiklik olmasına rağmen, her türlü övgüyü hak ediyor. Her şeyden önce, bu, ADRT teknolojisinin tablo tanıma, diyagramlar ve genel olarak geliştirilmesidir. mantıksal yapı Bazı durumlarda bazı durumlarda, büyük belgelerle etkileşimli çalışma için yeni özellikler açan arka plan işleme modunun yanı sıra, arka plan işleme modunun yanı sıra, arka plan işleme modunun yanı sıra arka plan işleme modunu almayı gerekli kılar.

Daha az anlamlı olmasına rağmen, birçok başka değişiklik de var. Günümüzde duyusal kontrolü destekleyen hareketi kesinlikle haklı çıkar, ancak yol kısır olarak seçilir - bir arayüzü sağlamak için fare ve parmaklarıyla aynı kullanışlı çalışmayı muhtemel değildir. Bununla birlikte, Windows tabletleri sadece pazara girmeye çalışırken ve ABBYY'den geliştiriciler hala zamanımız var.

ABBYY FineReader 12 Profesyonel fiyatlar:

  • kutulu sürüm: 4990 ruble;
  • İndir sürümü: 4490 ruble;
  • güncelleme: 2690 ruble.

Her zamanki gibi, sorunun cevabı "değişmeye değer mi eski versiyon Yeni mi? " duruma göre. Her durumda, FineReader'ın yaşam döngüsünün yeterince uzun olduğu ve açıklanan iyileştirmelerden herhangi birinin sizin için önemli bir rol oynadığı, daha sonra 2-3 yılda, güncelleme maliyetleri kesinlikle ödeme yapacaklar - maddi olarak, sonra ahlaki olarak. Çözmek için bu soru nihayet yardımcı olacaktır.

Merhaba. Bugün, tarama sonucu alabileceğiniz metin C görüntüsünü tanımak için ABBYY FineReader programını nasıl kullanırken konuşacağım. Taranan metniniz tamamen Microsoft Word belgesinde olacak ve bu tanınmış metin düzenlenebilir! Abbyy FineReader kullanarak metni tanımak, okuyan, metinler ve çevirilerle çalışır. Program, ne yazık ki ödenir. Her nasılsa, benzer programlar için ücretsiz seçeneklerden birini denemeye çalışıyorum, ancak çok iyi taranmış bir metin sadece korkunç ... ve Abbyy FineReader'daki metni tanımak için oldukça yüksek kalitede ortaya çıkıyor! Şimdi, sizi görüntüden metni hızlı bir şekilde tanımak için ABBYY FineReader'ın nasıl kullanılacağını göstereceğim.

Abbyy fineReader var deneme sürümü 100 sayfaya kadar tanıyabilme ve belgede 3 sayfadan fazla kaydetme yeteneği ile 30 gün boyunca. Şunlar. Bu süre zarfında, programın olanaklarını görebilir ve ağırlıklı bir çözüm alabilirsiniz - size ihtiyacı olup olmadığına dikkat edip etmeye değer olsun.

Abbyy FineReader nasıl kurulur!

ABBYY FineReader kullanmadan önce kurulmalıdır. Bu programın kurulum sürecini göz önünde bulundurun ...

Başlamak için, programın dilini seçin. "Tamam" ı tıklayın.

Lisans Sözleşmesinin şartlarını kabul ediyoruz (isterseniz, orada olanlarla ilgileniyorsanız, lisans sözleşmesini okuyabilirsiniz). Sonrakine tıkla".

Daha sonra Kurulum modunu seçmelisiniz. Normal modun altında, program size sormaz ve programın varsayılan olarak belirtildiğini belirler, yani tüm bileşenler: Metin Tanıma için ABBYY FineReader, Programlar İçin Bileşen Microsoft Office. ve Windows Gezgini için bir bileşen (ayrı ayrı bir program açmadan görüntüleri hızlı bir şekilde tanımanıza izin verir). İhtiyacınız olan gibi ayarlamak için seçici bir yükleme işaretlemenizi tavsiye ederim. Özellikle 15 dakika sürmez :) Aşağıda, programın nerede kurulacağını belirtilir. Programı kullanırken herhangi bir sorun olmaması için varsayılan seçimden ayrılması tavsiye edilir. Sonrakine tıkla".

Program bileşenleri. "Özel" kurulumunu seçmeniz durumunda bu pencere görünecektir. Bileşenler yardımcı uygulama uygulamaları gibi bir şeydir. İlk bileşen "entegrasyonu microsoft programları Ofis I. Windows iletken" Bu bileşen Microsoft Office menüsünde görüntülenir ve bilgisayarınızdaki resme tıklarsanız sağ tık Fareler, o zaman bu programla bir öğe olacak. Bu bileşeni ekledikten sonra menünüzün Microsoft Office'te nasıl görüneceğini budur.

Ancak görüntüyü sağ tıklarsanız ne olacak:

Şunlar. Word, Excel veya PDF ile ilgili sonuçları göndererek hızlı bir metin tanımayı yapabileceğiniz bir menü belirir.

İkinci bileşen, metni bilgisayar ekranından tanımanıza izin verir. Bu, bir ekran görüntüsü yapabileceğiniz ve metni tanıyabileceğiniz anlamına gelir. Bu bileşenlerden birini kurmak istemiyorsanız veya her ikisini de yüklemek istemiyorsanız, aşağı oka tıklamanız ve "Bu bileşen mevcut olmayacak" seçeneğini seçin. Sonra bileşen yüklenmeyecektir. İkisini de terk ettim.

Sonraki 4 puan. İlk olarak, ABBYY FineReader programını nasıl kullandığınızla ilgili bilgilerin geliştiriciye aktarılacağı anlamına gelir. Bu madde, programın, bununla çalışma hakkında bilgi gönderme uğruna, bir kez daha internette yayınlanmadığını not etmemeyi tavsiye ederim. Ayrıca, diğer bilgilerin ne gönderileceğini asla bilemezsiniz :) 2. Öğe, masaüstünde bir program kısayolu oluşturur. 3. Bilgisayar açıldığında programın başlayacağı anlamına gelir ve 4. program güncellemelerini kontrol eder. Sadece ikinci ve zıt bir kene bıraktım. Tüm Microsoft Office uygulamalarını kapatın, çünkü yükleyici gerektirir ve "SET" i tıklayın.

Önyükleme yapmak için birkaç dakika beklemeniz ve "Sonraki" yı tıklamanız gerekir.

Tüm kurulum tamamlandı! "Hazır" tuşuna basın.

Abbyy FineReader kullanarak taranan veya başka bir görüntüyle metin nasıl tanınır?

Programın nasıl kullanılacağını düşünün. Örneğin, metni taradınız. Şimdi, Abbyy FineReader'daki metni tanımak için programı açın. "Aç" i tıklayın.

İhtiyacınız olan resmi seçin ve Aç'ı tıklayın.

İstediğiniz belgeyi açtığınızda, ABBYY FineReader metni tanımaya başlayacaktır. Daha fazla belge, tanınma ne kadar uzun olur. Tek sayfa tanıma birkaç saniye sürebilir.

Metin tanındıktan sonra, yalnızca sonucu kaydedeceksiniz microsoft belgesi Word, böylece bir şeyleri düzenleyebilirsiniz. Bunu yapmak için, "Kaydet" düğmesini tıklayın. üst panel Araçlar, ardından hangi klasör kaydedileceğini seçin. belge sözcüğü. ve hangi isim altında.

Bir bilgisayar tarayıcısına bağlıysanız, doğrudan programdan taramaya başlayabilirsiniz ve ardından taranan belge hemen tanınacaktır. Bunu yapmak için, üst araç çubuğunda, Tara düğmesine tıklayın. Daha sonra, eylemler yazıcınız için sürücü programına bağlı olacaktır. Sadece tarama sihirbazının talimatlarını izlemeniz gerekir.

Gördüğünüz gibi, her şey çok basit ve hızlı. Artık, görüntülerden gelen metni tanımak için ABBYY FineReader'ın nasıl kullanılacağını biliyorsunuz! Umarım bu bilgiler çok yardımcı olacaktır :) İyi şanslar!

Son 50 yılda yapay zeka (AI) tarafından verilen avanslar, ne de "akıllı" makineleri bir kişinin bilişsel yeteneklerine getirmesine rağmen, bu yöndeki başarıları tamamen inkar edecektir. En belirgin ve parlak örnek satrançtır (daha basit oyunlardan bahsetmiyorum). Bilgisayar düşüncemizi taklit edemez, ancak bu alanı büyük miktarda özel hafıza ve söndürme hızı ile telafi etme yeteneğine sahiptir. Vladimir Kramnik, 2006 yılında yenme oyununu tarif etti.

Bir yıldan fazla bir süre önce, bir sonraki IBM brainchild, bir seferde, Watson adlı, Watson adlı bilgisayarların zafer satranç zaferinin (ünlü derin mavi), popüler iki şampiyonu yenmek için büyük bir ayrılıkla yeni bir atılım yaptı. Amerikan Quiz Jeopardy. Bununla birlikte, Watson'ın bağımsız olarak cevapları dile getirmesine rağmen, sorular hala metin formunda bulaşmıştır. Bu, AI uygulamasının birçok alanındaki başarının - konuşma tanıma ve görüntüleri, makine çevirisi - en mütevazı olmasına rağmen, bugünden uygulamaya girmemizi engellememektedir. Belki de en büyük başarı, sembolü optik tanıma sistemlerini (OCR, Optik Karakter Tanıma), muhtemelen hemen hemen tüm PC kullanıcılarını bildiğiniz içindir. Ayrıca, bu alandaki Rus gelişmeleri dünyada değerli bir yer işgal ediyor - Abbyy FineReader demek istiyorum.

Biraz tarih

Abbyy FineReader'ın şu anki versiyonu 11 numaralı, yani uygulama yeterince uzun vadeli gelişme geçti ve hatta bu sürecin öyküsü belli bir ilgi. Kapsamlı bir kronik iddia etmeden, son on yılda sadece ana kilometre taşlarını vereceğim, bu sırada daha az ya da daha az izlenen fineader:

YılSürümAna Özellikler
2003 7.0 Tanıma doğruluğundaki artış% 25'e kadardır. Bütün bunların çoğu, özellikle karmaşık, boyalı hücreler, gizli ayırıcılar vb.
2005 8.0 Tanınma algoritmalarının daha fazla optimizasyonu, öncelikle belgelerin taramaları ile değil, aynı zamanda dijital fotoğraflarla çalışmayı hedeflemiştir. Bunun için orijinallerin hazırlanmasının (bozulma, dize hizalama vb.) Ek özellikleri vardır.
2007 9.0 Tüm (çok sayfalı) belgenin mantıksal yapısını dikkate alan ve tekrarlanan elemanları (kafa) tahsis edebilecek, "akan" nesneleri (tablolar) vb. Bağlanabilen ADRT teknolojisinin görünümü.
2009 10.0 ADRT ve Tanınma algoritmalarının daha da iyileştirilmesi, düşük çözünürlüklü orijinallerin işlenmesinin% 30'a kadar işlenmesinin doğruluğunu arttırır.
2011 11.0 Odak, programın hızında. Orijinallerde siyah ve beyaz rejimin "ikinci geliyor" İyi kalite % 30'a ek hızlandırma sağlar.

Doğal olarak, aynı zamanda, FineReader, belge formatlarının desteğini genişletti, yerleşik araçlar ve arayüz geliştirildi, orijinallerin yapısının rekreasyonu, vb. Geliştirildi ve özel anlar doğrudan OCR teknolojileri ile ilgilidir ve Karmaşık yüksek teknoloji sistemlerinin karakteristiği olan kilikik gelişim sürecini, bir sonraki "atılım" ndan sonra, yeni algoritmaları iyileştirmek için gerekli bir "dokunma" dır. Herhangi bir OCR programının ana değerini temsil ederler ve bu nedenle detaylı bilgi Onlar onlar hakkında son derece nadirdir. Bununla birlikte, ABBYY nazikçe gizliliğin perdesini açmayı kabul etti ve bugün Kutsal Sineader'a bakma fırsatımız var.

Temel prensipler

Öyleyse, OCR AI alanını ifade ettiğinden, geliştiricilerin en azından beynimizin faaliyetlerini bir dereceye kadar taklit etmek için kullandıkları oldukça mantıklı. Tabii ki, görsel sistemimizin cihazı inanılmaz derecede zordur, ancak işleyişinin temel "büyük doğumlu" ilkeleri yeterince çalışılır, genellikle onları üç ayırt ederler:

  1. Bütünlük (bütünlük) - Nesne, aralarındaki mekansal ilişkilerin parçalarının (görsel görüntüler için) bir bütünlüğü olarak kabul edilir. Buna karşılık, parçalar yalnızca tüm nesnenin bileşiminde yorumlar alır. Bu ilke, hipotezi inşa etmeyi ve netleştirmelerine yardımcı olur, hızlı bir şekilde düşük tutun.
  2. Amaçlılık - Herhangi bir veri yorumlaması belirli bir hedefi takip ettiğinden, tanımak, nesne ve amaçlı çekler hakkındaki hipotezleri aday gösterme sürecidir. Bu prensibe uygun olarak hareket eden sistem yalnızca hesaplama güç tasarrufu yapmaz, ancak daha az yanlıştır.
  3. Uyarlanabilirlik (uyarlanabilirlik) - Sistem, çalışma sırasında biriken bilgileri korur ve tekrar kullanır, yani kendi kendine öğrenme. Bu ilke, yeni bilgi oluşturmanıza ve biriktirmenize ve aynı görevleri yeniden çözmenizi önler.

FineReader, dünyadaki tek OCR sistemidir, bu da belge işlemenin tüm aşamalarında yukarıda açıklanan ilkelere uygun olarak hareket eder. Uygun teknoloji denir İPA. - İngilizce terimlerin ilk harflerine göre. Örneğin, bütünlük ilkesine göre, görüntü fragmanı yalnızca bu tür nesnelerin tüm yapısal parçaları mevcutsa ve belirli ilişkilerde olduğunda sembol olarak yorumlanacaktır. Çok sayıda standartların büstü olduğunu (az ya da çok uygun) hedefli bir hipotezin hedefli bir testi olarak değiştirilmesine yardımcı olur ve tanınabilir bir belgedeki karakterin olası özellikleri hakkında daha önce birikmiş bilgilere dayanmaktadır.

Bununla birlikte, IPA'nın prensipleri, yalnızca (muhtemelen) bireysel karakterlere karşılık gelen parçaları değil, aynı zamanda sayfanın tüm kaynak görüntüsünü de analiz ederken kullanılır. Çoğu OCR sistemleri, belgenin hiyerarşik yapısının tanınmasına dayanır, yani sayfa tablolar, görüntüler, metin blokları gibi temel yapısal elemanlara ayrılır, bu, sırayla diğer karakteristik nesnelere ayrılmıştır - hücreler, Paragraflar - vb. Bireysel karakterlere kadar.

Böyle bir analiz iki ana yolla gerçekleştirilebilir: yukarıdan aşağıya, yani bileşen elemanlarından bireysel karakterlere veya aksine, alttan yukarıdan yapılmıştır. En sık onlardan biri kullanılır, ancak ABBYY özel bir algoritma geliştirmiştir. MDA. (Çok düzeyli belge analizi, çok seviyeli bir belge analizi), her ikisini de birleştiren. Kısacası, şöyle görünür: Sayfa yapısı yukarıdan aşağıya yöntemi analiz edilir ve tanınmanın sonunda elektronik belgenin rekreasyonu aşağıdan yukarıya doğru gerçekleşir, ancak her seviyede ek bir geri bildirim mekanizması var. . Sonuç olarak, yüksek seviye nesnelerin yanlış tanınmasıyla ilgili kaba hataların olasılığı önemli ölçüde azaltılır.

ADRT.

Tarihsel olarak, OCR sistemleri bireysel karakterlerin tanınmasından geliştirildi. Bu görev hala en önemli ve en zor olanıdır, en karmaşık algoritmaların ilişkili olduğu içindir. Bununla birlikte, kısa sürede, kararında daha üst düzey bilgiye (örneğin, belgenin dili ve tanınmış kelimelerin yazısının doğruluğunu) yardımcı olabileceği konusunda açıkça ortaya çıktı - böylece bağlamsal ve kelime kontrolü ortaya çıktı. Daha sonra Biçimlendirme ve yeniden oluşturma arzusu, belgenin fiziksel yapısını (yani çeşitli nesnelerin karşılıklı düzenlemesi), tüm sayfanın ayrıntılı bir analizine ihtiyaç duymasına neden oldu. Genel olarak tanınma kalitesini önemli ölçüde etkilediği açıktır, çünkü çok renkli düzeni, tabloları ve metnin "doğrusal olmayan" düzeninin diğer tekniklerini doğru şekilde işlemeye yardımcı olur.

Çoğu modern OCR, bu üç seviyede hareket eder - semboller, kelimeler, sayfalar, daha önce belirtildiği gibi, yukarıdan aşağıya veya alttan yaklaşır. Bununla birlikte, ABBYY, IPA'nın ilkelerine uygun olarak, çok sayfalı belgenin tamamı - FineReader'da başka bir seviye tanıttı. Her şeyden önce, modern belgelerin daha karmaşık hale geldiği mantıksal bir yapının doğru şekilde çoğaltılmasını sağladı. Ancak ek bonuslar vardır: Artan doğruluk ve yinelenen nesnelerin işlenmesini hızlandıran, daha doğru kimlik (ve bu nedenle tanıma) Sayfadan nesne sayfasına "akan" "akan".

Bunun için geliştirilmişti. ADRT. (Adaptif Belge Tanıma Teknolojisi) - Belgeyi mantıksal bir seviyede analiz etmek ve sentezlemek için teknoloji. Sonuçta, fineader'ın sonucunun sonucunun orijinalinde mümkün olduğunca kadar yapmasına yardımcı olur. Bunu yapmak için, tüm belgenin görüntüsü analiz edilir ve tanınmış kelimeler, sayfadaki yazıt, ortam ve konuma bağlı olarak gruplara (kümeler) birleştirilir. Böylece, program belgenin düzeninin "mantığını" görüyor gibi görünüyor ve sonucun yürütülmesini daha da birleştirebilir.

ADRT, FineReader sayesinde, 9.0 sürümüyle başlayan, aşağıdaki yapısal parçaları ve belge biçimlendirme öğelerini tespit etmeyi, tanımayı ve çoğaltmayı öğrendi:

  • ana yazı;
  • üst ve alt altbilgiler;
  • sayfa numaraları;
  • bir seviye başlıkları;
  • içindekiler;
  • metin ekleri;
  • çizimlere imza;
  • masalar;
  • dipnotlar;
  • İmza / Baskı Bölgeleri;
  • yazı tipleri ve stilleri.

Tanıma süreci

MDA algoritmasına uygun olarak, gerçek tanıma sayfa seviyesinden yukarıdan aşağıya doğru başlar. Bu sürecin erken evrelerinde daha yanlış çözümlerin yapılacağı açıktır, daha fazla aşağıdakilerde olacaktır. Bu nedenle, tanıma doğruluğunun orijinallerin kalitesine çok bağlı olduğu, aynı zamanda ön muameleleri için algoritmaların da önemli olabileceği budur. Böylece, renk belgelerinin popülerliği fineader'da büyüdükçe, adaptif bir ikilizleme prosedürü ortaya çıktı (adaptif ikilizme, Ab). Hemen siyah ve beyaz modda, filigranların mevcut olduğu veya metin bir dokusal veya renkli bir alt tabakada bulunursa, görüntüde görüntüde görüntüde görünür, bu daha sonra "yararlı" görüntüden ayrılması oldukça zor olacaktır. (o zamandan beri. Kaynak bilgileri zaten onun hakkında kayboldu). Bu yüzden FineReader, renk veya yarı tonlu görüntülerle çalışmayı tercih ediyor, bağımsız olarak onları siyah ve beyaza dönüştürür (bu işlemin ikramiye denir). Ama bu hepsi değil. Metnin ve geçmişin renkleri sayfada ve hatta bireysel çizgilerde farklılık gösterebileceğinden, AB, az ya da çok özdeş özelliklere sahip kelimeleri vurgular ve tanıma açısından en uygun parametreleri seçer. Bu, algoritmanın uyarlanabilirliğinin tutarlı olduğu, bu nedenle MDA'da geri bildirim kullanmanın bir örneğidir. AB'nin etkinliğinin güçlü bir şekilde kaynak belgelerin tasarımına bağlı olduğu açıktır - ABBYY'nin test tabanında bu algoritmanın tanınma doğruluğunu% 14,5 oranında arttırdığı açıktır.

Ancak, elbette en ilginç olan, tanıma işlemi en düşük seviyelere indirildiğinde başlar. Sözde doğrusal bölünme prosedürü, kelimeler için satırları ve kelimelerin bireysel harflerle parçalanır; Ayrıca, IPA prensibine uygun olarak, bir dizi hipotez (yani) muhtemel Seçenekler Bunun, karakterlerin kelime, vb. Tarafından kırıldığı semboldür.) Ve, her olasılık tahmini sağlayarak, sembol tanıma mekanizmasının girişine iletilir. İkincisi bir dizi sözde oluşur sınıflandırıcılarHer biri ayrıca, iddia edilen olasılık derecesinde bir dizi hipotez oluşturur. Herhangi bir sınıflandırıcının en önemli özelliği, doğru hipotezin ortalama pozisyonudur. Artık ne kadar yüksek olduğu açıktır, daha az algoritmalar için daha az iş - örneğin, kelime haznesi. Ancak yeterince iyi belirlenmiş sınıflandırıcılar için, bu tür özellikler için ilk üç hipotez için tanımanın doğruluğu veya sadece birincisi - bu, kabaca konuşurken, doğru cevabı üç veya bir girişimden tahmin etme yeteneği tahmin etmektir. Sistemlerinde ABBYY, aşağıdaki sınıflandırıcılar türlerini uygular: raster, işaret, işaret diferansiyel, kontur, yapısal ve yapısal diferansiyel, iki mantıksal düzeyde gruplandırılmıştır.

Çalışma prensibi Rk.veya sembolün görüntüsünün piksel karşılaştırmasına dayanarak standartlar ile bir raster sınıflandırıcı. İkincisi, eğitim numunesinden ortalama görüntülerin bir sonucu olarak oluşturulur ve bazı standart forma verilir; Buna göre, tanınabilir görüntüler için, elemanların boyutu, kalınlığı, eğim de önceden normalleştirilmiştir. Bu sınıflandırıcı, uygulama kolaylığı, hız ve görüntüleme kusurlarına karşı direnç ile karakterize edilir, ancak nispeten düşük bir doğruluk sağlar ve bu nedenle ilk aşamada kullanıldığında - hipotezlerin bir listesini hızlı bir şekilde oluşturmak için.

Işareti sınıflandırıcı ( Pc), adından aşağıdaki gibi, görüntüdeki bir veya başka bir sembolün işaretlerinin varlığına dayanır. Yalnızca böyle işaretler N ise, her hipotez N boyutlu alandaki bir nokta ile temsil edilebilir; Buna göre, hipotezin doğruluğu, stoğun (aynı zamanda eğitim örneğinde de incelenmiş), standartlara karşılık gelen noktaya kadar değerlendirilecektir. Belirtilerin türleri ve sayısının büyük ölçüde tanıma kalitesini belirlediği açıktır, bu nedenle genellikle pek çok kişi vardır. Bu sınıflandırıcı da nispeten hızlı ve basittir, ancak farklı görüntü hatalarına karşı çok dayanıklı değildir. Ek olarak, PC, orijinal görüntü tarafından değil, bazı model, soyutlama, yani bilgilerin bir bölümünü dikkate almaz: Bazılarının bir kısmını dikkate almaz: Bazı önemli unsurların varlığının gerçeğinin, karşılıklı konumları hakkında hiçbir şey konuşmadığını söyleyelim. Bu nedenle, PC bunun yerine ve Kazakistan Cumhuriyeti ile birlikte kullanılmaz.

Sınıflandırıcı ( KK) Belirli bir PC kasasıdır ve kaynak görüntüden izole edilmiş sembolün kıvrımlarını analiz etmesidir. Genel olarak, doğruluğu tam teşekküllü bir PC'den daha düşüktür.

Belirti Diferansiyel Sınıflandırıcı ( Pdk) Ayrıca bir PC'ye benzerdir, ancak yalnızca "M" ve "RN" gibi birbirlerine benzer nesneler arasında ayrım yapmak için kullanılır. Buna göre, yalnızca ayrımların gizlendiği alanları analiz eder ve sadece kaynak görüntüleri değil, aynı zamanda tanınmanın erken aşamalarında oluşturulan hipotezler de yalnızca girdilere sunulmuştur. Bununla birlikte, çalışmalarının ilkesi PC'den biraz farklıdır. N boyutlu uzayda eğitim aşamasında, iki seçeneğin her biri için iki "bulut" (nokta noktaları) oluşturulur, ardından "bulutları" birbirinden ayıran ve onlardan yaklaşık olarak eşittir. . Tanıma sonucu, hangi yarı alanın kaynak görüntüye karşılık gelen nokta olduğuna bağlıdır.

MPC'nin kendisi hipotezleri itmez, ancak yalnızca mevcut olanı belirtir (listesi genellikle kabarcık metodu tarafından sıralanır), böylece etkinliğinin doğrudan değerlendirilmesi yapılmamıştır ve bunların özelliklerine dolaylı olarak eşittir. tüm ilk OCR tanınması seviyesi. Bununla birlikte, standartların sayısının seçilen işaretlerinin ve temsilciliğinin doğruluğuna bağlı olduğu açıktır, oldukça zahmetli bir görevin sağlanması.

Yapısal Diferansiyel Sınıflandırıcı ( Sdk) Başlangıçta el yazısı metinleri işlemek için uygulanır. Görevi, benzeri benzer nesneleri "C" ve "G" olarak ayırt etmektir. Böylece, SDK, her bir karakter çiftinin özelliklerine dayanır, eğitim sürecinin MPC'ninkinden daha da karmaşık olması ve iş hızı önceki tüm sınıflandırıcılardan daha düşüktür.

Yapısal Sınıflandırıcı ( Sc.Abblyy'nin bir gururu konusudur, başlangıçta, bir kişi "yazdırılan" harfleri yazarken, ancak daha sonra basılı olarak kullanıldığında, adlandırılan el sanatları metnini tanımak için tasarlanmıştır. Tanınmanın son aşamalarında kullanılır ve tamamen nadiren etkileşime girer, yani sadece en az iki hipotez, yeterince yüksek olasılıklarla geldiğinde.

Tüm sınıflandırıcıların nitel özellikleri aşağıdaki tabloda toplanır. Bununla birlikte, sadece algoritmaların birbirlerine göre etkinliğini değerlendirmemize izin vermemize izin verir, çünkü mutlak olmadıkları, ancak belirli bir test örneğinin işlenmesine dayanarak elde edilir. Tanınmanın son aşamalarında, mücadelenin tam anlamıyla yüzdesinin çıkarları için gittiğinin izlenimini arayabilir. Maddi 20% Hatalar% 20.

Rk.PcKKPdc *SDK **Sc **
İlk üç seçeneğin doğruluğu,%99,29 99,81 99,30 99,87 99,88 -
İlk seçeneğin doğruluğu,%97,57 99,13 95,10 99,26 99,69 99,73

* Tüm ilk seviye OCR algoritması ABBYY'nin değerlendirilmesi
** Uygun bir sınıflandırıcı ekledikten sonra tüm algoritma için değerlendirme

Bununla birlikte, oldukça yüksek doğruluğa rağmen, tanıma algoritması kendisi nihai bir karar vermez. MDA prensibine göre, hipotezler her mantıksal düzeyde uzatılır ve bunların sayısı geometrik ilerlemede büyüyebilir. Buna göre, tüm hipotezlerin tutarlı kontrolü, etkili olmaları muhtemel değildir ve bu nedenle OCR sistemlerinde ABBYY, hipotezlerin yapılandırılması yöntemini kullanır, yani bunları bir veya başka bir modele atamak. İkincisi, birkaç düzinek var, bu onların birkaçı olan birkaçı: kelime kelime, iyi kelime, Arapça sayılar, Roma figürleri, URL'ler, düzenli ifade - Her birinde, birçok özel model içerebilir (örneğin, birinin içindeki kelime ünlü diller, Latin, Kiril, vb.).

Tüm son eylemler, modellerde yerleşik hipotez tarafından gerçekleştirilir. Örneğin, bağlamsal kontrol belgenin dilini belirleyecek ve hemen yanlış alfabe kullanarak modellerin olasılığını önemli ölçüde azaltacak ve kelimeler bazı sembollerin tanımlanmamış tanınmasıyla ilgili hataları telafi edecektir: bu nedenle, "dönüş" kelimesi İngilizce Dil Sözlüğü - "Tum" aksine (yine de, popüler arasında değil). Sözlüğün önceliği herhangi bir sınıflandırıcınınkinden daha yüksek olsa da, mutlaka son bir örnek değildir ve genel durumda daha fazla kontrolleri durdurmaz: İlk olarak, yukarıda belirtildiği gibi, konvil olmayan bir kelimenin modeli var, İkincisi, özel bir sözlük örgütü, bazı bilinmeyen kelimelerin bir dili ifade edip etmeyeceğini varsaymak için yüksek bir hissi olasılığına izin verir. Bununla birlikte, kelime haznesi kontrolü (ve sözlüklerin dolgunluğu) tanınma sonucu önemli bir etkiye sahiptir ve ABBYY'nin testlerinde neredeyse iki kez hataların sayısını azaltır.

Sadece OCR değil

Basılı belgeler, sayısallaştırma ve otomatik işlemleri açısından ilgi alanlarından uzaktır. Oldukça sık sık, yani, yani, elle doldurulmuş, ancak nispeten düzgün bir şekilde (sözde elle çizilmiş semboller) içeren önceden tanımlanmış ve sabit alanlara sahip belgeler - çeşitli anketlerin örneği kullanılabilir. İşleme teknolojilerinin ayrı bir adı var - ICR. (Akıllı karakter tanıma) - ve OCR'den önemli ölçüde farklı. Öyleyse, bu durumda, görevin tüm belgeyi yeniden inşa etmemektedir, ancak belirli verilerin çıkarılmasında, iki ana altlığa parçalanır: İstediğiniz alanları bulmak ve aslında içeriklerini tanımak.

Bu oldukça özel bir alandır ve ABBYY, bunun için tamamen ayrı bir ABBYY flexicapture yazılımı sunar. Otomatik ve yarı otomatik sistemler oluşturmak için tasarlanmıştır, özel şablonların oluşturulduğu belirli belgeler üzerindeki ayarı varsayar, sayfalardaki çeşitli alanları akıllıca bulabilir ve bunlardaki verileri doğrulayabilir. Bununla birlikte, algoritmaların algoritmalardır. Karakterleri tanımak için, FineReader'da kullanılanlara benzer ve genel şema Son derece benzer:

Bununla birlikte, hala önemli bir farkı vardır: Yapısal bir sınıflandırıcı, işlemdeki zorunlu bir katılımcıdır - bu, el sanatları karakterlerinin özelliklerinden kaynaklanmaktadır. Ek olarak, ICR çok sayıda spesifik ek kontrol sağlar: örneğin, sembolün stricken olup olmadığı veya tanınmış sembollerin gerçekten tarihi oluşturup şekillenmeyeceği varsayılmaktadır.

Konuya devam ediyor:
Akıllı telefon

Minitool Güç Veri Kurtarma Serbest Sürümü, verileri kurtarmak için tasarlanmış kullanımı kolay bir programdır. Minitool Güç Veri Kurtarma ile çalışmak için ...