Recogniform - Tecnologie di riconoscimento ottico

 

Go to the International website


Libreria per l'analisi del layout

download demo    download versione di valutazione    richiedi informazioni  

Recogniform Layout Analysis SDK consente di effettuare l'analisi del layout di qualsiasi documento attraverso complessi algoritmi in grado di riconoscere con estrema precisione le diverse tipologie di aree che compongono la pagina.

Questa libreria identifica le seguenti tipologie di aree:

  • testo
  • testo invertito
  • rumore
  • immagini (fotografie o disegni)
  • tabelle (righe, colonne e celle)
  • linee orizzontali e verticali


In seguito al riconoscimento di questi elementi, è quindi possibile operare un'ulteriore sotto-classificazione definendo un insieme di regole determinabili in base alla tipologia del documento da analizzare. Ad esempio, analizzando una pagina di giornale, potremmo riconoscere come "didascalia" un'area di testo, qualora la stessa si trovi in corrispondenza della parte inferiore di un'immagine, magari centrata, magari con un carattere di dimensione inferiore alla media degli altri caratteri riportati nella pagina, riconosciuti come corpo del testo. Alla stessa maniera, è possibile riconoscere come "titolo" eventuali linee di testo in base alla posizione ed alla dimensione dei caratteri in esse contenuti.

 

Finalità dell'analisi del layout:
Generalmente obiettivo di chi effettua l'analisi del layout di un documento (sia esso un giornale, una rivista, un contratto, un modulo, una fattura, o qualsiasi altro tipo di documento) è comprenderne automaticamente la struttura, per poi identificarlo, estrarne le aree di interesse ed eventualmente effettuare il riconoscimento automatico del testo attraverso l'uso di motori di lettura ottica (
OCR, ICR, BCR), per gli usi più disparati, dalla semplice estrazione dati, all'indicizzazione automatica, alla conversione in documento elettronico editabile, mantenendo lo stesso layout dell'originale.

Per migliorare i risultati dell'analisi è importante che la qualità dell'immagine sia la migliore possibile e che, prima di essere processata da Recogniform Layout Analysis, sia sottoposta a pre-processing per effettuare:

Raddrizzamento (Deskew)
Utilizzando scanner ad alte prestazioni, l' alimentatore automatico di fogli inevitabilmente inclina leggermente il foglio: è possibile risolvere il problema ed ottenere immagini diritte senza riscandire, correggendo l' inclinazione in modo automatico e velocemente. Vengono gestiti fino a 45 gradi di inclinazione e l' angolo può essere stimato con grande accuratezza in due modi diversi: analizzando il testo contenuto nell' immagine o trovando il bordo nero interno al foglio. Per avere ulteriori informazioni sul deskew è possibile dare uno sguardo al nostro
Deskew SDK

Despeckle e rimozione del rumore
Scandendo delle fotocopie o dei microfilm, la polvere e la sporcizia possono generare rumore nelle immagini: è possibile risolvere il problema con la rimozione automatica del rumore. Determinando quanto grande una particella di sporco può essere, è possibile tarare il processo per le proprie immagini. Per avere ulteriori informazioni sul despeckle è possibile dare uno sguardo al nostro
Despeckle SDK

Rimozione del bordo nero e ritaglio automatico
Utilizzando un scanner per microfilm o uno scanner per documenti con sfondo nero, tutto intorno all' immagine viene generato un bordo nero: è possibile risolvere il problema ottenendo immagini pulite senza la necessità di effettuare un'altra scansione. Basta selezionare un livello di soglia e scegliere se rimuovere il bordo scuro ritagliando l' immagine o se sbiancarlo. Per avere ulteriori informazioni sul black border removal è possibile dare uno sguardo al nostro
Black Border Removal SDK

 

Esempio:
Prendiamo ad esempio un'immagine di cui è necessario eseguire l'analisi del layout: si noti come, attraverso i processi sopra descritti, il sistema riconoscerà automaticamente le aree, distinguendo tra aree di testo, testo invertito, immagini, linee, tabelle, ecc.

Come si evince dall'immagine a destra, con Recogniform Layout Analysis è possibile individuare le diverse aree con contenuto omogeneo, qui contrassegnate ciascuna con un colore diverso. In questo caso abbiamo:

  • colore giallo: testo
  • colore arancio: immagini
  • colore verde: testo invertito
  • colore rosa: linee
  • colore azzurro: colonna
  • colore grigio: tabella

 

 

Versione di valutazione:
E' possibile scaricare una versione di valutazione del prodotto per
Visual Basic, Visual C++ o Delphi . E' anche possibile scaricare una dimostrativo completo cliccando qui.

 

Prezzo e ordini:
Per informazioni riguardanti il prezzo di
Recogniform LayOut Analysis si prega di usare la pagina dei contatti.

 

Ulteriori Informazioni
Per ulteriori informazioni si prega di usare la
pagina dei contatti.


© Recogniform Technologies S.p.A. - P.IVA IT02376980781 - Tutti i diritti sono riservati