Stampa

Scansione testo con OCR su Linux

Scritto da Pisu il Venerdì, 12 Dicembre 2008 21:47. Scritto in Computer e Tecnologia

Oggi volevo riscrivere a computer lo statuto dell'associazione di volontariato, il cui file originale non si trova più. Allora ho pensato di fare una bella scansione ed importare il testo tramite riconoscimento OCR... ma volevo rimanere su Ubuntu!

Fortunatamente ho trovato una soluzione semplice, rapida, e soprattutto efficiente (il testo viene riconosciuto molto bene) grazie a XSane (software predefinito di scansione in Linux) + Tesseract (progetto per riconoscimento OCR a linea di comando). Ecco la pagina dove ho trovato i passaggi da fare: http://linux.p2pforum.it/wiki/OCR_con_tesseract_in_XSane

Testato con successo in Ubuntu 8.10.

Essenzialmente, bisogna anzitutto installare i pacchetti (io lo faccio con Synaptic...):

  • imagemagick
  • tesseract-ocr
  • tesseract-ocr-ita

Poi, scaricare lo script xsane2tess (estraendolo dallo zip); io a questo punto ho modificato la riga 15 con: TEMP_DIR=/tmp/ , in modo da non dover creare una cartella temporanea sotto la home (va benissimo quella globale...), quindi la riga 74, dove c'è il comando che richiama tesseract, aggiungendo in fondo: -l ita , così da fargli usare il dizionario italiano.

Posizionare quindi il file in /usr/bin, dandogli i permessi di esecuzione; dalla shell si possono usare questi comandi:

  • chmod a+rx xsane2tess
  • sudo mv xsane2tess /usr/bin

Infine, aprire XSane, andare in Preferenze > Impostazioni > OCR, e impostare il campo "Comando OCR" con xsane2tess. La configurazione è così completata!

Per effettuare una scansione con riconoscimeno OCR, avviare XSane, selezionare la modalità "Visualizzatore", e come profondità di colori "Binario". Avviare la scansione (tasto Acquisisci), alla fine apparirà una finestra contenente la pagina, fare click sul secondo pulsante della barra in alto, con le lettere ABC DEF; scegliere il file TXT dove salvare il testo, e dopo aver confermato attendere pazientemente!

Non c'è che dire: un passo avanti per il mondo Linux, vista l'importanza in certi casi dell'OCR...

Stampa

Il portale dell'Automobilista

Scritto da Pisu il Lunedì, 03 Novembre 2008 21:44. Scritto in Computer e Tecnologia

Da poco è stato ristrutturato un sito che è utile conoscere: Il portale dell'Automobilista.

ll portale è gestito dal Dipartimento per i Trasporti Terrestri e il Trasporto Intermodale del Ministero delle Infrastrutture e dei Trasporti (un nome più lungo no?), e dalla Direzione generale per la motorizzazione; o almeno penso, guardando la pagina Chi siamo.

Ad ogni modo, la cosa bella è che il portale è direttamente collegato ai database statali, e registrandosi è possibile accedere in particolare al saldo punti della propria patente, e visualizzarne l'estratto conto (punti persi e punti riavuti). E' stata proprio una bella sopresa vedere che, grazie ai 2 anni senza multe, mi sono stati ripristinati i 10 punti persi, tornando così a 20 punti, punteggio pieno! Io pensavo che dessero tipo 2 punti all'anno...

Inoltre, si possono vedere i dati aggiornati della propria auto (es. la data di scadenza della revisione.. utile per non dimenticarsi), e lo storico delle pratiche legate alla patente o alla carta di circolazione.

A tutte queste cose, si accede cliccando su Cittadino, e quindi La mia scheda. Poi c'è il codice della strada, news, moduli e attività varie. Segnatevelo che non si sa mai!

portale_automobilista