OCR (reconnaissance de caractère) - des outils gratuits

En lisant le post de Korben qui parle de gttext, je me suis dit, cool un nouveau logiciel d'OCR sympa.  En fait nouvel GUI, mais derrière c'est quand même le bon vieux moteur "tesseract-ocr" ex logiciel commercial HP qu'ils ont mis dans le domaine public (merci HP !).  Et donc pour info, derrière gttext, il y a la librairie

tesseract-ocr
An OCR Engine that was developed at HP Labs between 1985 and 1995... and now at Google.


code.google.com

Moi j'utilisais FreeOcr mais qui n'est plus à jour: et ces 2 dernières années, j'ai plutôt utilisé ... Adobe Acrobat, mais dans les dernières version, genre Reader X, cela n'y est pas/plus ... ça doit être allé dans la version Pro/payante.

Et donc j'ai essayé le GtText et il marche plutôt bien.  Rappel: pour l'utiliser en Français, il faut télécharger la langue dans "File"  ->  "Preference"  -> "Add language".
Ensuite arrêter le bignou, le relancer, choisir votre langue.

Rappel 2 : c'est assez rare dans la vie d'avoir à utiliser un OCR, mais quand on en a besoin il faut peser le pour et le contre

  • temps de le chercher installer
  • temps de le configurer
  • temps de le faire marcher avec les images scannées
  • temps de remettre tout en forme (ben vi, le saut à la ligne, le formatage des textes, les paragraphes, ...)
  • vs
  • tout taper à la main

Je dis ça parce qu'un jour à force de m'entêter, je n'ai pas remarqué que si je l'avais taper à la main ça aurait été plus rapide ;)

Et pour les fanas, cette page de  donne une liste d'outils qui l'utilisent (mais pas gttext ... va savoir) http://code.google.com/p/tesseract-ocr/wiki/AddOns

GUI

  • VietOCR: A Java/.NET GUI frontend for Tesseract OCR engine. Supports optical character recognition for Vietnamese and other languages supported by Tesseract. Requirements: Java or .NET
  • gImageReader: A graphical GTK frontend to tesseract-ocr. Requirements: python, PyGtk
  • OCRFeeder: OCRFeeder is a document layout analysis and optical character recognition system. Requirements: linux, Python, pyGTK, Ghostscript, Unpaper
  • FreeOCR: Free OCR is a document scanning software including the Windows compiled Tesseract free ocr engine. It is very simple to use and supports opening multi-page tiff documents, Adobe PDF and fax documents as well as most image types including compressed Tiff's. It can scan using Twain and WIA scanning drivers. Requirements: Windows, .NET
  • PDF OCR X: PDF OCR is a simple drag-and-drop utility for Mac OS X and Windows, that converts your PDFs and images into text documents or searchable PDF files. Requirements: Mac OS X 10.5/Windows with Java 1.6 or higher
  • Lime OCR: A simple, free OCR software for Windows using tesseract-ocr engine. Requirements: Windows, ImageMagick
  • Ocrivist: Ocrivist is a utility which makes it possible to scan and OCR books and other printed documents to PDF or Djvu format. Ocrivist is intended for use on Linux and uses the Leptonica and Tesseract libraries. Requirements: Linux, Pascal
  • Lector: A graphical ocr solution for GNU/Linux based on Python, Qt4 and tessaract OCR. Requirements: Python, Qt4
  • Tesseract-GUI: Tessract-GUI is not a front-end for tesseract-ocr. It is just a graphical way to use it with simple image manipulation thru ImageMagick. Requirements: python, pyGTK
  • QTesseract: QT GUI for the Tesseract OCR. Requirements: QT4, c++

J'ai essayé le VietOCR (à la base pour reconnaître du Vietnamien), il est pas mal du tout.

Haut de page