overview_3_1

Quand vous êtes passionné de littérature populaire et que vous ne lisez plus que sur liseuse numérique ou bien si vous êtes éditeur et que vous rééditez des livres de la littérature populaire, vous passez obligatoirement, à un moment ou un autre, par une tâche obligatoire : scannez les livres.

Quiconque s’est déjà essayé à scanner des livres de la littérature populaire saura que vous pouvez être confrontés à quatre genres d’ouvrages :

1) Des petits fascicules de 32 pages, de taille petite à moyenne, agrafés sur la tranche.

Ce genre d’ouvrage, du fait de l’agrafage à la tranche, s’ouvre facilement. Ce format, de plus, est guère et épais (contrairement à « Guerre et Paix ») et se scanne plutôt facilement avec un traditionnel scanner à plat.

2) Des fascicules de 64 pages ou 96 pages, de taille moyenne, agrafés à travers la marge.

Ce genre d’ouvrage ne peut s’ouvrir à plat du fait de l’agrafe. Pis, quand on tente de l’aplatir avec le capot du scanneur à plat, les pages gondolent, ce qui produit des scans de mauvaise qualité puisque dès que la page n’est pas collée à la vitre, cela produit des flous qui empêchent les logiciels de reconnaissance de caractères (OCR) de bien faire leur travail.

Seule solution, alors, retirer l’agrafe afin de séparer les cahiers et de les scanner un à un.

Cette solution produit des scans plutôt bons, mais oblige à des manipulations supplémentaires allongeant la durée de la tâche, d’autant que les pages ne sont plus scannées dans l’ordre, à moins de reformer l’ouvrage, sans l’agrafe.

Mais le plus problématique est qu’avec des ouvrages de cet âge, l’agrafe est souvent rouillée et fragile, érodée par le temps, et le simple fait de la défaire suffit à la détruire. Du coup, impossible, par la suite, de reformer l’ouvrage à l’identique ce qui, pour un collectionneur ou pour une personne désireuse de revendre l’ouvrage par la suite est un grand problème.

3) Des romans aux cahiers collés.

Impossible à ouvrir à plat, cela implique que les scans produiront des ombres à la marge, ombre recouvrant parfois le bord du texte, rendant impossible la reconnaissance de caractères à ces endroits.

De plus, du fait que les pages ne seront pas aplaties, la distorsion des lignes à la marge compliquera déjà la reconnaissance de caractères.

4) Des romans aux cahiers cousus.

C’est le cas, par exemple, des premiers ouvrages de la collection « Le Masque ».

Ces ouvrages s’ouvrent parfaitement et les pages peuvent être mises à plat sur la vitre d’un scanneur classique.

Le seul souci demeure alors la différence d’épaisseur d’un côté et de l’autre de l’ouvrage ouvert à plat (selon si l’on scanne le début ou la fin du livre) ce qui rend plus difficile de maintenir les pages bien à plat.

Le principal souci devient alors le temps nécessaire à scanner un ouvrage de plusieurs centaines de pages : ouvrir le capot du scanneur, ouvrir l’ouvrage, placer l’ouvrage contre la vitre, refermer le capot du scanneur, appuyer sur le bouton pour lancer le scan, attendre le double passage des capteurs, ouvrir le capot du scanneur, reprendre le livre, le retourner, tourner la page, retourner le livre, le placer contre la vitre, fermer le capot du scanneur, appuyer sur le bouton pour lancer le scan, attendre le double passage des capteurs...

Vous comprendez alors que dans des conditions idéales (des ouvrages en bon état), scanner des fascicules 32 pages ou des romans aux cahiers cousus, produit des résultats de bonne qualité permettant de travailler correctement les textes par la suite.

Le seul souci réside dans le temps nécessaire à la manœuvre, un temps et une répétition de mouvements qui sont rébarbatifs et empêchent de scanner de nombreux ouvrages à la suite.

Pour les deux autres styles d’ouvrages, la répétition de mouvements est toujours présente, et le temps s’allonge du fait de chercher à aplatir au mieux les ouvrages pour assurer le meilleur scan possible.

Malheureusement, les scans obtenus sont bien souvent de piètres qualités ce qui rend la reconnaissance de caractères très difficiles et oblige, lors de cette phase, à retaper à la main toutes les parties du texte qui ne sont pas reconnues par le logiciel.

Ce travail supplémentaire, outre être chronophage, empêche de prendre du plaisir au travail du texte et à profiter pleinement de la lecture nécessaire à la correction des coquilles d’OCRisation.

Si vous rajoutez à ces soucis que, bien souvent, vous avez affaire à des ouvrages en mauvais état, des pages gondolées par le temps, l’humidité, froissées... vous vous trouvez alors face à un travail dantesque pour convertir l’ouvrage papier en ouvrage numérique.

Heureusement, Czur est né.

Czur est un scanneur destiné à la numérisation d’ouvrages et de documents.

Je vous parlerai ici du produit en ma possession, le Czur 16 plus (18, même, maintenant, pour une version en 18 Mpixels fonctionnant en Wifi).

Czur est une entreprise chinoise fondée en 2013 axée sur les solutions de numérisation et d’archivage de documents.

Fin 2017, l’entreprise annonce la sortie d’un nouveau modèle de scanner : le Czur 16 plus.

Le système consiste en une caméra 16 MPixels positionnée en haut d’un support vertical et suspendue au-dessus d’un tapis. Des éclairages par le dessus et par le côté permettent de mettre en lumière le texte à scanner et d’éviter ainsi les zones d’ombres.

Pour faciliter le travail de numérisation, le Czur 16 plus est fourni avec, en plus d’un tapis noir pour y déposer le texte et servir de « fond noir » à l’ouvrage à scanner, d’une pédale permettant de déclencher le scan avec le pied, d’un bouton filaire, pour faire la même chose avec la main, de deux doigtiers pour maintenir le livre bien ouvert et d’un logiciel permettant de gérer le tout et de vous proposer plusieurs modes de scannage.

Car, Czur 16 plus n’est pas que matériel, il est aussi logiciel.

Grâce à cet ensemble d’outils, je peux donc désormais scanner rapidement et facilement tous les genres de textes, du petit fascicule de quelques pages jusqu’au gros recueil qui m’était impossible à scanner avec un scanneur à plat du fait de sa taille et de l’impossibilité de poser bien à plat le texte à scanner.

Mais, en plus, la partie logiciel offre de multiples atouts.

Vous pouvez, grâce à lui, scanner un ouvrage ouvert et attendre du logiciel qu’il détecte le document, sépare les deux pages en vis à vis et, qu’en plus, il redresse les lignes de textes courbées vers la gouttière.

Si cette option est fort pratique, elle nécessite du temps et un bon éclairage naturel pour permettre au logiciel de fonctionner aux mieux. Avec l’expérience, on se rendra compte qu’on peut faire quasi aussi bien, mais beaucoup plus rapidement.

Car, grâce au logiciel, on peut multiplier les zones de scans en une seule prise.

Effectivement, grâce à la souris, vous pouvez définir plusieurs cadres qui correspondront aux prises de vues que vous voulez.

Ainsi, non seulement vous n’êtes pas obligé de « photographier » tout le document, mais vous pouvez en prendre des prises de plusieurs morceaux de ce document à la fois.

Du coup, pour obtenir le même résultat que précédemment (une séparation automatique des pages en vis-à-vis) il vous suffira de créer deux cadres, le premier au-dessus de la page de gauche, le second, sur celle de droite, en faisant bien en sorte que les deux cadres se chevauchement légèrement sur la gouttière afin d’éviter les problèmes avec certains ouvrages.

De cette façon, sans temps de traitement, ou presque, vous avez vos deux pages de séparées, sans avoir besoin d’un bon éclairage, là où, précédemment, il vous fallait quelques secondes et une bonne lumière.

Une seconde ou deux de gagnée, ce n’est pas grand-chose, mais quand vous vous rendrez compte que vous pouvez scanner très rapidement, avec la seconde solution, des documents de plusieurs centaines de pages, vous constaterez que, au final, le gain de temps peut être énorme.

Car, un des grands atouts de Czur est sa pédale (j’avoue que je n’utilise même pas le bouton filaire).

Avec cette pédale, d’une pression du pied, vous déclenchez le scan, ce qui vous laisse les deux mains libres pour tourner la page et maintenir le livre.

Le temps d’appuyer avec le pied, vous voyez apparaître sur votre document trois lignes rouges émanant du capteur, signe qu’il a pris la photo, vous pouvez ainsi tourner la page et appuyer de nouveau.

Avec une telle rapidité d’exécution, scanner un roman devient un jeu d’enfants.

Ajoutez à la panoplie des options la possibilité de scanner en noir et blanc ou en couleur, d’effacer une page, de transférer les documents scannés en autant d’images que de pages scannées ou bien en un seul pdf... qu’en plus, un logiciel OCR est fourni, vous permettant de transformer immédiatement votre document papier en un fichier texte (avec quelques erreurs d’OCRisation, tout de même), voilà qui rend l’ensemble assez complet.

Au final, après plus d’un an d’utilisation, scanner des livres est quasiment devenu un plaisir là où c’était, avec un scanneur à plat, une contrainte. 

De plus, j’ai pu scanner avec Czur des ouvrages que je ne pouvais pas scanner avant, et ce, en un temps record.

Ajoutez à cela qu’il est livré avec une belle boîte de rangement (grosse boîte, il s’agit tout de même d’un matériel imposant même si, au final, la boîte n’est guère plus grande qu’un scanneur à plat) dans laquelle le matériel est bien protégé et Czur n’aura désormais, pour vous, plus qu’un défaut, son prix, plus de 400 euros même s’il est trouvable, en période de soldes vers les 350 euros.