« Google », l’une (sinon la) des sociétés les plus puissantes du monde, s’illustre ici par la mise en œuvre d’une méthode, reposant sur un procédé technologique complexe, au combien bien pensée : celle du « CAPTCHA ». De manière extrêmement simplifiée, le « CAPTCHA » correspond à une sorte de test permettant à un site internet de différencier un utilisateur humain d’un ordinateur. Pour cela, le système de « CAPTCHA » génère des inscriptions sous forme de petites images (de manière aléatoire) que l’utilisateur du site doit déchiffrer et recopier s’il veut pouvoir continuer à naviguer. Cette solution, créée en 2004, en plus d’être très efficace pour effectivement distinguer un utilisateur humain, d’un robot, a permis à « Google » de devenir la plus grande bibliothèque numérique du monde, et ce, à moindre frais.

 

L’histoire commence en 2009, lorsque « Google » achète « reCAPTCHA », une start-up spécialisée dans les « CAPTCHA », et décide d’utiliser cette technologie pour poursuivre son travail de numérisation initié avec « Google Books », qui a numérisé depuis son lancement en décembre 2004, plus de vingt millions de livres…De quelle manière ? Dans chaque « CAPTCHA » proposé par le service, le premier mot est un mot test, qui est utilisé pour s’assurer que l’on est bien un humain ; tandis que le second, est un mot contenu dans un livre numérisé, que « Google » n’est pas parvenu à déchiffrer avec les logiciels de reconnaissance de caractère classiques. Ce mot est soumis à de nombreux utilisateurs : au bout de plusieurs réponses identiques, le mot est enregistré par l’algorithme de « Google », qui pourra mieux le reconnaître dans le futur et qui l’insèrera dans le texte numérisé.

captchaSource : west-info.eu

 
Plus récemment, en 2014, « Google » a annoncé sa volonté d’en finir avec les « CAPTCHA » traditionnels en présentant une nouvelle solution baptisée « reCAPTCHA ». En effet, les « CAPTCHA » habituels procuraient une expérience utilisateur assez médiocre car dans de nombreux cas, ils étaient difficiles à lire même pour des humains. D’autant que la situation ne faisait qu’empirer puisque les robots étaient de plus en plus sophistiqués, forçant les solutions à s’adapter en conséquence, avec du texte toujours plus difficile à lire. C’est la raison pour laquelle la solution du « reCAPTCHA » abandonne les textes complexes pour se baser sur une simple case à cocher. Ainsi le nouveau système est pourvu d’un moteur d’analyse de risque qui prend en compte toutes les actions de l’utilisateur qui ont mené vers la case afin de déterminer s’il est bien humain ou pas. Si le moteur estime que c’est le cas, il laisse passer l’utilisateur vers l’étape suivante.

index
Source : codexworld.com

 
A l’inverse si le logiciel a un doute, une seconde procédure se met en place, celle-ci pouvant notamment se modeliser par un système de « CAPTCHA » classique.

CAPTCHASource : grafikart.fr

 
Via cette technique de « CAPTCHA », de manière complètement opaque, des millions d’internautes contribuent involontairement à numériser des livres pour « Google Books » (en 2011, le système était ainsi utilisé quotidiennement par près de 30 millions d’utilisateurs), et cela évidemment sans bénéficier d’aucune compensation fiancière. Autrement dit, lorsque l’on transcrit un « CAPTCHA », l’on travaille pour « Google » de manière entièrement bénévole !

WYWYDRA_Alexis_PHOTO_2015DRA Alexis

Étudiant en Master 2 de Droit de l’Économie Numérique à la Faculté de Droit, de Sciences Politiques et de Gestion de Strasbourg, et membre actif de l’association MédiaDroit.

A propos de Alexis Wydra