La reconnaissance automatique d'écriture à l'épreuve des langues peu dotées - École nationale des chartes Accéder directement au contenu
Article Dans Une Revue The Programming Historian en français Année : 2023

La reconnaissance automatique d'écriture à l'épreuve des langues peu dotées

Chahan Vidal-Gorène

Résumé

Ce tutoriel a pour but de décrire les bonnes pratiques pour la création d'ensembles de données et la spécialisation des modèles en fonction d'un projet HTR (*Handwritten Text Recognition*) ou OCR (*Optical Character Recognition*) sur des documents qui n'utilisent pas l'alphabet latin et donc pour lesquels il n'existe pas ou très peu de données d'entraînement déjà disponibles. Le tutoriel a ainsi pour but de montrer des approches de *minimal computing* (ou d'investissement technique minimal) pour l'analyse de collections numériques à grande échelle pour des langues peu dotées. Notre tutoriel se concentrera sur un exemple en grec ancien, puis proposera une ouverture sur le traitement d'écritures arabes maghrébines manuscrites.

Dates et versions

hal-03982432 , version 1 (10-02-2023)

Identifiants

Citer

Chahan Vidal-Gorène. La reconnaissance automatique d'écriture à l'épreuve des langues peu dotées. The Programming Historian en français, 2023, 5, ⟨10.46430/phfr0023⟩. ⟨hal-03982432⟩
31 Consultations
0 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More