
Rapport sur les techniques d’Active Learning pour la reconnaissance de caractères manuscrits arabes
Expected Model Change (EMC) 1.1. Principe L’Expected Model Change (EMC) consiste à
sélectionner les exemples dont l’ajout à l’ensemble d’apprentissage est susceptible de provoquer
le plus grand changement dans le modèle. Cette stratégie maximise l’effet informatif de chaque
annotation. Le calcul exact du changement attendu peut être coûteux. Il est donc approximé à
l’aide de :
La marge de décision : les points proches de la frontière sont les plus susceptibles de modifier le
modèle.
L’entropie : utilisée lorsque la marge n’est pas disponible, elle identifie les points où le modèle est
le plus incertain.
1.2. Implémentation Le processus EMC suit le schéma classique de l’Active Learning : - Initialisation : un
petit ensemble annoté (5 % du pool, soit 224 échantillons) est utilisé pour démarrer. - Entraînement du
modèle : un SVM à noyau RBF est entraîné sur l’ensemble annoté, avec calibrage des probabilités
lorsque le nombre d’échantillons par classe le permet. - Sélection des instances : les points les plus
informatifs sont choisis en fonction de la marge ou de l’entropie. - Mise à jour : les instances
sélectionnées sont ajoutées à l’ensemble annoté et retirées du pool non annoté, puis le modèle est
réentraîné.
1.3. Résultats - Précision : de 62,05 % à 85,18 % sur 15 cycles, évaluation finale à 85,54 %. - Certaines
classes (MiimI, HaI, Alifi, Dheli) présentent des F1-scores proches de 1, tandis que d’autres (Caafi, Faal,
Dadi) restent plus difficiles. - La matrice de confusion montre des erreurs entre caractères
morphologiquement proches.
1.4. Visualisation - La courbe d’apprentissage montre une progression régulière. - Confusions
principales : Caafi ↔ Kafi, Faal ↔ Dheli, Dadi ↔ Sadi.
1.5. Conclusion EMC maximise l’impact de chaque annotation, offrant de bonnes performances avec
peu d’exemples. Méthode plus coûteuse mais adaptée aux problèmes multi-classes.
Variance Reduction (Réduction de variance) 2.1. Principe Sélectionner les exemples qui réduisent
le plus l’incertitude du modèle pour stabiliser l’apprentissage.
2.2. Implémentation - Entraînement d’un SVM calibré. - Calcul de la variance de prédiction. - Sélection
des points avec variance élevée.
2.3. Résultats - Précision croissante à chaque cycle. - Les premières annotations ciblent les zones
difficiles. - Classes rares parfois moins représentées.
2.4. Conclusion La méthode stabilise le modèle, attention à l’équilibre des classes.
Density-Weighted Methods (Méthodes pondérées par la densité) 3.1. Principe Combine
incertitude et représentativité. Les points difficiles dans des zones denses sont privilégiés,
évitant les outliers.
3.2. Implémentation - Calcul incertitude et densité. - Score global = incertitude × densité. - Sélection des
points avec score élevé.
1.
2.
3.
1.
1.
1