Lire un acte ancien est l’un des défis les plus complexes de la généalogie : écriture irrégulière, latin, abréviations, pages abîmées, actes multi‑colonnes… L’intelligence artificielle (IA) apporte aujourd’hui des outils puissants pour transcrire, décrypter, traduire et analyser ces documents.

Mais attention : l’IA n’est pas un généalogiste. Elle aide, elle accélère, elle propose… mais elle ne remplace jamais la vérification humaine.

J’utilise le plus souvent Copilot et/ou Gemini.

🧭 Introduction

Lire un acte ancien est l’un des défis les plus complexes de la généalogie : écriture irrégulière, latin, abréviations, pages abîmées, actes multi‑colonnes… L’intelligence artificielle (IA) apporte aujourd’hui des outils puissants pour transcrire, décrypter, traduire et analyser ces documents.

Mais attention : l’IA n’est pas un généalogiste. Elle aide, elle accélère, elle propose… mais elle ne remplace jamais la vérification humaine.

🧰 1) Comment l’IA lit un acte ancien : les 4 étapes clés

L’IA moderne ne “lit” pas comme un humain. Elle procède par couches :

1. Détection des blocs

Elle identifie :

  • la date
  • le type d’acte
  • les noms propres
  • les témoins
  • les signatures
  • les formules fixes (ex. filius legitimus, sepultus est)

👉 Très utile pour les actes du Nord où les curés écrivaient en paragraphes serrés.

2. OCR spécialisé

Les modèles modernes (PaddleOCR, Tesseract custom, Transkribus) reconnaissent :

  • l’écriture cursive
  • les lettres anciennes
  • les ligatures
  • les abréviations

3. Traduction du latin

L’IA reconnaît les formules types :

  • die vigesima tertia → le 23
  • uxor → épouse
  • patrinus / matrina → parrain / marraine
  • anno domini → l’an du Seigneur

4. Extraction des informations généalogiques

Elle isole :

  • le sujet de l’acte
  • les parents
  • les témoins
  • les lieux
  • les professions
  • les signatures

👉 C’est exactement ce que tu mets en place dans ton pipeline TNG + OCR.

🔍 2) Ce que l’IA fait très bien (et qui fait gagner un temps fou)

✔️ 1. Lire les formules répétitives

Les actes paroissiaux sont très standardisés. L’IA repère immédiatement les structures.

✔️ 2. Détecter les noms propres

Même mal écrits, même abrégés.

✔️ 3. Proposer une transcription lisible

Elle transforme une écriture difficile en texte clair.

✔️ 4. Traduire le latin sans erreur

Les formules religieuses sont très régulières.

✔️ 5. Reconstituer un acte multi‑pages

Très utile pour les registres du Nord où les actes débordent d’une page à l’autre.

⚠️ 3) Les limites de l’IA : ce qu’elle ne doit jamais faire seule

1. Identifier une personne avec certitude

Deux “Jean Dubois” dans le même village ? L’IA peut se tromper.

2. Fusionner des individus

Elle peut croire que deux actes concernent la même personne… alors que non.

3. Inventer des mots manquants

Si une marge est abîmée, elle “devine”.

4. Interpréter un lien familial implicite

Exemple : Un témoin n’est pas forcément un parent.

👉 L’IA propose. 👉 Le généalogiste confirme.

🧱 4) Les erreurs fréquentes que l’IA aide à éviter

🟡 Mauvaise lecture des dates

Exemple :

  • 7bre = septembre
  • 8bre = octobre
  • 9bre = novembre
  • Xbre = décembre

L’IA les reconnaît immédiatement.

🟡 Confusion entre prénoms latinisés

  • Joannes = Jean
  • Jacobus = Jacques
  • Guillelmus = Guillaume

🟡 Mauvaise segmentation d’un acte

L’IA repère les blocs logiques.

🟡 Oubli des témoins ou parrains

Elle les extrait automatiquement.

🤖 5) Les outils IA les plus utiles pour lire les actes

Sans vouloir faire de publicité, à titre personnel, j’utilise le plus souvent Copilot et/ou Gemini. J’insère l’acte et je lui demande ce dont j’ai besoin: un résumé, une transcription…

📝 Conclusion

L’IA ne remplace pas le généalogiste : elle l’amplifie. Elle permet de lire plus vite, de comprendre plus clairement, de vérifier plus efficacement. Mais elle exige rigueur, prudence et esprit critique.

Bien utilisée, elle devient un allié puissant pour déchiffrer les actes anciens et enrichir ton arbre généalogique.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *