AI , OCR ou paléographie?

Bonjour

quand on fait de la généalogie on tombe très rapidement sur des textes anciens qu’il faut « traduire » ou plutôt mettre en français d’aujourd’hui (ce qu’on appelle la paléographie)

Il me semble que grâce à l’IA et l’OCR on a fait des progrès considérables : Chatgpt en est un bon exemple me semble t-il.

Le souci est que ce brave chatgpt ne vous en propose qu’un par jour, après faut payer.

D’autres (Mistral AI par exemple) vous propose des usines à gaz.

Deux questions;
1- Y en a t-il d’autres bons à des tarifs abordables?
2- Y a t-il une solution OCR (windows 11) qui ne soit pas une usine à gaz ?

Merci pour vos conseils

Bonne journée

Salut poupadu,
Je compatis totalement.Mais Copiez-collez le texte par segments plutôt qu’en une fois afin d’économises les crédits gratuits.

Voici des conseilles d’outils :
Pour l’IA de transcription,

  • Claude : Aussi performant que ChatGPT, avec plus de requêtes gratuites (j’ai testé des extraits d’archives de 1800, c’est bluffant).
  • Perplexity.ai : Moins connu mais excellent pour les textes historiques (gratuit sans compte).

Pour l’OCR Windows,

  • Perso, j’utilise Cisdem PDF Converter OCR après avoir testé 4 logiciels. Il déchiffre l’écriture ancienne en 2 clics.
  • OCRmyPDF : Puissant mais technique (à réserver si vous aimez bidouiller).

Normalement, pour des textes à analyser, je scanne l’acte avec mon appareil photo, puis j’importe dans Cisdem, il extrait le texte. Et je le copie dans Claude/Perplexity pour la « traduction ». Si tu testes, tiens-moi au courant :wink: Bon courage pour les archives !
(PS : Mistral m’a aussi donné mal à la tête…)

Salut VerneyF,
et merci pour ta réponse, qui m’amène si tu es d’accord à te poser d’autres questions! Je suppose compte tenu de ta réponse que tu fais aussi de la généalogie. Et l’AI n’est pas toujours évidente à comprendre.

  • Perplexity a son application, c’est clair. Quid de « Claude » on le lance comment start-ai? AI-pro? je suis un peu perdu
  • Perplexity : utilises-tu un modèle particulier (en généalogie bien sur)? ou claude sonnet par exemple?
  • cisdem a une version gratuite combien de requêtes peut-on lui demander par jour?
  • tu dis que tu fais 1) cisdem pour extraire le texte 2) claude ou perplexity pour traduire : pourquoi ces 2 manips?
    Merci
    Bonne journée (chaude!)

Pour Claude (Anthropic) : Accès gratuit direct : https://claude.ai/login?returnTo=%2F%3F. Créez un compte (pour suivre ton historique) et commencez la question dans la barre de chat.
Pour modèle, utilisez « Claude Sonnet », parfait pour la paléo.
Exemple de prompt :
« Transcris ce texte du XVIIIe siècle en français moderne, en conservant les noms propres et les dates. Voici le contexte : xxx »

Pour Perplexity :
Pas besoin de modèle spécifique : Sa force est de croiser les sources historiques.
Exemple concret : Si l’acte mentionne un terme obscur (« bordelage »), il te trouvera des explications contextuelles.
Utilise-le en complément de Claude pour vérifier les ambiguïtés.

Pour Cisdem PDF Converter OCR :
Lien direct : [OFFICIEL] Cisdem PDF Converter OCR | OCR sur des PDF natifs et numérisés
Pas de « requêtes/jour » : C’est un logiciel payant, 49,99€/an (mais souvent en promo à 39,99€ et 59,99€ à vie).
Version d’essai : Gratuite pour scanner < 3 pages pendant 14 jours, assez pour tester.
Elle marche mieux que les OCR gratuits (comme Adobe Scan) qui échouent souvent sur l’écriture manuscrite.

Pourquoi 2 étapes (OCR + IA) ?
Cisdem OCR : Extrait le texte brut fidèle à copier et à utiliser.
Claude/Perplexity : « Traduit » le contexte.
L’OCR est ton ophtalmo, l’IA est ton historien linguiste :slight_smile:

Merci beaucoup VerneyF,
c’est très bien documenté.
ce sujet est pour moi résolu
Cordialement