Commentaires : Comment empêcher ChatGPT d'exploiter le contenu de votre site web?

Pour devenir aussi performant, ChatGPT s’est entraîné sur une quantité astronomique de ressources, et votre site web en fait peut-être partie. Sachez qu’il existe des solutions pour se prémunir de l’exploitation de vos textes par OpenAI.

1 « J'aime »

Comment bloquer ChatGPT d’exploiter le contenu de votre site web ?

Comment déterrer Molière pour le tuer une seconde fois… :astonished:

4 « J'aime »

Et Bard, lui me copie/colle des phrases complètes de mon site web, sans aucune fois citer la source…

1 « J'aime »

Le fichier robots.txt ne sert strictement à rien ! Aucun robot ne respecte, y compris Google. C’est même écrit sur les pages Outils webmasters de google.

Pour certains robots, cela permet même d’accéder à des pages cachées.

1 « J'aime »

J’ai lu l’article pour comprendre le titre.

1 « J'aime »

Nous avons modifié le titre, qui était il est vrai, très maladroit dans sa première version.

1 « J'aime »

Merci. :+1:
Par contre sur le forum (zone des commentaires sur les actus) la faute est toujours là.

J’ai pu changer le titre côté forum, par contre pour l’aperçu en tête de sujet, on ne peut rien faire. ^^

1 « J'aime »

Le site est mal encodé alors. Les développeurs ont du boulot.

Rien a voir avec le site, puisque le forum c’est https://www.discourse.org/

Pourtant sur la page d’accueil du site, la correction a bien été appliquée. Il y a bien une anomalie.

Source? C’est pas ce qu’on lit sur leur site How Google Interprets the robots.txt Specification | Google Search Central  |  Documentation  |  Google Developers

J’ai eu le message « Indexé malgré le blocage par le fichier robots.txt » dans la search console.