Commentaires : Mais que fait "Guerre et Paix" de Tolstoï dans les fichiers liés à CUDA de NVIDIA?

NVIDIA est peut-être plus littéraire que nous l’aurions cru. Un fichier découvert dans le dossier NVIDIA CUDA des détenteurs de GPU GeForce n’est pas tout à fait comme les autres. Intitulé « warandpeace.txt », il contient le roman éponyme de Léon Tolstoï.

2 « J'aime »

Curieux ce test pour une 3090 ! :face_with_raised_eyebrow:

je suis fan :smile:

Même avec une vieille brouette lessivée, ça va super vite de scanner 3Mo, et les différences de perfs sont probablement plus petites que la résolution des timers!
Je ne vois pas trop ce que ce test peut montrer à part peut-être juste montrer que « ça marche »…

1 « J'aime »

Les conspirationnistes vont probablement trouver une explication bien à eux.

1 « J'aime »

Ah mince, un riche milliardaire venait d’acheter le NFT Guerre et Paix pour 4M€. Ben tant pis il pourra toujours le revendre 50$ (;

"Absolument, c’est en fait un message de la part des développeurs de NVIDIA qui confirme leur soutien à la Russie et non l’Ukraine car l’auteur est russe et comme la Russie d’hier et d’aujourd’hui c’est la même à 3 poils de fut près.

On remarquera egalement dans son livre des allusions aux talmud islamo-sioniste.

Allusions complotiste élaboré en l’an 2012. Depuis comme dirait ntm on est passé à autre chose."

Désolé, je pouvais pas m’empêcher de faire de l’ironie si quelqu’un trouve encore une hypothèse de 20 pages pour justifier que ce roman a été déposé pour autre chose que ce qu’on a bien voulu dire, je dirais on continue de marcher sur la tête.

1 « J'aime »

J’aurais plutôt mis « Chasse et pêche » ou « nature et découverte », quiz : quel lambda va trouver le texte ?

Sauf que sur un GPU, chaque coeur CUDA va compter dans une petite partie du texte en parallèle, et donc ça va aller environ 100x plus vite que sur le CPU. Les différences seront largement plus grande que la résolution des timers…

Tu n’as pas compris mon raisonnement.
En prenant comme hypothèse que ton timer a une résolution de 1 micro seconde, si tes calculs sur CPU sont 1000x plus lents mais prennent moins d’une micro seconde, tu auras le même résultat dans les 2 cas: 0 micro seconde! :smiley:
Et c’est sans compter les couts cachés de Cuda (gestion mémoire, transferts de données) qui vont être important par rapport au temps de calcul de l’algo de recherche! :stuck_out_tongue:

J’ai très bien compris ton raisonnement, mais deux choses sont fausses dedans: 1) le comptage de charactères dans 3Mo de texte va prendre plus d’une microseconde, et 2) n’importe quel benchmark doit toujours être répété un certain nombre de fois. Pour le fait que le transfert de données risque de dominer le temps de calcul, je serais surpris que ce soit le cas pour si peu de données, mais c’est pas impossible. Si NVIDIA a intégré ce sample à ses demos CUDA, tu peux être à peu près sûr que l’avantage par rapport au CPU est important, et c’est d’ailleurs pour ça qu’il leur fallait un gros bloc de texte :slight_smile:

Tu as raison sur un point, je voulais dire milliseconde! :smiley: Et comme tu m’as mis un doute, j’ai codé rapidement un test.
En conclusion, 2 ms pour parser 3 Mo et incrémenter un compteur sans parallélisme sur mon CPU en C++ et 1ms pour la même chose en OpenCL sur 256 works. Je n’ai pas ma carte Nvidia dans ma machine aujourd’hui, mais ça ne change pas fondamentalement la donne. On peut probablement optimiser pas mal: je suis parti sur une sorte de « sum reduction » basique et je n’ai fait aucun test pour voir si le nombre de works était optimal, mais sur AMD c’est pas si important que ça et on est sur une taille de donnée qui de toute façon ne permet pas grand chose…
Donc aucune conclusion possible, parce que mon timer n’a qu’une résolution de 1ms et que le test est bien trop léger.
Pour moi la démo Cuda n’est la que comme illustration ou test, pas comme benchmark.

Bah l’ancien parti de « chasse, pêche, nature et tas de … tradition »