Ce n’est pas que la recherche, le coût de production des puces a explosé aussi.
Un NV5 (TNT2 Ultra), c’était 90mm², un GB202 (RTX 5090) c’est 577mm².
À qualité de gravure égale, sur un wafer de 300mm tu mettrais plus de 600 NV5 contre à peine une trentaine de GB202.
Donc sans tenir compte de l’augmentation du coût d’un wafer (qui augmente à chaque amélioration de la finesse… en 2004 un TSMC 90nm c’était 2000$, aujourd’hui TSMC 3nm c’est 20 000$), le GB202 coûte déjà ~20x plus cher qu’un NV5. En tenant compte de l’évolution du prix des wafers, on doit friser un facteur 100 (pour une puce tout de même plus de 6000 fois plus complexe, si on se base sur le nombre de transistors…).
Au prix actuel d’un wafer 4nm chez TSMC, le GPU seul coûte déjà plus de 600$ aujourd’hui. Donc le GPU seul, c’est déjà plus que le prix de vente de la TNT2 Ultra complète réajusté en fonction de l’inflation…
Et ça c’est le coût pour le GPU sur un wafer, donc même pas encore découpé et packagé… À celà faut ajouter bien sûr aussi tout le reste de la carte (et notamment, la RAM, pas donnée non plus, l’étage d’alimentation bien plus complexe, etc…) et bien sûr, comme tu le dis, la R&D.
Alors oui, les marges ont sans doute quand même augmenté (ne serait ce que parce que les GPU pour cartes graphiques sont en concurrence avec les GPU pour l’IA et le HPC : les sommes en jeu dans ce secteur étant bien plus élevées, les marges y sont plus élevées, et ça impacte forcément les marges sur les GPU pour cartes graphiques, même si elles restent bien plus faibles que dans l’IA/HPC). Mais la principale raison de la hausse du prix des cartes, c’est quand même la hausse des coûts.