XFX Mercury RX9070XT OC Gaming sous Fedora (Linux) :

Ceci est une ébauche, la version finale devrait arriver rapidement

Plus de 5ans!!! 5ans à attendre, et économiser, pour avoir un prix correct pour une carte graphique haut de gamme qui me plait!

Covid+cryptomineur+scalpeur, concepteurs et fabriquant qui se goinfre encore et encore et sans fin… Avec des tarifs HAUT DE GAMME pour des cartes bas de gamme, etc…

C’est quand même encore le cas, mais bon cela se calme quand même. Et ce même si l’on ne retrouvera pas le genre de tarifs d’avant 2020…

Du coup voici enfin la remplaçante de ma RX5700XT qui retrouvera mon ancien R7 2700x pour remonter une autre petite machine assez performante.

Présentation :

Voici donc la XFX Mercury RX9070XT OC Gaming :

  • Stream Processors :  4096
  • Compute Units : 64
  • Bus Mémoire : 256bit
  • Horloge Mémoire : 20 Gbps
  • Taille Mémoire : 16 Go (16GB)
  • Bande Passante Mémoire : jusqu’à 640 Go/s (GB/s)
  • Effective Memory Bandwidth: Up to
  • Type de Mémoire : GDDR6
  • Profile de la Carte :  3.5 slot
  • Refroidissement : 3 ventilateurs de 10mm + Radiateur à chambre à vapeur
  • Version PCI-Express max : PCI-Express 5.0 16 lignes
  • Prix : 795€

C’est une carte imposante, très imposante :

  • Dimension (cm) : 36 x 15.5 x 7.2
  • Dimensions Grand Carton (cm) : 46 x 39.5 x 47.5
  • Poid du grand carton (Kg) : 15.4
  • Dimensions Package (cm) : 44.5x 23.5 x 12.5
  • Poid Package (Kg) : 2.35

Elle n’est pas faite pour tous les boitiers (D’autres modèles sont plus adaptés) et le ventirad est LARGEMENT surdimensionné (voir la partie sur les températures relevé).

Pour l’installer j’ai modifié mon circuit de watercooling avec la suppression de mon petit radiateur, 140mm/60mm à l’arrière du boitier, en ne gardant que celui de 360mm/45mm au dessus pour le processeur. J’en profite pour tenter de remonter la carte mère histoire de récupérer un emplacement PCI express. Mais bon j’ai un peu le radiateur du haut qui bloque, donc ce sera à tester…

J’ai choisi ce modèle sur conseil, mais aussi après avoir fait le tour de ses caractéristiques et aussi pour son prix raisonnable de nos jours (790/795€).

J’ai pourtant eu une expérience mitigé avec la marque XFX, ayant eu des déboires avec leurs ventilateurs qui ont explosés en marche sans être à fond sur une ancienne carte. Sans compter quelques points de fabrication qui me semblait un peu bas de gamme.
Mais cela a bien changé depuis, donc je ne me fais pas trop de soucis ;), à voir avec le temps. Sachant que je peux laisser l’actuel en place qui ne fait pas de bruit même avec une grosse utilisation des ressources. Donc pas besoin d’investir dans un radiateur de watercooling. Seul ombre au tableau, la place que prend le ventirad d’origine, à savoir 3,5 emplacements d’épaisseur…

Voici la machine utilisé pour cet article :

  • Processeur : AMD Ryzen 5800X
  • Carte mère : MSI X470 Carbon
  • Mémoire : 64Go Kingston DDR4 3600Mhz
  • Boitier : BQUIET Dark Base 900
  • Écrans : KTC 32″ QHD 165hz
  • Système d’exploitation : Fedora 42
  • Bibliothèques graphique (OpenGL, Vulkan, D3D, etc…) : Mesa 25.2-git du 06/06/2025

Elle est actuellement limité au PCI-Express 3.0 à cause de la carte mère actuel (le processeur supporte le PCI-Express 4.0), la perte de performance estimé n’est que de 1 à 2% maximum dans certains cas. Mais bon cette machine me suffit, même pour mon utilisation très poussé, pour le moment.

Voici la liste des thèmes abordés pour les tests effectués :

  • Benchmark (possible qu’il y en ai d’autres par la suite) :
    • Superposition (Natif)
    • Valley (Natif)
    • Heaven (Natif)
  • Jeux :
    • cyberpunk 2077 (Proton)
    • Hogwarts legacy (Proton)
    • Xonotic (natif)
  • Applications :
    • Blender (Rendu 3D)
    • clpeak (GPGPU)
    • Tests

A savoir que les tests seront au maximum en QHD, 2,5K, 2560x1440pixels ou 1440p si vous préférés, voir en fullhd parfois en plus.

Sur/Sous-fréquençage (Over/Under-clocking) :

Nous utiliserons ici l’outil LACT disponible sur Fedora sous forme de FLATPAK.

La carte étant déjà bien sur-cadencée de base, les gains ne sont sans doute pas très impressionnant ici.
C’est donc à prendre en compte si vous faites vos propres tests de ce coté, sauf vers le bas (gains de consommation très important par contre!).

Les tests seront complétés petit à petit selon les expérimentations.

Voici les valeurs appliqués et les résultats :

« Eco+ » :

  • Mode : Manuel
  • Vitesse GPU max : -500 Mhz
  • GPU TDP max : 50 Watt
  • GPU Tension : -120 mv
  • Vitesse VRAM max : 800 Mhz
  • Vitesse VRAM min : 194 Mhz
  • Profile : 3D_FULL_SCREEN

Superposition :

Clpeak :


Platform: AMD Accelerated Parallel Processing
  Device: gfx1201
    Driver version  : 3649.0 (HSA1.1,LC) (Linux x64)
    Compute units   : 32
    Clock frequency : 2570 MHz

    Global memory bandwidth (GBPS)
      float   : 454.62
      float2  : 464.28
      float4  : 470.35
      float8  : 478.92
      float16 : 485.32

    Single-precision compute (GFLOPS)
      float   : 3414.33
      float2  : 3774.63
      float4  : 3700.60
      float8  : 3390.73
      float16 : 3396.50

    Half-precision compute (GFLOPS)
      half   : 3464.49
      half2  : 6726.45
      half4  : 6681.26
      half8  : 6606.63
      half16 : 6697.41

    Double-precision compute (GFLOPS)
      double   : 274.71
      double2  : 275.05
      double4  : 273.63
      double8  : 265.20
      double16 : 281.58

    Integer compute (GIOPS)
      int   : 1399.89
      int2  : 1407.58
      int4  : 1416.65
      int8  : 1375.97
      int16 : 1360.38

    Integer compute Fast 24bit (GIOPS)
      int   : 3808.17
      int2  : 3321.41
      int4  : 3281.98
      int8  : 3265.83
      int16 : 2781.15

    Integer char (8bit) compute (GIOPS)
      char   : 3278.88
      char2  : 1929.87
      char4  : 1917.91
      char8  : 1552.10
      char16 : 1441.02

    Integer short (16bit) compute (GIOPS)
      short   : 3267.50
      short2  : 4281.82
      short4  : 4195.00
      short8  : 4106.64
      short16 : 4038.30

    Transfer bandwidth (GBPS)
      enqueueWriteBuffer              : 15.93
      enqueueReadBuffer               : 4.47
      enqueueWriteBuffer non-blocking : 15.83
      enqueueReadBuffer non-blocking  : 4.48
      enqueueMapBuffer(for read)      : 858993.50
        memcpy from mapped ptr        : 4.47
      enqueueUnmap(after write)       : 858993.50
        memcpy to mapped ptr          : 15.88

    Kernel launch latency : 34.14 us

Données relevé :

  • Vitesse GPU (moyenne) : 0.473Mhz
  • Voltage GPU (moyenne) : 0.614 V
  • GPU T°C : 50->52°C
  • Jonction T°C (moyenne) : 58°C
  • VRAM T°C (moyenne) : 74°C
  • PPT (moyenne) : 70 Watt

« Eco » équivalent à la RX5700XT :

  • Mode : Manuel
  • Vitesse GPU max : -500 Mhz
  • GPU TDP : 195 Watt
  • GPU Tension : -120 mv
  • Vitesse VRAM max : 1884 Mhz
  • Vitesse VRAM min : 194 Mhz
  • Profile : 3D_FULL_SCREEN

Clpeak :

Platform: AMD Accelerated Parallel Processing
  Device: gfx1201
    Driver version  : 3649.0 (HSA1.1,LC) (Linux x64)
    Compute units   : 32
    Clock frequency : 2570 MHz

    Global memory bandwidth (GBPS)
      float   : 492.80
      float2  : 514.87
      float4  : 522.55
      float8  : 532.92
      float16 : 541.85

    Single-precision compute (GFLOPS)
      float   : 12345.33
      float2  : 15769.67
      float4  : 18541.43
      float8  : 19555.73
      float16 : 19492.86

    Half-precision compute (GFLOPS)
      half   : 19425.08
      half2  : 38539.33
      half4  : 38192.34
      half8  : 37748.97
      half16 : 37413.29

    Double-precision compute (GFLOPS)
      double   : 626.28
      double2  : 636.00
      double4  : 635.29
      double8  : 633.06
      double16 : 629.13

    Integer compute (GIOPS)
      int   : 3971.05
      int2  : 4013.74
      int4  : 4007.28
      int8  : 4000.62
      int16 : 3972.50

    Integer compute Fast 24bit (GIOPS)
      int   : 19158.28
      int2  : 19155.43
      int4  : 19073.56
      int8  : 19056.63
      int16 : 16218.90

    Integer char (8bit) compute (GIOPS)
      char   : 18877.25
      char2  : 10516.36
      char4  : 10112.75
      char8  : 9062.95
      char16 : 8433.84

    Integer short (16bit) compute (GIOPS)
      short   : 18264.80
      short2  : 24469.84
      short4  : 23998.70
      short8  : 23583.60
      short16 : 23128.01

    Transfer bandwidth (GBPS)
      enqueueWriteBuffer              : 16.06
      enqueueReadBuffer               : 4.48
      enqueueWriteBuffer non-blocking : 16.28
      enqueueReadBuffer non-blocking  : 4.47
      enqueueMapBuffer(for read)      : 876523.88
        memcpy from mapped ptr        : 4.43
      enqueueUnmap(after write)       : 913822.88
        memcpy to mapped ptr          : 16.21

    Kernel launch latency : 34.10 us

Données :

  • Vitesse GPU (moyenne) : 2,575Mhz
  • Voltage GPU (moyenne) : 0,735 V
  • GPU T°C : 50->52°C
  • Jonction T°C (moyenne) : 58->62°C
  • VRAM T°C (moyenne) : 74->80°C
  • PPT (moyenne) : 153->198 Watt

« Normal sous voltage » :

  • Mode : Automatique
  • Vitesse GPU max : +0 Mhz
  • GPU TDP : 304 Watt
  • GPU Tension : -100 mv
  • Vitesse VRAM max : 2518 Mhz
  • Vitesse VRAM min : 194 Mhz

Clpeak :

Platform: AMD Accelerated Parallel Processing
  Device: gfx1201
    Driver version  : 3649.0 (HSA1.1,LC) (Linux x64)
    Compute units   : 32
    Clock frequency : 2570 MHz

    Global memory bandwidth (GBPS)
      float   : 554.79
      float2  : 574.82
      float4  : 586.50
      float8  : 594.64
      float16 : 600.71

    Single-precision compute (GFLOPS)
      float   : 14380.47
      float2  : 17861.90
      float4  : 20555.61
      float8  : 22983.87
      float16 : 24838.96

    Half-precision compute (GFLOPS)
      half   : 25072.17
      half2  : 49489.50
      half4  : 48839.98
      half8  : 48236.61
      half16 : 47505.23

    Double-precision compute (GFLOPS)
      double   : 802.81
      double2  : 833.01
      double4  : 846.08
      double8  : 844.39
      double16 : 847.65

    Integer compute (GIOPS)
      int   : 5443.56
      int2  : 5446.32
      int4  : 5447.07
      int8  : 5414.19
      int16 : 5404.46

    Integer compute Fast 24bit (GIOPS)
      int   : 23222.84
      int2  : 23408.47
      int4  : 23392.01
      int8  : 23475.65
      int16 : 19629.65

    Integer char (8bit) compute (GIOPS)
      char   : 24182.81
      char2  : 13936.03
      char4  : 13483.93
      char8  : 11956.48
      char16 : 11044.83

    Integer short (16bit) compute (GIOPS)
      short   : 24054.70
      short2  : 29943.13
      short4  : 29290.53
      short8  : 29015.15
      short16 : 28417.62

    Transfer bandwidth (GBPS)
      enqueueWriteBuffer              : 16.66
      enqueueReadBuffer               : 4.49
      enqueueWriteBuffer non-blocking : 16.33
      enqueueReadBuffer non-blocking  : 4.49
      enqueueMapBuffer(for read)      : 671088.62
        memcpy from mapped ptr        : 4.52
      enqueueUnmap(after write)       : 671088.62
        memcpy to mapped ptr          : 16.63

    Kernel launch latency : 34.28 us

Données :

  • Vitesse GPU (moyenne) : 3.175 Mhz (Max 3.325Mhz)
  • Voltage GPU (moyenne) : 1.050 V
  • GPU T°C : 50->52°C
  • Jonction T°C (moyenne) : 58->62°C
  • VRAM T°C (moyenne) : 74->80°C
  • PPT (moyenne) : 153->298 Watt

« Defaut » :

  • Mode : Automatique
  • Vitesse GPU max : +0 Mhz
  • GPU TDP : 340 Watt
  • GPU Tension : 0 mv
  • Vitesse VRAM max : 2518 Mhz
  • Vitesse VRAM min : 194 Mhz

Clpeak :

Platform: AMD Accelerated Parallel Processing
  Device: gfx1201
    Driver version  : 3649.0 (HSA1.1,LC) (Linux x64)
    Compute units   : 32
    Clock frequency : 2570 MHz

    Global memory bandwidth (GBPS)
      float   : 553.74
      float2  : 573.34
      float4  : 584.06
      float8  : 595.63
      float16 : 599.97

    Single-precision compute (GFLOPS)
      float   : 13947.81
      float2  : 17365.83
      float4  : 20033.08
      float8  : 22404.63
      float16 : 24444.60

    Half-precision compute (GFLOPS)
      half   : 24964.09
      half2  : 49339.09
      half4  : 48658.99
      half8  : 47724.07
      half16 : 47242.87

    Double-precision compute (GFLOPS)
      double   : 798.62
      double2  : 830.88
      double4  : 844.05
      double8  : 846.33
      double16 : 847.75

    Integer compute (GIOPS)
      int   : 5444.94
      int2  : 5425.68
      int4  : 5439.48
      int8  : 5420.09
      int16 : 5399.56

    Integer compute Fast 24bit (GIOPS)
      int   : 24340.41
      int2  : 24021.07
      int4  : 23948.52
      int8  : 23965.78
      int16 : 20235.81

    Integer char (8bit) compute (GIOPS)
      char   : 24804.89
      char2  : 14155.54
      char4  : 13526.57
      char8  : 12180.13
      char16 : 11335.98

    Integer short (16bit) compute (GIOPS)
      short   : 24696.14
      short2  : 30900.90
      short4  : 29919.66
      short8  : 29658.82
      short16 : 29002.90

    Transfer bandwidth (GBPS)
      enqueueWriteBuffer              : 16.34
      enqueueReadBuffer               : 4.54
      enqueueWriteBuffer non-blocking : 16.09
      enqueueReadBuffer non-blocking  : 4.52
      enqueueMapBuffer(for read)      : 543666.75
        memcpy from mapped ptr        : 4.52
      enqueueUnmap(after write)       : 727960.56
        memcpy to mapped ptr          : 16.42

    Kernel launch latency : 34.07 us

Données :

  • Vitesse GPU (moyenne) : 3,075 Mhz (Max +/-3,325Mhz)
  • Voltage GPU (moyenne) : 1,115 V
  • GPU T°C : 52->56°C
  • Jonction T°C (moyenne) : 62->70°C
  • VRAM T°C (moyenne) : 80->83°C
  • PPT (moyenne) : 298->342 Watt (pointent à 412 Watt)

CyberPunk 2077 (Proton 10 bêta) :

Différents tests selon des réglages différents, avec tous les réglages à fond :

Conclusion :

Que dire? Pour le moment elle valide tout ce que j’attendais depuis des années. Pas que la rx5700xt soit une mauvaise carte, mais elle ne ma pas semblait être capable de remplacer mon ancienne rx290x pourtant bien plus ancienne. Comme un sentiment d’inachevé.

la rx9070xt semble aussi dans ce cas là, mais la différence de génération est quand même bien marqué et je retient que même en mode économie++ elle propose des performances supérieurs et largement.

Seul le refroidissement me chagrine. Pas qu’il ne soit pas efficace, c’est même de trop, mais par contre c’est bien trop imposant et sacrifie 2 à 3 emplacements de la carte mère… Perso je vois pour réarranger histoire de pouvoir récupérer le dernier port PCI express qui est un peu bloqué en bas.

Pour le reste il faudra voir avec le temps.

Ici je ne fais qu’une petite présentation et quelques tests histoire d’avoir une idée général sous Linux et plus particulièrement FEDORA, ce qui manque en langue française.

N’hésitez pas à revenir de temps en temps, car je vais faire évoluer ce test petit à petit.

Vous aimerez aussi...

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *