|
Q & R - Benchmark Cache & Mémoire
Ce document fournit les réponses aux questions fréquemment posées
concernant Sandra. Veuillez lire le Fichier d'Aide également!
Ce module utilise la technologie du module bien connu Benchmark
Mémoire. Pour obtenir d'autres informations le concernant, voyez
le module correspondant. Cette rubrique rapporte essentiellement les différences
entre ces deux modules.
Q: Pourquoi ce test dure t-il si longtemps?
R: dans le but de supporter SMP, SMT (Hyper-Threading), etc. la construction
du programme est très complexe. Dans le but d'obtenir un indice réel,
les tests doivent se répéter plusieurs fois et l'indice sera basé
sur chacun de ces résultats. De ceci résultera un indice stable.
En général, ce benchmark prendra entre 5 et 10 fois la durée
du Benchmark Mémoire.
Q: Pourquoi l'indice mémoire (c'est-à-dire utilisant des
blocs importants > cache L2/L3) est-il inférieur à l'indice du
Benchmark Mémoire?
R: l'indice est inférieur car streaming/buffering/block pre-fetch
ne sont pas utilisés pour améliorer la performance. Le test est
le même sans tenir compte de la taille des blocs; différentes techniques
devraient être appliquées lorsqu'on utilise les caches de données
et lorsqu'on utilise la mémoire.
L'indice mémoire devrait correspondre aux anciens tests ALU/FPU avec
le Benchmark Mémoire. Sur les systèmes récents, vous devez
désactiver les instructions EMMX/SSE/SSE2 pour revenir à ces tests.
Q: pourquoi ce module n'utilise t-il pas streaming/buffering/block pre-fetch?
R: ces techniques sont très utiles lors du streaming d'importantes
quantités de données, et pas quand des petits blocs sont impliqués
comme avec ce test.
Q: pourquoi n'y a t-il pas de test MMX?
R: MMX & FPU travaillent l'un et l'autre sur des données en 64-bits.
A moins que les instructions de streaming soient utilisées, il n'y a
pas de raison majeure à utiliser MMX plutôt que FPU. D'ailleurs,
tous les tests (comme le benchmark mémoire) utilisent 64-bit en virgule
flottante alors que MMX supporte 32-bit arithmétique seulement.
Q: Pourquoi le P4 obtient-il un tel coup de fouet de SSE(2) alors que le
PIII n'en obtient pas?
R: les transferts de grande taille (128-bit) travaillent mieux avec l'architecture
NetBurst que le petits volumes (32/64-bit). Le PIII atteint ses limites avec
les transferts normaux 64-bit. Vous pouvez également voir ceci pour le
P4 qui a besoin de SSE(2) pour atteindre son plein potentiel et non son code
minimum.
|