3DVF : irondavz et 33 utilisateurs inconnus MR | | 04 - MR||08 - | Reprise du message précédent : Wep pour les textures ça va vite, genre tu bosses en pleine rezo sur un perso next gen avec des maps de 2k pour la color, spec et normals map, t'as interet à avoir un peu de ram video de dispo, je parle meme pas si il faut afficher des 4k (4096x4096 32bits). ---------------
-Michel-
|
zags | MR||04,
de là à ce que ça réclame + de 1.5Go de mémoire vidéo ??
je pense pas forcément à un perso, mais à une scene (villa par ex) |
zags | ... meme à FSB / L1 / L2 identique ?
oui oui ok j'ai compris pour la stabilité.
Je souhaite juste mettre le doigt sur la différence entre un Xeon (qui se targue d'avoir un FSB 1333MHz alors que la carte mère bride le bus à cause des mémoireavec un FSB 800Mhz) et une platefore full FSB 1333 (mémoire et proco) avec un core 2 Quad Extreme.
Du coté des xeon il y aura "juste" ( ;-) ) un proco en + (boah quatre core de + ça fait vraiment une différence? :-) ), et ils emportent avec eux de la mémoire FB (Fully Buffered) ... d'où la stabilité peut etre ...
Alors que les core 2 Duo c'est ni FB, et meme pas ECC :-( |
zags | "(qui se targue d'avoir un FSB 1333MHz alors que la carte mère bride le bus à cause des mémoireavec un FSB 800Mhz)"
Je vais détailler pour etre plus explicite en citant des sources.. et au passage vérifier que j'ai pas dit une connerie (chose que je n'exclue pas) :-)
Qu'on se mette d'accord : - d'abord il y a la fréquence du proco. La fréquence du core en fait. (exemple 3.2Ghz)
- ensuite le core "parle" avec le cache L1. Et quand ce dernier est "plein", le core parle avec le L2 .. ou le L1 parle avec L2 directement. Ca dépend des archi. J'avoue ne pas avoir suivit ces derniers temps.
- il y a donc différents "points" : le core, le L1, le L2, la ram.
- entre chacun il y a des BUS. On assimile ça à une autoroute. Chaque bus fonctionne à une certaine vitesse (la vitesse à laquelle vont les voitures sur l'autoroute pour reprendre mon image), et avec un certain nombre de "voies" : les bits .. 32 bits, 64, 128, ...
- il me semble (je prends des pincettes) que les bus entre CORE et L1 (et L2) fonctionnent à une fréquence identique que celle du CORE ("3.2Ghz" ) et avec autant de bits. En fait CORE-L1 j'en suis sûr, CORE-L2 ou L1-L2 j'en suis moins sûr ... je pense que ça doit être 1333Mhz pour les tout dernier procos
Rappel : lorsqu'on a une fréquence et un nombre de bits, on en détermine la quantité d'information que l'on peut véhiculer en un laps de temps. Ex: 1333Mhz, 64bit donnent 1333x64 = 85 312 Mbits / sec = 10 664 Mo / sec Par analogie : sur une autoroute, plus il ya de voies et plsu al vitesse est élevé, plus il ya de voitures (i.e. informations) qui circulent.
Dans la série des rappels on rajoutera :
- L1 c'est une sorte de "mémoire annexe et rapide" du core. Quand celle ci devient "pleine", on s'adresse au L2
- De meme, quand L2 est full, on va stocker les informations en ram, plus lent mais une plus grande quantité disponible.
- De la meme manière, lorsqu'on atteind la quantité max de ram (2.5Go utilisé sur 2Go de ram par ex), le surplus va êter mis sur une mémoire plus lente mais de plus grande capacité : le disque dur (on dit dans ce cas là que ça "swap" :-) ).
Revenons à notre chaine... ou à notre autoroute.
Ce qu'on appelle FSB c'est notre portion d'autoroute entre le processeur (core + L1 + L2) et notre ram (DDR2 ou DDR3).
Et là il y a amalgame (volontaire?) de la part des fabriquants.
Allons dans les exemples concrets (avec sources :-) )
- Intel Xeon X5355 - Quad Core ! Socket 771 FSB1333 Cache L2 8 Mo 0.065 micron (version boîte)
http://www.ldlc.com/fiche/PB00047719.html
Ce dernier a un core qui fonctionne à 2660 Mhz en 64 bits.
Il a un cache L1 d'une taille de 256Ko.
Le dialogue entre le core et le cache L1 se fait à la vitesse de 20.78 Go/s (core 2.66GHz)
Et il a un cache L2 de 8Mo, accessible à une vitesse de 10.4Go /s (FSB 1333Mhz).
De là on "sort" en direction de la RAM...
Pour cela on arrive sur le bus (appelé FSB aussi... :-/ ) de la carte mère. On prendra la "Tyan Tempest i5000PW - S5382WAG2NRF (Intel 5000P) - E-ATX"
http://www.ldlc.com/fiche/PB00041755.html
Cette carte annonce pouvoir supporter de la ram "DDR2 667 - PC2-5300" (FB je suppose).
Le hic là c'est que les constructeurs ont encore volontairement tout mélangé. "DDR", Double Data Rate, double canal, équivalent à des fréquences doublées (sic!).
Heureusement qu'il y a l'indication "5300" qui va nous aider ...
"667" c'est la fréquence, 667Mhz. Mais il faut la doubler ou elle est déjà doublée ?
On sait que ces mémoires fonctionennt en 32 bits (eh oui...).
32 x 667 = 21 344 Mbits / secondes = 2 668 Mo / sec ...... ?? ...
2 668 x 2 = 5 336 Mo/s (ouf!)
Donc la mémoire peut débiter en direction du processeur une vitesse de 5336 Mo / seconde, 5.21 go/s
Revenons à notre autoroute : différentes villes A, B, C, D, E. Reliées entre elle par des autoroutes.
A : core
B : L1
C : L2 (on a vu que peut etre A et C pouvaient parler directement, mais ça restera à la meme vitesse que de B à C)
D : ram
E : disque dur (servira plus tard dans notre exemple).
Le cheminement est le suivant : A - B - C - D - E
Si entre A et B les voitures vont à 130 Km/h sur 4 voies, et qu'en B et C (ou A et C) c'est à 110Lm/h sur 4 voies, et entre C et D c'est à 90Km/h sur 2 voies.
En toute logique, que pensez-vous des vitesses globales entre D et A ? la mémoire et le core.
Eh bien en toute logique c'est au moins disant.
Pour sûr s'il y avait eu la possibilité d'avoir du 110Km/h sur 2 voie entre D et A, la vitesse globale en aurait été grandement améliorée.
Revenons maintenant à notre comparatif Xeon / Core 2 Duo.
Le Xeon a un FSB 1333 mais utilise de la mémoire plus lente fesant office de "goulot d'étranglement" (terme souvent utilisé en informatique).
Le Core 2 Duo quand à lui a un FSB de 1333 mais peut utiliser de la ram à 1333Mhz. La vitesse globale semblerait donc bien meilleure sur ce dernier.
Le hic du core 2 Duo c'est qu'il est, parait-il, moins stable. Les voies d'autoroutes sont plus glissantes et certaines informations se perdent (non-ECC, ECC ;-) ).
Et puis le goudron est plus épais et supporte un traffic plus important en continu (à ce qu'il parait).
Et puis les core des Xeon et Core 2 Duo fonctionennt à des fréquences différentes ...
Et leurs caches L1 / L2 ont des tailles différentes. 256Ko (L1) et 8Mo (L2) pour ce xeon, contre 64Ko (L1) et 4Mo (L2) pour le Intel Core 2 Duo E6850 - Dual Core ! Socket 775 FSB1333 cache L2 4 Mo 0.065 micron http://www.ldlc.com/fiche/PB00061926.html
Ce qui change totalement la donne.
Et puis l'architecture interne des cores ont grandement leur importance !
Bref, tout ça ne se résume certainement pas à "mon processeur il fait tant de Mhz de + que le tient alors il est meilleur" :-)
Pour aller plus loin dans ce petit cours ;-) ...
Au delà de la ram, il y a les échanges avec les disques dur (ou al carte graphique). Et tout ça ça passe par les chipset de la carte mere : northbridge et southbridge. Eux tous sont de la meme maniere soumis aux vitesses (Mhz) et au nombre de voies (bits) .... et aussi au traffic global qu'il y a car ils sont considérés comme des carrefour où les informations viennent de toutes parts...
donc la mémoire à sa vitesse, ça passe par northbridget/southbridge selon où vont les informations ... et puis ça arrive au "SATA2" .... et là ont dit "ouaaah SATA2 c'est 3Gb/s, c'est carément plus rapide que la nape ide" ... oui cette portion d'autoroute est plus rapide oui .. mais la mécanique du disque fait que les informations sont freinées à 60Mo/s (à la louche, selon les disque dur).
Bref tout à son importance.
Souvent je reprends cette image : je suis assis à un bureau et je bosse.
Mon cerveau c'est le core.
ce qu'il ya dans ma main dans le L1
ce qu'il ya sur le bureau c'est le L2, on y met plus de chose que dans ma main, mais c'est accessible moins rapidement.
De meme, les tirroirs c'est la mémoire (ram). Plus grand encore, mais plus lent d'accès.
Et lorsque j'ai pas suffisament de place dans mes tirroirs, mes archives se trouvent dans le placard à 2 mètres derriere moi.
Pour améliorer ma production faudra étudier le tout. Et aggrandir la taille de mon placard sera peut etre une moins bonne idée que d'aggrandir mon bureau :-)
En espérant que cette prose n'ait pas été inutile (hors sujet certes), qu'elle ait répondu aux question de nepheast, et qu'elle ait appris quelques trucs à certains de ses lecteurs (si tout le monde savais ce que j'ai dis bah .. désolé :-) .. je peux effacer si nécessaire :-) ).
Enfin si j'ai dit des betises, milles excuses, merci de m'indiquer et je rectifierai le tir.
Stéphane
(zags)
edit 1 : j'ai schématisé hein .. je suis certainement pas dans l'ultra précis et la vérité absolue :-)
edit 2 : on peut voir dans les deux captures de nepheast "bus speed" et "rated FSB". Il s'agit en fait de 4 autoroutes (bus speed) à N voies chacunes (64bits) , donnant une équivalence d'une seule autoroute. 332.5 x 4 = 1330 Mhz
edit 3 : les mémoires étant en 32 bits et le core en 64 bits, je me demande si entre L1 et L2 ça "papote" en 32 bits ou en 64 bits ... ? .. ce qui ferait une grande différence...
Message édité par zags le 06-08-2007 à 12:13:31
|
zags | oui oui, il y a des C2d en 1333, c'est d'eux que je parlais ...
Pour ton barton, faut voir la carte mere ... la vitesse du bus entre la mémoire et le proco ...
En fait dans tout ça, ce qu'il faut c'est comprendre le PRINCIPE.
Et avoir à l'esprit qu'un élement seul, meme s'il est bridé autour de lui par les différents bus, il bosse de toute façon. C'est pas qu'une bebete qui sert à papoter avec son voisin, il fait des calculs lui aussi :-) .. Donc en cas d'amélioration de ce dernier (remplacement, oveclock, ..), meme si tout autour de lui il est bridé, eh bien en verra les performances s'améliorer ... forcément.
Suis-je clair ... ? :-/
Prenons un autre exemple : les disque dur SSD ou à bnase d'I-Ram, par rapport aux disques dur mécaniques...
Petit rappel : - SSD, Solid State Disk, disque de stockage composé que d'électronique
vitesse (quantité d'informations à la secondeà et temps d'accès sont bien meilleur qu'un disque dur classique (mécanique).
- I-Ram (v2) : Petit boitier se branchant tout comme un disque dur classsique, en SATA2 .... dans lequel est mis des barretes de ram PC3200. Il n'y a pas mieux à ce jour en temps d'accès, ni en débit.
L'"autoroute" depuis les données stockées (disque dur) jusqu'au processeur va à la vitesse de 3.2Go/sec (!).
Avec ce genre de chose, votre PC s'allumera en 10 secondes, Word s'ouvrira le temps de fare le double-clic, et 3D Studio Max 9 se lancera plus vite que ce que vous aurez retiré votre mains de la souris.
Sous 3DS vous ouvrirez voter scene fetiche de 500 Mo en ... 0.15 secondes !
L'IRam v2 ne coute pas bien cher seul (je ne sais plus, 60, 80, 90 Eur ?), mais les barretes mémoire que l'on y mets coutent TRES cheres.
Le boitier peut accepter 8 barretes de 2Go DDR PC3200, soit 16Go par boitier (lequel est relié en SATA2). Bien entendu vous pouvez relier plusieurs boitier entre eux par raid (jbod) pour voir qu'un seul disque beaucoup + gros ... Mais le coût global risque d'être lui aussi beaucoup plus gros :-)
note de la fin : ça se comporte comme un disque malgré qu'il y ait de la ram ... le pc éteind, les données sont conservées.
Bon le but n'était pas de faire de la pub, mais de montrer que suivant le maillon de la chaine qu'on améliore, les performances globales peuvent être tout autre (ex: Iram OU processeur plus pussant) |
MR | | 04 - MR||08 - | Et c'est souvent tres bien de prendre l'avant derniere techno, c'est suffisamment débuggué pour n'avoir aucun probleme
La fiabilité passe avant la performance pure, on est pas des bêtes ^^. ---------------
-Michel-
|
zags | tout à fait.
En fait l'idée que j'ai exposé, ça n'est pas pour dire "il me faut la derniere techno à la mode pour avoir la plus grosse...", mais pour _comprendre_...
.. afin que si on veut améliorer l'ensemble, qu'on ne se plante pas de maillon |
Aego Obi Wan | Bon, juste pour indication, un petit test que je viens de faire pour coller à genoux ma 7600Gt toute neuve, 4 900 000 polys fluide dans les vues avant que ça commence à lagger un peu ( vraiment très peu ) avec 5 200 000 ( 8 fps à ce moment là ), et on peu pousser, à 7 500 000 polys, je suis à 5.5fps et c'est bossable encore...( ok, c'est des copies de 3 bagnoles HD, mais quand même )
Avec une de 800 000 polys, je suis à 100 fps dans la vue ( 99.62 fps pour être exact )
Sans vouloir dire, pour 140€, ça le fait non ? ( en plus les Leadteck s'overclockent très-très bien, entre 20 et 30% de perfs en plus sur 3D Mark, que du bonheur )
De la bonne ram, un bon tiot Core2 Duo et t'as pas besoins d'une carte de fou ( avec l'économie sur la carte, t'as 2go de ram, un pross et une cm )
Une Quadro à 1000€ emène pas 6 fois ça en polys  Message édité par Aego le 10-08-2007 à 02:25:04 ---------------
www.aego-prod.fr
Mes models LPM finis
|
zags | Intéressant tes chiffres Aego...
Petite question de débutant :
Mais tes 7 500 000 polys ... c'est du filaire (transparent), du solide "plein" ou du texturé ?
(oui désolé, le vocabulaire infographie 3D c'est pas encore ça :-) ) |
Aego Obi Wan | C'est du shade texturé, sans wire par dessus ( toujours pas trop bien géré le wire dans Max 9 ), en mode D3D ( Open GL est toujours aussi lent sur les cartes de jeux, ça change pas trop
Si tu colles le wire par dessus, ma caisse de 800 000 polys tourne à 53 fps ( un truc de fou ça, huhu ), et en wireframe pur, 7 fps ( oué, ça fait toujours rigoler aussi )
Sur ma scène de test, pour 4 900 000 polys, je suis à 5.48 fps avec le wire par dessus ( contre 10 sans ) et ça bouge pas trop mal encore dans la vue, la scène en wireframe complète est inexploitable ( 1.06 fps ) Message édité par Aego le 10-08-2007 à 12:45:21 ---------------
www.aego-prod.fr
Mes models LPM finis
|
zags | J'ai peut etre été un peu vite sur un point .....
.. oui bon OK je me suis planté :-)
.. mais j'avais prévenu ;-)
Il s'agit des bandes passantes entre processeur(s) et mémoires pour les plateforme à base de Xeon
http://www.hardware.fr/articles/678/page7.html
Certes l'article est sur CUDA (très intéressant), mais on y trouve des infos liées avec notre sujet là .. |
gam | C'est un peu là où le bas blesse. Les autres soft 3D pro comme Maya, XSI, Houdini, Lighwave, Cinema 4D font intensivement appel à l'OpenGL. Seul Max est en retrait avec son DX largement au-dessus de son OpenGL. Cependant ça change tout avec les drivers MaxExtreme (où du moins la dernière fois que j'ai chipoté avec Max sur station)
Il faut donc savoir ce que l'on desire faire avec sa petite carte. Les chiffres démontrés en nombre de poly c'est très bien, mais c'est fixe et en DX9 sous Max.
En animation (rhaaaa les déformations lourdes, particules etc), et sur les autres soft cités plus haut, les carte pro prennent un nette avantage sur les carte grand publique. Message édité par gam le 15-08-2007 à 02:52:16
|
|