Samstag ē 29.04.2017 ē 19:27 Uhr
 Neuigkeiten
 Artikel
 Downloadbereich
 Bildergalerie
 Forum
 PowerVR FAQ
 Suchmachine
 Mitarbeiter
 Impressum
 SGX544MP angek√ľndig...
 Der aktuelle Stand
 zweiter SGX Artikel ...
 Die Videof√§higkeite...
 neue Treiber f√ľr Po...
 neuer Treiber mit Ha...
 SGX - Aufbau, Techn...
 neuer Serie5XT Grafi...
 Apple und Intel inve...
 Mehrere weitere Lize...
 SGX - PowerVRs Shade...
 Interview mit ImgTec...
 Quack - das andere D...
 Hercules4500 AGP4x-M...
 Optionen des KYRO Tr...
 FSAA auf KYRO
 Nummer 5 lebt!
 Startpartition von W...
 MBX - Mobile Grafik
 Die Grafikf√§higkeit...
 Vivid! - PowerVR Gra...
 Videologic Neon 250
 Geforce 6800 - the n...
 Beyond3d
 BluesNews
 Chrome-Center
 Hartware
 Imagination T.
 ParaKnowYa
 Planet 3dNow!
 PowerVR
 PowerVR-Ext.
 PVR Generations
 Tom's Hardware
 Videologic
 VoodooExtreme

3D Center


PowerVR

Imagination Technologies

Die Grafikfähigkeiten des Intel SCH (SGX535+VXD370)
Archmark
Der Archmark ist ein synthetischer Benchmark. Er versucht so viele Informationen aus der Hardware heraus zu quetschen, wie m√∂glich ist, bei√üt sich aber gerade an den TBDRs von PowerVR die Z√§hne aus. Leider l√§uft der Archmark unter OpenGL und beide OpenGL Treiber, der von PowerVR und der von Tungsten, haben so ihre Macken was die realen Zahlen anbelangt. Aber f√ľr grunds√§tzliche Dinge sind sie durchaus geeignet.
Der Archmark unterscheidet zwei wesentliche Modi. Das ist einmal flush, hier werden alle Daten an den Grafikchip geliefert bis die Szene fertig ist und dann erst das Ergebnis ausgegeben. Der zweite Modus ist swap, hier wird zwischendurch immer wieder ein Zeichnen der Szene erzwungen.
Fangen wir einmal mit dem PowerVR Treiber an. F√ľr den PowerVR Treiber musste ich den alten Archmark 0.22.05 benutzen, da der aktuelle einfach nicht laufen wollte.

PowerVR Treiber Archmark im Modus flush:
[b]ArchMark 0.22.05[/b]
Driver              PowerVR SGX535 v2.0
Method              Flush
Timer               1.596 GHz

[b]Fillrate[/b]
--[b][i]32 bits[/i][/b]---------------------------------------
  Mode              RGBA8888 Z32 S8
  Col               397.374 MPix/s
  Z                 1.282 GPix/s
  ColZ              1.233 GPix/s
  ZPassColZ         1.235 GPix/s
  ZCullLEqual       1.178 GPix/s
  ZCullGEqual       1.184 GPix/s
  ZCullEqual        1.216 GPix/s
  S                 1.223 GPix/s
  SCull             1.238 GPix/s

[b]Bandwidth[/b]
Mode                RGBA8888 Z32 S8
--[b][i]available to buffer clears[/i][/b]--------------------
  All               13.363 TB/s
  Color             6.408 TB/s
  ZAndStencil       8.205 TB/s
  Z                 6.454 TB/s
  Stencil           1.638 TB/s

Draw                5.416 GB/s
BurnedByRAMDAC      267.387 MB/s
Physical            5.684 GB/s

[b]Geometry[/b]
Mode                RGBA8888 Z0 S0
--[b][i]Plain vertices[/i][/b]--------------------------------
  Fan               7.410 MTris/s
  List              2.763 MTris/s
  Clip              1.413 MTris/s

--[b][i]Vertex shading speed[/i][/b]--------------------------
  LightD1           3.204 MTris/s
  LightP1           1.760 MTris/s
  LightP8           94.238 kTris/s


[b]Texturing[/b]
Mode                RGBA8888 Z0 S0
--[b][i]Textured fillrate[/i][/b]-----------------------------
----[b][i]Bilinear filter[/i][/b]-----------------------------
    1               1.521 GPix/s
    2               1.466 GPix/s
    3               1.435 GPix/s
    4               1.417 GPix/s

----[b][i]Trilinear filter[/i][/b]----------------------------
    1               1.465 GPix/s
    2               1.247 GPix/s
    3               1.467 GPix/s
    4               1.401 GPix/s

und anschließend gleich der gleiche Test nur im Modus swap:
[b]ArchMark 0.22.05[/b]
Driver              PowerVR SGX535 v2.0
Method              Swap
Timer               1.596 GHz

[b]Fillrate[/b]
--[b][i]32 bits[/i][/b]---------------------------------------
  Mode              RGBA8888 Z32 S8
  Col               24.305 MPix/s
  Z                 22.473 MPix/s
  ColZ              53.109 MPix/s
  ZPassColZ         43.438 MPix/s
  ZCullLEqual       40.560 MPix/s
  ZCullGEqual       41.472 MPix/s
  ZCullEqual        41.916 MPix/s
  S                 44.923 MPix/s
  SCull             43.654 MPix/s

[b]Bandwidth[/b]
Mode                RGBA8888 Z32 S8
--[b][i]available to buffer clears[/i][/b]--------------------
  All               382.253 MB/s
  Color             173.306 MB/s
  ZAndStencil       223.800 MB/s
  Z                 162.393 MB/s
  Stencil           40.971 MB/s

Draw                768.199 MB/s
BurnedByRAMDAC      184.940 MB/s
Physical            953.139 MB/s

[b]Geometry[/b]
Mode                RGBA8888 Z0 S0
--[b][i]Plain vertices[/i][/b]--------------------------------
  Fan               8.455 MTris/s
  List              4.619 MTris/s
  Clip              1.432 MTris/s

--[b][i]Vertex shading speed[/i][/b]--------------------------
  LightD1           3.060 MTris/s
  LightP1           1.833 MTris/s
  LightP8           92.320 kTris/s


[b]Texturing[/b]
Mode                RGBA8888 Z0 S0
--[b][i]Textured fillrate[/i][/b]-----------------------------
----[b][i]Bilinear filter[/i][/b]-----------------------------
    1               39.459 MPix/s
    2               57.204 MPix/s
    3               53.632 MPix/s
    4               49.944 MPix/s

----[b][i]Trilinear filter[/i][/b]----------------------------
    1               46.008 MPix/s
    2               49.526 MPix/s
    3               46.788 MPix/s
    4               43.952 MPix/s
Die hier gemessenen Werte sind von der Sache her sicher nicht exakt, sie zeigen aber sehr sch√∂n ein Ph√§nomen, das es so nur bei TBDRs gibt. Unter dem Modus flush zeigen die TBDRs extrem hohe Werte, wie wir sie hier auch erhalten. Eine Bandbreite von 13 TB/s oder 1.5GPix/s F√ľllrate sind niemals die Werte von SGX535. Da aber die TBDRs alles verwerfen was nicht angezeigt wird und sie im Verwerfen sehr gut sind und alle verworfenen Daten aber mitgez√§hlt werden, entstehen solche Werte.
Solche Werte m√ľssen entstehen, wenn ich den TBDR solange sammeln lasse, wie er kann. Erst im Modus swap wird das unterbunden.
Zeckensack, der Programmierer des ArchMark, erklärte dieses Verhalten 2003 so:
"Kyro 'sammelt' bekannterma√üen Rendering-Kommandos bis zum Swap, und sortiert alles aus, was nicht sichtbar ist. Da die meisten Tests bei Archmark immer das gleiche rendern, kann Kyro fast alles verwerfen, bis auf eine 'Schicht' ... und zwar die, die alle vorhergehenden (identischen) Schichten auf klassischen Architekturen passgenau √ľberschreibt. F√ľr das Ergebnis werden aber alle an die Graka 'angelieferten' Schichten gez√§hlt :) Wenn die "swap buffers"-Option aktiviert wird, wird Kyro √∂fter dazu gezwungen, mit dem Rendern anzufangen. Daher dann auch die 'richtigeren' Ergebnisse. Mit synthetischen Benchmarks kommt man Kyro eben schlecht bei ;)"

Jetzt aber zum Ergebnis mit dem Tungsten OpenGL Treiber. Dieser lief nun wieder nur mit dem aktuellen Archmark.

Tungsten Treiber im Modus flush:
Driver: Gallium 0.1, pipe/psb/Poulsbo on IEGD v2.0 Mesa 7.1
Flushing commands, no buffer swaps
Fillrate
  * 32 bits
    * Mode: R8G8B8A8 Z24 S8
    * 398.618 MPix/s color only
    * 378.763 MPix/s z only
    * 397.836 MPix/s color and z
    * 337.772 MPix/s z tested (pass), color and z
    * 363.224 MPix/s discardable by LEQUAL depth test
    * 359.986 MPix/s discardable by GEQUAL depth test
    * 362.925 MPix/s discardable by EQUAL depth test
    * 378.967 MPix/s stencil writes
    * 379.093 MPix/s discardable by EQUAL stencil test
Bandwidth
Mode: R8G8B8A8 Z24 S8
  * available to buffer clears
    * 1.006 GB/s all buffers
    * 349.122 MB/s color only
    * 386.513 MB/s depth and stencil
    * 227.723 MB/s depth only
    * 77.126 MB/s stencil only
  * 2.590 GB/s worst case draw bandwidth
  * 577.058 MB/s burned by the RAMDAC
  * 3.167 GB/s estimated physical bandwidth
Geometry
Mode: R8G8B8A0 Z16 S0
  * Plain vertices
    * 883.917 kTris/s as triangle fan
    * 439.170 kTris/s as triangle list
    * 352.083 kTris/s clipped
  * Vertex shading speed
    * 398.728 kTris/s lit (one directional light)
    * 374.286 kTris/s lit (one point light)
    * 235.972 kTris/s lit (eight point lights)
Texturing
Mode: R8G8B8A0 Z16 S0
  * Textured fillrate
    * Bilinear filter
      * 61.926 MPix/s w 1 layers
      * 59.530 MPix/s w 2 layers
      * 58.495 MPix/s w 3 layers
      * 43.263 MPix/s w 4 layers
    * Trilinear filter
      * 54.998 MPix/s w 1 layers
      * 48.161 MPix/s w 2 layers
      * 44.525 MPix/s w 3 layers
      * 31.190 MPix/s w 4 layers

und anschließend gleich der gleiche Test nur im Modus swap:
Driver: Gallium 0.1, pipe/psb/Poulsbo on IEGD v2.0 Mesa 7.1
Swapping buffers
Fillrate
  * 32 bits
    * Mode: R8G8B8A8 Z24 S8
    * 320.935 MPix/s color only
    * 289.141 MPix/s z only
    * 321.633 MPix/s color and z
    * 268.754 MPix/s z tested (pass), color and z
    * 246.443 MPix/s discardable by LEQUAL depth test
    * 249.063 MPix/s discardable by GEQUAL depth test
    * 248.184 MPix/s discardable by EQUAL depth test
    * 288.223 MPix/s stencil writes
    * 288.864 MPix/s discardable by EQUAL stencil test
Bandwidth
Mode: R8G8B8A8 Z24 S8
  * available to buffer clears
    * 560.232 MB/s all buffers
    * 217.405 MB/s color only
    * 247.640 MB/s depth and stencil
    * 160.372 MB/s depth only
    * 53.521 MB/s stencil only
  * 2.046 GB/s worst case draw bandwidth
  * 625.849 MB/s burned by the RAMDAC
  * 2.672 GB/s estimated physical bandwidth
Geometry
Mode: R8G8B8A0 Z16 S0
  * Plain vertices
    * 744.141 kTris/s as triangle fan
    * 375.534 kTris/s as triangle list
    * 310.662 kTris/s clipped
  * Vertex shading speed
    * 372.435 kTris/s lit (one directional light)
    * 372.469 kTris/s lit (one point light)
    * 243.702 kTris/s lit (eight point lights)
Texturing
Mode: R8G8B8A0 Z16 S0
  * Textured fillrate
    * Bilinear filter
      * 59.327 MPix/s w 1 layers
      * 60.304 MPix/s w 2 layers
      * 59.827 MPix/s w 3 layers
      * 40.260 MPix/s w 4 layers
    * Trilinear filter
      * 60.447 MPix/s w 1 layers
      * 55.303 MPix/s w 2 layers
      * 43.033 MPix/s w 3 layers
      * 29.291 MPix/s w 4 layers
Auch wenn die F√ľllraten der Tungsten Treiber mit ihren etwa 400 MPix/s schon eher das w√§ren was ich erwarten w√ľrde, das was ich hier sehe ist kein TBDR! Der SGX535 verh√§lt sich unter Verwendung des Tungsten Treibers nicht wie ein deferred Renderer, als ob sie das HSR nicht verwenden w√ľrden.
Ich kann nicht sagen, ob man den Ablauf der Grafikpipeline innerhalb des Grafikkerns des SGX soweit beeinflussen kann, dass das HSR abgeschaltet wird oder man es erst speziell aktivieren muss. Es sieht aber so aus, als ob hier die Hardware nicht optimal genutzt wird.
√úber die Texel-F√ľllraten will ich hier noch nicht reden, wir erhalten wieder die 50MTex/s, da scheint es ein grunds√§tzliches Problem zu geben.

Seite 1 2 3 4 5 6 7 8 9 10
 Die Grafikf√§higkeiten des Int...
 10 Seiten
 verfasst von loewe
 Mittwoch - 14.10.2009 - 17:36 Uhr
[1]  Einleitung
[2]  Der Grafikkern SGX535
[3]  Die Videof√§higkeiten des Intel...
[4]  Benchmarks - theoretische Test ...
[5]  Benchmarks - theoretische Test ...
[6]  Benchmarks - theoretische Test ...
[7]  Benchmarks - Spiele 1
[8]  Benchmarks - Spiele 2
[9]  Wo ist das Problem und was k√∂n...
[10]  3 Fragen an Imagination Technol...