11. 9. 2013

Microsoft - lož ako pracovná metóda


Občan Albert Pennelo manažuje PR kampaň pre novú konzolu od MS. Určite je za to dobre platený a do krvi sa bije za produkt, ktorý nám chce predať. Vidiac, že im hardcore mainstream uteká ku SONY konkurencii /úplne všetky ankety vyhráva PS4 3:1 vo svoj prospech/ sa vo zvýšenej miere vyskytuje práve na herných fórach /za všetky spomeniem hlavne www.neogaf. com/, kde sa táto podľa neho blbá a ľahko ovplyvniteľná herná družina vyskytuje najviac a hustí im tam do hláv tie svoje kaleráby /kedlubna/.

Citujem ako sa vidí on sám : "So I thought I would add more detail to what I said the other day, that perhaps people can debate those individual merits instead of making personal attacks. This should hopefully dismiss the notion I'm simply creating FUD or spin." Bude sa teda držať faktov, racionálna debata, žiadne žvásty, lži a zavádzanie. "A hej PS4 určite nie je o 30-40-50% výkonnejšia ako Xbone." A dáva na stôl tieto argumenty. Nižšie ich máte aj s mojím komentárom. 



• "18 CU's vs. 12 CU's =/= 50% more performance. Multi-core processors have inherent inefficiency with more CU's, so it's simply incorrect to say 50% more GPU."
- Lož a zavádzania. Povedal som to tu už mnohokrát, urobme si v tom teda definitívne jasno. Obraz to sú farebné body. Polohu a farbu bodu /pixelu/ ráta shader program na SIMD jednotkách /CU je blok SIMD jednotiek/. Moderné GPU ich maju stovky až tisíce. XBone okolo 770, PS4 okolo 1150, high end PC GPU aj 2000 a viac. Viac SIMD procesorov = viac prežutého shader kódu = lepšia grafika. Identický spôsob tvorby grafiky beží dnes na SIMD jednotkách CELL CPU v PS3ke. A viete čo povedal DICE dev tím pri programovaní BF3 : "dajte nám viac SPE /SIMD/ procákov".
- PS4 GPU však nemá viac len CU /SIMD aka ALU jednotiek/ ale aj viac ROPs /rasterizácia/, Stencils /tiene/, a TMU /textúrovanie/ hadvéru, ACE /GPGPU/ a to o 50 až 100%. Celá grafická renderovacia kaskáda PS4 GPU skutočne je masívne výkonnejšia /do PS4 GPU API a špeci shader jazyka sa radšej ani nebudem púšťať/, amen, viď aj appendix s špecifikáciami úplne dole. 

• "Adding to that, each of our CU's is running 6% faster. It's not simply a 6% clock speed increase overall."
- Xbone GPU ma vyšší takt o 6%, to nestačí na to, aby dobehli omnoho lepšie PS4 GPU. MS hňup sa však snaží o niečo iné - o bulharskú matematiku. Chce vynásobiť 12 CU krát 6% = 72%. Ak teda dám na auto 4 gumy, kde zmes bude o 6% rýchlejšie, tak auto dosiahne o 24% lepšiu maximálku. Kurva nie a klasické MS lži a ohýbanie reality. Chorý argument decka v škôlke.

• "We have more memory bandwidth. 176gb/sec is peak on paper for GDDR5. Our peak on paper is 272gb/sec. (68gb/sec DDR3 + 204gb/sec on ESRAM). ESRAM can do read/write cycles simultaneously so I see this number mis-quoted."
- brutálna lož. Ak použijem MS metodiku, tak PS3 má agregovanú priepustnosť cirka 50 giga do VRAM a syst. XDR plus 7 x 200 giga do LS SPE jednotiek plus 200 giga na ring EIB bus čo spája SPE jednotky = 1.65 terabajtu za sekundu. Tak to ale nefunguje.
- XBone má mizerných 68 giga/sec do svojej hlavnej RAM, k tomu je tam prilepená eSRAM  4 x 25.6 giga /102.4 giga-sec/, udávam to zámerne v tejto podobe - je to vlastne 4 x 8 megová banka 32 megovej eSRAM každá s vlastným DATA move enginom, ktorý ma kapacitu práve 25.6 giga/sec na jeden 8 mega modul. Nič viac tam nie je, a už vôbec to nemôžte sčítať dokopy. Pamäťový systém /plus zbernice/ PS4ky je jasne jednoduchší, pritom výkonnejší.

"We have at least 10% more CPU. Not only a faster processor, but a better audio chip also offloading CPU cycles."
-  nárast výkonu Xbone CPU je z 102.4 GFLOPs /na frekvencii 1.6Ghz/ na 112.0 GFLOPs /na 1.75Ghz/. Hovoríme o raste o mizerných 10 gigaflops. PS4 GPU ich má 1840 /1940 spolu s CPU !!/, Xbone dokopy - 1420 GFlops /CPU+GPU/. Ten nárast je proste symbolický a navyše tu Albert operuje s tým, že pozná pracovnú frekvenciu PS4 CPU, čo však na inom mieste priznal že nevie. A ticho mlčí koľko CPU výkonu si berie Xbone OS založené aj na WinOS8 jadre.
- audio čip XBone. Sila proste. Je verejným tajomstvom, že audio stránka PS3 hier je na ďaleko, ďaleko vyššej úrovni /nielen 7.1 režim, ale aj dostatok výkonu na "DSP" finty so zvukom, 3D efekty, reverb/ a viete čo, každý na to serie - zákaznici, recenzenti, Lížprdel /DF na eg.net/. Xbone má audio čip SHAPE, výkon tuším okolo 10 Gigaflops, ktorý je zamestnaný primárne prácou okolu Kinedrylu /nebudem to komplikovať detailným popisom/. PS4 však má tiež pomocné "akcelerátory" pre audio /dekódovanie, mixovanie/, video decoding/encoding alebo dekompresiu dát v reálnom čase z BD/HDD a beriu tak z pliec CPU značný kus práce. V PS3ke to všetko robilo CELL CPU.
.- mám však lepší nápad. Stále sme pri audio stránke hier pre PS4/Xbone, dám vám 2 poučná príklady z praxe. Infamous pre PS4 /vyslovene pozitívne informácie dev tímu o výrazne lepšej audio stránke oproti PS3ke, mali sme však s tým na PS3ke vôbec nejaký problém?/. A obrovské problémy s audiom v nemenovanej launch hre pre Xbone, kde sa táto časť hry musela komplet prepracovať /super audio čip !!. super MS soft. nástroje !!/ .

• "We understand GPGPU and its importance very well. Microsoft invented Direct Compute, and have been using GPGPU in a shipping product since 2010 - it's called Kinect."
- ani bob nevie čo tým chcel Berti povedať. Začnem tým, že heterogénny model, teda kód bežiaci mimo CPU na nejakom "SIMD poli" s vlastným ISA už SONY používalo rutinne na PS2 /EE - emotion engine/ a stále používa nA PS3ke /CELL, SPURs/. MS teda nič nevynašlo. Padne však otázka - v next gene predsa pobežia GPGPU výpočty /compute shaders/ nie na EE alebo CELL procákoch ale na ich moderných AMD GPU. Ako sú teda na to vybavené.
- v skratke: PS4 GPU je doslova od základu definované a dizajnované s maximálnym dôrazom na čo najvyšší výkon práve v GPGPU režime. XBone tu kope druhú ligu. Mark Cerny urobil zásadné úpravy PS4 GPU a spolu s AMD vlastne definovali nový GCN 2.0 GPGPU štandard aj pre PC grafiky, ktoré ešte ani nie sú na trhu !! XBone GPU tu nemá veľkú šancu a prax tu ukáže. 

• "Speaking of GPGPU - we have 3X the coherent bandwidth for GPGPU at 30gb/sec which significantly improves our ability for the CPU to efficiently read data generated by the GPU."
- lož. PS4 aj XBone maju v skutočnosti podľa známych informácií obaja práve tých 30 giga extra dedikovaných pre GPGPU kanál. PS4 má k tomu určené aj špeci zbernice /Onion, Onion+, úprava L2 kešky/, ktoré sa o to postarajú. Háčik je niekde inde. Ak Xbone zoberie zo 68 giga-sec rovných 30 giga pre GPGPU ten zvyšok nestačí ani na 2D Tetrisa. Hyperbola, ale aby ste boli v obraze. PS4 má stále  k dobru 180 giga-sec GDDR5 a podľa všetkého aj jednotný adresný mem priestor uUMA, ktorý Xbone mať nemôže pre prítomnosť dvoch rôznych mem baniek a priliš komplexný bus systém /DDR3 a eSRAM plus data moves engines/.

---------------------------

Všetko čo zo seba ten človiečik vybľul sú teda bohapusté žvásty na úrovni 12 ročného HALO "fuck your gypsy mother" hráča. Neogaf sa ho úprimne a otvorene spýtal, či to myslí vážne a navrhol aj razantné riešenie a teda BAN. Reakcia ľudí /a chodia tam aj hráči - aktívni programátori a IT špecialisti/ bola jasná. Albert nemá ani šajnu o čom vlastne hovorí, používa nezmyselné výrazy, lživé argumenty, zlú terminológiu. Je to 100% FUD. Trošku sa obávam, že si Albert o chvíľu potrasie pravicu s Adamom, ktorý to hnojil úplne rovnako. Nebudem to už predlžovať. PS4 GPU je úplne iná výkonnostná liga, v najbližších rokoch predpokládame dôraz na dostatočný GPGPU výkon /fyzika, interakcia, ale aj grafika alebo audio/ a tu bude PS4 totálne dominovať. MS ani žiadny z jej poskokov z toho proste Xbone nevykecá, z ich strany je to iba vírenie bahna vo vode a neseriózne chŕlenie primitívných lži.


PS4 GPU:

1152 GCN 2.x shader cores @ 800MHz - 1840 TFLOPs
72 TMUs, 32 ROPs
57.6 GTex/s, 25.6 GPix/s
8GB GDDR5 with 176GB/s
8 compute command processors /GPGPU ACE engine/
64 parallel compute queues
GPU cache bypass: yes /veľmi dôležité pre GPGPU výpočty/

Xbox One GPU:

768 GCN 1.x shader cores @ 853MHz - 1310 TFLOPs
48 TMUs, 16 ROPs
40.9 GTex/s, 13.6 GPix/s
8GB DDR3 with 68GB/s + eSRAM 102.4 GB/s
2 compute command processors /GPGPU ACE engine/
something between 2 and 16 parallel compute queues
GPU cache bypass: no