18. 11. 2012

Pomalý, pomalší, Wee Urinal


Update 19.11.12 > Situácia sa mierne "zdramatizovala". Wee Uu pamäť podľa upresnenej informácie dosahuje maximálnu rýchlosť iba 12.8 giga/sec na pravdepodobne iba 64 bitovej /!!/ zbernici, čo je vlastne menej ako polovica rýchlosti hlavnej pamäte aktuálnej generácie konzol /XDR u PS3ky alebo menej ako 25% celého mem subsystému v PS3ke/. Je to dosť tragická hodnota a všetko čo som dole v posledných dvoch odstavcoch napísal platí ešte o to viac. Zatiaľ stále záhadná Wee Uu eDRAM to už asi nedokáže zachrániť. A prikladám aj bonus - záplavu ďalších problémov.

Dnes skoro ráno som tu dal pohodové video z pitvy Wee Uu /rozoberať sa začne od 1 hodiny a 15 minúty a pokračuje sa po malom technickom problémiku v tomto druhom videu/. Vynechám už známe veci. Teraz bude reč o použitej pamäti v tomto lacnom nintendo šmejde. Čerstvou novinkou je totiž hlbšie poznanie toho čo nám to vlastne nintendo láskavo nadelilo. V skratke pre dokonale netechnické typy - použili ďaleko pomalšiu pamäť ako 7 /xcrap/ respektíve 6 /PS3/ ročné konkurenčné past gen systémy.

Wee Uu obsahuje 2 gigabajty pamäte /polovica je z toho je čiste iba pre OS/ v štyroch čipoch - 4 x 4 gigabity, Samsung K4W4G1646B DD3, 1.5V, 800/933/1066. Zmenené na drobné, rozpočítané signálové piny, 256M x 16. Bla bla. Dostaneme pamäť o rýchlosti asi 17 gigabajtov za sekundu. Predbežné informácie. Mimochodom aj vaša ľadnička alebo mobil beží rýchlejšie.

PS3 má konfeguráciu 256 mega systémovej RAM, kam však môže pristupovať aj RSX /má na to špeciálnu zbernicu/ o rýchlosti 25.6 GB/s a osobitne aj 256 megovú VRAM čiste pre RSX o rýchlosti 22.4 GB/s. Nie je použitá žiadna eDRAM ako pri PS2 a PSP. Slabinou RSX je to, že pôvodne 256 bitovú zbernicu /44.8 gigabajtov za sekundu/ orezali na 128 bitov /lacnejšia výroba, výrazne jednoduchšia a rýchlejšia zmena výrobného procesu a teda opäť lacnejšie/, čím však prišli o polovicu výkonu grafickej pamäte a polovicu rasterizačného výkonu RSX. To je však iný príbeh a mimochodom pri xcrape urobili borci z MS identickú vec !!

Xcrap narozdiel od PS3 má pamäť v jednom 512 megovom balíku o rýchlosti 22.4 giga/sec, teda identicky ako RSX v PS3ke. Toto by však pre celý systém rozhodne nestačilo, takže tam prilepili 10 megovú eDRAM, v ktorej prebieha niekoľko grafických operácii náročných práve na priepustnosť pamäte. Avšak /!!/ táto eDRAM ma tiež jeden malý háčik, vlastne je ich more. Je príliš malá a nie je možné dáta v nej spracované hodiť rovno na obrazovku. Musia sa vrátiť do hlavnej RAM a až potom to ide na výstup.

Wee Uu má teda ramku v jednej banke pre CPU a GPU ako xcrap, je rovnako pomalá ako u xcrapu /vlastne o dosť pomalšia/ a to nám suponuje nevyhnutne prítomnosť eDRAM, inak by systém padal na hubu aj pri renderingu 2D Tetrisa. O tejto eDRAM však zatiaľ nevieme de fakto nič. Iba sa špekuluje o veľkosti na úrovni 32 mega, je to však skutočne iba fáma. Jeden nepriamy dôkaz jej schopnostiach sa však asi našiel. Obrázok nižšie.


Sledujte rozlíšenie tieňov. Wee Uu ich má o polovicu nižšie. Ako je to dopekla možné ? Má predsa viac RAM, má lepšie GPU. Problém bude práve v jeho eDRAM /vlastne RAM, hehe/. Paradoxne bude Wee Uu eDRAM asi výkonnejšia ako tá v xcrape, avšak má to opäť jeden háčik. Wee Uu eDRAM pravdepodobne umožňuje svoj výsledok zobraziť bez jeho prekopírovania do hlavnej RAM /to je super a xcrap to nedokáže/. Ale hlavná RAM Wee Uu je objektívne dosť pomalá a aby ju úplne nezahltili, tak tú shadow mapu /tie tiene/ uložia v eDRAM ako textúru, tá je však priliš malá na uloženie tej textúry v slušnom rozlíšení a takto sme sa dopracovali ku dokurveným tieňom Wee Uu verzie Batmana. A to napriek jeho lepšiemu GPU a väčšej RAM /CPU Vee Uu je inak pomalšie ako CELL a to o dosť/.

 vľavo je We Uu, vpravo xcrap, hra - COD: Blops2. opäť problémy s rozlíšením tieňov a "the game runs pretty poorly - 30 fps in the first level. And it's missing details and has worse lighting."

Dúfam, že doteraz som to vysvetlil dosť jednoduchi aj pre úplných analfabetov. Príde totiž ešte jedna špekulácia a veštba. Naprv skrátená verzia. Odstup We Uu od PS4/xcrap720 bude väčší ako Wee od PS3/xcrap. Sajta beyond3D už viac ako rok rieši v teoretickej rovine problém pamäťového systému pre pravý next gen. Nie je to tak jednoduché. Nemôžte tam proste dať PC súčiastku /vysoká cena, vysoká spotreba, technologické problémy pri rýchlom prechode na menšiu vodivú dráhu/. Navyše sa ráta s SOC designom a teda viac čipov na jednom substráte a rôzne hybridné a rafinované postupy - 2.5D alebo 3D stack. Interposer stacking.

Pointa je však jasná - neposrať to ako pri PS3ke /RSX na úbohej zbernici/ a zároveň nevykrvácať. PS4 a xcrap 720 teda dostanú asi sednvič - napríklad RAMku v niekoľkých čipov /rovnako ako Wee Uuu/ ale nie rozťahanú na ploche a spojenú drahou a dlhou zbernicou a drôtmi ale čipy nalepené na sebe /stacking, sendvič/ a poprepájané ultra rýchlymi TSV /Trough silicon via/ spojkami. Je to najnovšia technológia a je super a má veľkú budúcnosť a bob vie či sa naozaj do PS4ky dostane. Zbernica o šírke 512 bitov a rýchlosťou cez 100 giga/sec by nebola problém. Išlo by o brutálne výkonnejšie riešenie ako pri Wee Uu. Multiplatformové hry pre 4+ gigové PS4 a xcrap 720 by boli pre Wee Uu len horko tažko konvertovateľné. Nintendo vám proste klame. Bodka na záver. PC grafika Nvidia GTX 680 to páli do svojej vram rýchlosťou 192.2 GB/sec.