13. 6. 2012

Wee Urinal

Malá praktická analýza hárdvéru ďalšej konzoly od nintendo. Zle jazyky tvrdia, že CPU výkon je zhruba na úrovni dnešnej generácie konzol /osobne tvrdím, že je v strede medzi billšmejdom a PS3 Cellom/ a GPU, že je cca 1.5 krát výkonnejšie ako to v PS3 a spol. /osobne tvrdím, že je to skôr o 100% lepšie ako si ukážeme/. Urinal je vlastne dokonale LACNO vyladená aktuálna generácia. Nič viac a nič menej a bez default HDD. Ak ste pri štarte PS3ky chceli viac RAM, alebo viac eDRAM pre xcrap - tož Urinal to všetko má, len so cca 6-7 ročným meškaním, alebo inak povedané, to čo nám nintendo dáva teraz na stôl je konzola časovo vhodná pre E3 roku 2007. No nič, poďme na to.


Shuhei Yoshida /president of Sony's Worldwide Studios/

CPU: frekvencia okolo 3Ghz, tri jadrá, dva vlákna na jadro, OoO /Out-of-Order/ architektúra plus 3 mega L2 cache. Na prvý pohľad ide o procesor veľmi podobný tomu v dnešnom xcrape /tiež konfigurácia 3 jadrá po 2 HW thready/. V skutočnosti však bude billšmejd ťahať jasne za kratší koniec. CPU Urinalu je out-of-order môže teda spracovať inštrukcie aj mimo poradia, teda nie v tom akom do CPU prišli a efektívnejšie tak využívať voľné pracovne cykly. Ak sa pýtate prečo teda xcrap CPU a aj CELL sú primitívnejšími in-order mikropocesormi, tak je odpoveď jednoduchá. Bolo to výrazne lacnejšie. OoO CPU je komplexnejšie, kladie vyššie nároky na výkonnosť predikcie vetvenia /branch predictor/, viac tranzistorov, viac tepla, povinne aj dlhšia inštrukčná pipeline, vyššia cena. Dnes sme však už o niečo ďalej a aj konzola si môže dovoliť architektúru vhodnejšiu pre beh hernej logiky alebo AI.

Urinal má aj 3 krát väčšiu L2 kešku ako xcrap, ktorého 1 megabajt pre 6 vláken je žalostne málo. CELL má 512KB pre centrálne PPE jadro /2xHW thread/ a 7 krát po 256KB LS pre jednotlivé SPE - dokopy 2.3 mega /každé vlakno má teda 256KB, pri xcrape iba 166KB a problémy pri vstupe viacerých vláken do kešky a jej "uzamknutí"/. A do tretice tu máme akceleračný set SIMD inštrukcií Altivec spoločný pre xcrap, PS3 a Urinal. Avšak s custom úpravou pre jednotlivé konzoly. Urinal pravdedpodobne dostane derivát najnovšej sady VSX použitý aj v poslednej Power7 IBM rade. Nepochybujem, že budú o trochu výkonnejšie ako VMX128 set pre xcrap.

CPU Urinalu by už pri nominálnom využití malo hravo prekonať xcrap, a to nielen vďaka uvedeným vlastnostiam. Do hry vstupuje aj dedikované DSP a IOP aj pre spracovanie audia. Je verejným tajomstvom, že audio stránka xcrapu je veľmi slabučká /hlavne presný "rendering" audia v priestore/ a v mnohých xcrap hrách, ktoré sa o tom pokúsili padlo za vlasť aj celé jedno vlákno a teda 1/6 výkonu toho šmejdu.

GPU: AMD grafika, vysoko pravdepodobne VLIW architektúra s 32 megovou eDRAM. Iba slovo ku VLIW /very long instruction word/ - ide o klasické riešenie, veľmi vhodné pre spracovanie grafiky, masívna paralelnosť. VLIW je dnes na ústupe a nahrádza ho non/VLIW - SIMD design aka AMD GCN architektúra. Graphics Core Next. VLIW je paralelný na úrovni spracovania inštrukcií /ILP/, GCN/SIMD zas na úrovni vláken /TLP/. Druhý menovaný teda vie efektívnejšie spracovať aj negrafické GPGPU operácie /fyzika, audio, AI/. V tomto bode pôjde inak o zásadný rozdiel medzi GPU Urinalu a PS4/xcrap720. Len tak mimochodom - aktuálne konzoly mujú pochopiteľne VLIW design, avšak PS3 má k dispozícii SPE-SIMD jednotky práve v duchu AMD GCN štandardu. Kutaragi predbehol vývoj o dobré 3 generácie a práve preto má PS3 potenciál /stále hrubo nevyužitý a brzdený bill šmejdom/ na konkurovanie aj modernému DX10+ PC.

Naspäť ku nintendu. Jeho 32 megová eDRAM je ohromná a 3.2 krát väčšia než pri xcrape /CELL to rieši iba ultra rýchlo LS - local storage pri SPE jednotkách/. Xcrap s jeho 10 megovou eDRAM inak viacmenej tvrdo narazil, je príliš malá a nevhodná pre objemovo nacucané deferred grafické postupy. Tiling ničí polygónovú performance a v 720p si zas málokedy ak vôbec môžete dovoliť hárdverovú MSAA. Proste si nemáte kde zložiť kosti /rendertarget/. Predpokladám, že hry na Urinale pobežia masovo v 720p, alebo half 1080p /1280x1080/ a 32 mega teda bude bohato stačiť pre 720p+ 4xAA a tiled G-buffer deferred enginu. Proste paráda. Ak navyše pôjde o on-die riešenie a nie on-chip ako pri xcrape - priepustnosť bude takmer nekonečná. Platí ako vždy - ak na to pogram nebude adresne optimalizovaný, tak sa benefit sam od seba nedostaví. V opačnom prípade by mal Urinal excelovať v hrách so záplavou alfa efektov /transparencie, výbuchy, hmla, oheň, dym, iskry, priesvitné listy stromov/. V tomto PS3 bojuje doslova o prežitie a chce to maximálne programátorské nasadenie /RSX má maličkú a "nepriepustnú" zbernicu do svojej vram/.

Pri nintendo GPU sa udáva aj nejaký ten teselátor /zjednodušene ide pridávanie polygónov na model počas jeho spracovávania v GPU/, ale nikto netuší ako má vlastne výkonnosť. To isté platí pre optimalizáciu samotného API založenom na OpenGL. Pri PSV napríklad SONY mierne prekopalo schopnosti PowerVR GPU /preto to plusko na konci číselného označenia čipu/ a pridalo tam napríklad špeci "herný" HDR režim pri simultánnom použití s AA, teda niečo čo RSX priamo od výroby nevie, ale softvérovo sa to dá obísť.

RAM: Niečo o veľkosti 1.5 až 2 giga UMA /Unified Memory Architecture/ pamäte. Teda jedna banka spoločná pre všetky hlavné čipy /CPU, GPU, DSP/ podobne ako PS2 alebo xcrap. Dnešnou lacnou a dostupnou možnosťou jedna je GDR3 na 128 bit zbernici na cca 800Mhz /rýchlostne okolo 25-30giga/sec a teda na úrovni alebo mierne nad úrovňou súčasnej generácie/. Drahšou variantou je pochopiteľne GDR5 na 256 bite avšak pri pohľade na veľkú L2 kešku a eDRAM sa odhaduje, že ušetrili práve na hlavnej RAM. To plne chápem, lebo na porty z PS3 a xcrapu to bohato stačí a nintendo only hry aj tak viac nepotrebujú, ako nám opakovane dokazuje história. Blbeček na EG.net víťazoslávne vrieskal, že Wee U Mario 2D beží na 60fps v 750p. Mno, šlak by ma trafil, keby tak tomu nebolo.



hra Project P-100 je aktuálna Wee U špička a sledujte aj to násilne využitie tabletu, hurá

Bodka na záver. Následuje celkom logické využitie Urinalu v prospech cosa nostra alias SONY veci a teda súčasnej PS3. Predpokladáme, že PS4 bude v inej lige, čo ale nevadí. Takže Urinal to bude strašiť aspoň zo 5-6 rokov na Unreal 3.x/Frostbite 2.x engine, už zajtra ho predbehne každý druhý smartfoun, čo tiež nevadí. Pretože !! Urinal bude dobrá zásobáreň orezaných multiplat hier pre PS3ku, ktorú takto môže nintendo neúmyselne udržať pri živote aj viac ako tých plánovaných 10 rokov. PS2 za chvíľu oslávi 13. vyročie aktívnej služby. Never stop flam .. eeh .. gaming.