29. 1. 2013

PS4 Orbis - update


Prežúvam staré informácie podobne ako to robí Vgleaks, hanbu necítim, pridávam však aj nové odrobinky a vysvetlenie o čo tu vlastne ide /Deloix dostane článok na požiadanie/. SONY s PS4 po prvýkrát nepoužije zabehaný štandard rozloženia hlavných čipov na matičnej doske. Na PS1-PS2-PS3 aj laik dokázal aspoň natipovať kde sa nachádza CPU a kde GPU /alebo RAM/. Na PS4 je CPU a GPU jeden "čip". Ide o tzv. SOC /system on chip, viď aj neskoré PS2 modely, EE+GS/ riešenie. PSV má zas SIP /system in package, jednotlivé časti na jednom substráte sú od seba odelené a vertikalizované - sendvič, je to jednoduchšia varianta SOC/, Wee Uu zas používa MCM /multi chip module, ešte jednoduchšia varianta, oddelené časti alebo po horizontále, na ploche/. Obe pravé next gen konzoly PS4 a xcrap 720 idú SOC cestou.


Výhody - CPU aj GPU sú v našom prípade od jedného výrobcu, fyzicky ide o jeden čip /šváb/, na jednej výrobnej linke, zmena výrobného procesu /28-22-18-14-10nm/ sa okamžite týka celého komba naraz /CPU aj GPU, neriešite teda 2 rôzne problémy/. Ďalšimi benefitmi je maximalizácia priepustnosti medzi CPU a GPU a fantastické zníženie latencie. Efektivita celej takejto architektúry stúpa ku hviezdiam. SOC je z hľadiska kontroly ceny do budúcnosti - navyše nesmierne výhodný, mimochodom technicky príšerne náročný. Dokonca aj pri 28nm procese je problém to napchať na jedno miesto, vyťaženosť je zlá, stabilita na hrane /teplotná obálka, TDP/. Predstavte si intel štvorjadro a NV 570 naraz pod jedným heatsinkom. Je to inžiniersky rébus. Nevýhodou SOC je aj to, že už spomenutá klasika /CPU a GPU každý na svojom mieste matičnej dosky/ umožňuje jasne vyšší hrubý výkon. MS a SONY si však museli zvoliť ekonomickejšie riešenie.

CPU: 8 jadier triedy AMD Jaguar, 8 vláken na 1.6Ghz. Teoretický výkon je 102.4 GFLOPs, čo je presne polovica CELL CPU /v PS3ke ide o 8 jadier, 9 vláken na 3.2Ghz/. Napriek tomu bude mať PS4 lepšie CPU a to o dosť oproti PS3ke. PS4 Jaguar má totiž OoO spracovanie inštrukcií - aj mimo poradie /out of order/, CELL menej efektívne - podľa poradia /in order execution/. Dobrá polovica CELL CPU pracovala povinne na grafických operáciach, pomáhala slabému RSX GPU. Jaguar nielenže nič podobné robiť nebude, má k dobru pomocné akcelerátory /DSP, FPGA/ pre spracovanie audia /mixovanie, 3D efekty/, HW kodeky pre video /kódovanie, dekódovanie, to sa hodí pre posielanie komprimovaného videa do PSV/, HW scaler /z 720p do 1080p a podobné hračky/ alebo HW dekompresiu prenášaných dát /aby sme významne pomohli pomalému nahrávaniu z BD alebo HDD mechaniky/. Na PS3 to vlastne celé opäť odtiahol CELL procesor /je to mrcha výkonná, jedna SPE jednotka je schopná naraz prehrávať stovky mp3 streamov/. Pri PS4 bude Jaguar CPU a jeho 100 GFLOPs čiste k dispozícií štandardným CPU operáciam. Vidím však vaše smutné ksichty, čakali ste proste niečo viac, nejaké next gen kúzlo. Dám vám teda ďalších 400 "CPU" GFLOPs k tej upotenej stovke. Konkurenčné intel delo i7 4770k to pritom páli "iba" za 448GFLOPs. Má to teda nejaký háčik, alebo lodný hák ?


Jasné, že hej. Teraz sa budú diať čudné veci, tož dávajte pozor. V staršom článku o PS4 som písal o tom, že sa v nej bude povaľovať nejaký "compute module" hlavne pre náročné výpočty spojené napríklad s "fyzikou".  Neogaf špekuloval, že by mohlo ísť o SPE jednotky nášho CELL CPU. Kravina, debilné deti v puberte. Progiš by sa zbesnel pri kódovaní pre tri rôzne ISA /Instruction Set Architecture/: CELL SPE, Jaguar, GPGPU. Optimálne by bolo dostať to na dva inštrukčné sety, alebo dokonca jeden a pol. A aj to dosiahneme. Zdanlivý off-topic, v skutočnosti sme však stále na hlavnej ceste. GPU v PS4ke je predsa GPGPU a malo by zvládnuť nejaké tie blbosti s fyzikou a podobne. Malo ale všetko je inak, skutočne efektívne paralelne spracovanie grafických a "CPU" operácii na GPGPU, na tom čo bude v PS4ke - zatiaľ nie je možné. Platí to aj pre PC GPU tohto typu.


AMD ponúka tieto riešenia. Počkáte si na AMD GPU s funkciou "Graphics Pre-Emption", bude k dispozícií v roku 2014 alebo využijete to malé "kabelkové" GPU v AMD APU na fyziku a diskrétne GPU /to veľké/ na grafiku. PS4 však druhé GPU mať nebude a do polovice roka 2014 čakať nemôže. Urobíme to teda inak. PS4 GPU /je fuk aký to má výkon, čakám aj tak na definitívný "letný" dev kit/ je složené z 18 x CU /compute unit, každá 64 SIMD subprocesorov/, každé CU má výkon cca 100 GFLOPs. My si od nášho GPU požičiame 4xCU /to je tých mojich "CPU" 400GFLOPs/ a posunieme ich bližšie ku CPU a to nielen v zmysle fyzickom ale aj funkčnom /bližšie detaily sú veľmi strohé, avšak stále ich je možné údajne použiť aj na grafické účely/. PS4 GPU má byť údajne OpenGL natívna grafika, GPGPU funkcie sa programujú v OpenCL prostredí, ktorého logika je dosť podobné tomu, ktoré používa PS4 CPU. Takto dostaneme pekne prehľadné a takmer jednotné programovacie prostredie. PS4 Jaguar a 4xCU jednotky teda dosť verne kopíruje CELL a jeho heterogénne PPE+SPE, čím nechcem nič naznačovať, hehe.

GPU: kolujú dokonale protichodné informácie. Stále s určitosťou nevieme či použijú staršiu HD 7xxx /GCN1 jadro/ alebo najnovšiu HD 8xxx /GCN2/. Podľa konfigurácie, ktorá je vycapená na Vgleaks ide o bežnú DX11+ HD7xxx /povedzme 7850ku/ na 800Mhz, GCN1, 32 x ROPs, 72 x TMU, 18xCU atď. - to sú všetko údaje ako opísane z bežného PC letáku. Áno je to mnohokrát výkonnejšie ako RSX v PS3ke. Je zbytočné tomu venovať viac textu, situácia sa ešte môže zmeniť /už sa to stalo 2 krát/ a to práve vo finálnom letnom SDK. Mocne sa však špekuluje o implementácii AMD HSA dizajnu. Naozaj netuším či sa toho aj dočkáme. Ide o fakt báječnú vecičku. V pamäti máte kus kódu, ktorý sa nehýbe /žiadne cestovanie v rámci jednej RAM, alebo na iné miesto do inej RAM/. CPU a GPU pristupujú stále na tú istú mem adresu /plne koherentné zdieľanie, unifikovaný adresný priestor/ a podľa kontextu si ten kus žrádla "virtuálne" prehadzajú /viď aj tento SONY patent/.

RAM:  stále sme na úrovni 4 gigabajty, "jedna banka", UMA /Unified Memory Architecture/. Výhodné s ohľadom  na HSA spomenutú vyššie. Čo zdroj to iná rýchlosť našich štyroch giga. Minule to bolo 192, dnes 176 giga/sec. Blbosti. Použitá GDDR5 je takmer 100% iba nahradný placeholder, SONY sa určite bude snažiť o cenovo perspektívnejšiu, energeticky ďaleko menej náročnú, dokonca rýchlejšiu /aj 256 giga-sec/ 2.5D, stacked alebo TSV ramku. OS si vraj z tých 4 giga zoberie 512 mega, nemá to príliš logiku, lebo je to bohapusté míňanie tak výkonnej a drahej pamäte. Špekulácia nevylučujú ešte jeden maličký ARM SOC s vlastnou pamäťou pre OS a hlavne DRM funkcionalitou /dôležité/.

Hra. Dosť nudnej teórie, chce to niečo veselšie, nejakú gamesu. Nuž predstavte si, že teraz zoberiem ten náš PS4 SOC /CPU+GPU/ a orežem ho na kosť. CPU na 4 až 2 jadrá, zbernice na polovicu, pracovné frekvencie v riti, GPU maximálne na úroveň 4xCU. Kurva - maximálny odber na úrovni 8 watt, bežne okolo 5.9 watt !!! Nazveme to AMD Tamesh a strčíme to do tabletu. Nakŕmime ho otrasne neoptimalizovanou PC verziou sračky Dirt: Showdown. Rozlíšenie dáme na full HD. A ono a to dá hrať !! Ak by bol Tamesh v konzole a trošku sme to zoptimalizovali, bude to fičať na úplne stabilných 1080p/30hz a to do 8 watt spotreby. Wee Uu žerie typicky okolo 35watt a na podobný výkon sa nigda nezmôže. Teraz si predstavte PS4, ktorá bude papať okolo 150+ watt. Dnešné hry by na nej do tej poslednej bežali na 1080p/60Hz/AA. A to je všetko, aj tak s týmito špekuláciami iba strácam čas.