„Intel“ kuria atskirus žaidėjų, profesionalų ir serverių GPU, kurie visi bus išleisti šiais metais arba 2021 m. „Intel“ kortelės bus arba ilgai lauktos vangios rinkos gelbėtojos, arba jos šnipinės ir prastai veiks blogai (jokio spaudimo, „Intel PR“ darbuotojai skaito tai). Aš asmeniškai esu laimingas bet kuriuo atveju: mes gauname gerus GPU arba mes gauname gerų dalykų savo malonumui.

Tai yra mūsų Antras raundas Xe tyrimas paaiškėjo pastaruosius kelis mėnesius. Norėdami greitai apibendrinti, pagrindinių „Intel“ paskelbtų pranešimų, kuriuos jie paskelbė viešai kurdami „Xe“, grafiką:

  • 2017 m. Lapkričio 8 d .: Raja Koduri baigia valdyti AMD GPU skyrių ir prisijungia prie „Intel“ bei tampa pagrindinių ir vaizdinių kompiuterių vyresniuoju viceprezidentu. Pirmasis jo veiksmas - samdyti pusę tuzino senų draugų iš AMD gretų.
  • 2018 m. Birželio 12 d .: Tada „Intel“ investuotojams sakė generalinis direktorius Brainas Krzanichas Arkties garsas diskretiška GPU architektūra daugelį metų, ir jie planuoja ją paleisti 2020 m.
  • 2019 m. Sausio 8 d .: Gregory Bryantas, vyresnysis klientų skaičiavimo viceprezidentas, CES patvirtino, kad pirmasis „Intel“ GPU turas pasieks 10 nm mazgą.
  • 2019 m. Gegužės 1 d .: Jimas Jeffersas, vyresnysis pagrindinis inžinierius ir perteikimo ir vizualizavimo komandos vadovas, pranešė apie „Xe“ spindulių sekimo galimybes FMX19.
  • 2019 m. Lapkričio 17 d .: Raja Koduri paaiškino, kad „Xe“ bus trijų tipų skaičiavimas: didelio našumo, mažos galios ir didelio našumo. Jis sakė, kad pirmasis GPU antroje kategorijoje bus „Ponte Vecchio“, atvyksiantis į 7 nm mazgą 2021 m.
  • 2019 m. Sausio 9 d .: Išleidžiami pirmieji „Discrete Graphics One“ programinės įrangos kūrimo įrankio (DG1 SDV) vaizdai, rodantys mažą RGB infuzijos kortelę, kuri padeda kūrėjams optimizuoti savo programinę įrangą „Xe“ architektūrai.

Ir toks, kad ...

  • 2020 m. Kovo 17 d .: Vyresnysis ryšių su kūrėjais inžinierius Antoine'as Cohade'as pristatys Xe „išsamią aparatinės įrangos architektūros apžvalgą“ ir „veiklos rezultatus“ GDC.

Oficialus pasakojimas atverčia „Intel“ istoriją apie paslaptingų GPU su daugybe pageidaujamų funkcijų kūrimą darbo vietoje; geresni mazgai, spindulių sekimas, naujos pakavimo technikos. Bet jūs ir aš abu žinome, kad GPU sukuria ne triukas, o arklio galia ir pinigai. Tai yra šio straipsnio tema.




Architektūrinis

Gera architektūra prasideda nuo plytų, taip pat GPU ... išskyrus „Intels“. „AMD“ ir „Nvidia“ branduoliai per valandą vykdo vieną operaciją, tačiau „Intel“ vykdomieji padaliniai (AB) turi aštuonis spektaklius. Nepaisant techninių netikslumų, mes palyginimui apibrėžsime AB kaip lygiavertį aštuoniems branduoliams.




Statybos metodai yra paprasti, išskyrus „Intel“ poreikį statyti aštuonias plytas vienu metu. Jie gali sujungti keletą plytų ir padaryti sieną. Tegul būna kelios sienos ir kambarys, iš jų galite kartu padaryti kelis griebtuvus ir apskritimą.

Apeinant tarpinius žingsnius, didžiausias Xe nepriklausomas vienetas (apskritimas) griežinėlis ir kiekviename yra atitinkamai 512 arba 768 branduoliai, skirti atitinkamai didelio našumo ir mažos galios gabalėliams. Viskas, ko jums reikia, yra vienas apskritimas, todėl mažai energijos naudojančiose kortelėse naudojamas tik vienas gabalas. Bet jei nenorite ten įsikurti, „Intel“ gamina dangoraižių stiliaus entuziastų GPU, sudarytą iš daugybės skiltelių.







Tai viskas, ką jums reikia žinoti apie „Xe“ architektūrą, kad suprastumėte, kas vyksta, tačiau jei galite pakalbėti apie kai kuriuos technologinius ir panašius triukus, nepraleiskite kito.




„Intel11“ integruotuose „Gen11“ GPU griežinėlis pagaminta iš aštuonių sub griežinėliaikurių buvo aštuoni vykdomieji padaliniai kiekvienas. „Gen12“ (pirmoji Xe karta) jis šiek tiek neigė ir skaičiavimo vienetai (CU) ir keičiant atvaizdavimo vidinę programą.

Rugsėjį kodas netyčia buvo įkeltas į „GitHub“ nutekėjo DG1, Ponte Vecchio ir DG2 variantai. Šis nutekėjimas yra patikimas, nes intuityvi prognozė, kad „Ponte Vecchio“ turės dvi skilteles, pasirodė esanti teisinga. Prognozė, kad DG1 turės šešias dalines dalis kiekvienam gabalui, taigi 96 AU, vieną ar daugiau EEB padavimas suteikia tą patį numerį.

Nutekėjimas atskleidžia, kad „Intel“ turi 16 AB kiekvienam „Gen12“ modelio poskyriui ir keturis poskirsnius kiekvienam gabalui, ypač „Ponte Vecchio“. Po „Koduri“ atskleisti „Ponte Vecchio“ turi dvi skilteles ir šešiolika PV.




Pakanka pasakyti, kad „Ponte Vecchio“ veikiausiai veikia taip: Aštuonios AB buvo sujungtos į vieną CU (64 šerdys), suporuotas su pjūviu (128 šerdys / 16 AU), kuris buvo riekė (512 branduolių / 512 AU). / 64 AB). Dviem griežinėliais tai reiškia, kad „Ponte Vecchio“ turi 128 AB, 1024 branduolius. Atminkite, kad dvi konfigūracijos konfigūracijos gali būti skirtos tik prototipams.

Tikimasi, kad pagrindinė „Ponte Vecchio“ skiltelių konfigūracija bus naudojama didelio našumo ir mažos galios modeliuose.

DG2: Aukštos kokybės

Didelio našumo mikroarchitektūra, vadinama „Discrete Graphics Two“ (DG2), apima vidutinės klasės ir entuziastų GPU rinkas. Šiose kortelėse bus spindulių sekimas ir RGB bling, tačiau įdomiausia yra „Intel“ galimybė nepaisyti „Nvidia“ 600 USD ir daugiau kainuojančių keistenybių.

"Xe HP ... lengvai būtų didžiausias silicis, sukurtas Indijoje, ir didžiausias silicis bet kurioje vietoje." - Raja Koduri

Pernai liepą „Intel“ netyčia vairuotojas (Ačiū!) Turi tris DG2 kodinius pavadinimus, „iDG2HP128“, „iDG2HP256“ir „iDG2HP512“. Darant prielaidą, kad paskutiniai trys skaitmenys rodo plokštės AB numerį, jie turi atitinkamai 1024, 2048 ir 4096 šerdis. Tai yra du, keturi ir aštuoni griežinėliai.

Bet po labai trumpo laiko įrodymai Taip pat sukurtas trijų zonų GPU su 1536 branduoliais. Atsižvelgiant į tai, kad „Intel“ nepagrįstai sukūrė ketvirtąją kortelę, panašią į dabartinius modelius, galima drąsiai pripažinti, kad tai yra „iDG2HP256“ išjungta dalis. Tai patvirtina plačiai paplitusius įtarimus, kad „Intel“ pasirinko tris pagrindinius modelius ir išjungė vieną ar daugiau dalių, kad į savo seriją būtų įtraukti ketvirti, penkti, šešti ar septinti modeliai.

Skiltelių skaičius 1 2 3 4 5 6 7 8
Šerdies skaičius 768* 1024 1536 2048 2560 3072 3584 4096
Kodinis pavadinimas „iDG1LPDEV“ „iDG2HP128“   „iDG2HP256“       „iDG2HP512“

DG2 taip pat bus daugiau nei žaidimų GPU. Jie negalės susidoroti su tokiais moksliniais krūviais, kaip „Ponte Vecchio“, tačiau jei juos išleidus yra gera vertė, juos tikrai galima pakartotinai parduoti su profesionaliais vairuotojais kaip vaizdo redagavimo ar 3D modeliavimo aparatūrą, pavyzdžiui, „Nvidia“ „Quadro“ korteles.

DG1: maža galia

Mažos galios segmentas svyruoja nuo 5W iki 50W. 5W - 20W integruotiems GPU ir 20W - 50W atskiriems.

„Intel“ mus supažindino su pirmuoju LP šeimos nariu. DG1 SDV Jis buvo pastebėtas „CES 2020“ programoje, kur buvo paleisti „Destiny 2“ ir „Warframe“ RGB. Bet jis tiesiog rengiasi kaip žaidimo korta. DG1 SDV yra tik kūrėjas, sukurtas padėti perkelti programinę įrangą ir tvarkykles į „Xe“ platformą.

Bet tai nereiškia, kad galų gale negalite nusipirkti kažko gana panašaus - „Intel“ jau įrodė, kad jis veikia nešiojamuoju kompiuteriu.

Pranešama, kad integruotose LP GPU formose yra nuo 64 iki 768 branduolių, o atskiruose LP GPU naudojami tik visi 768 branduoliai. Tai yra geriausia integruota AMD aparatinė įranga ir palyginamas branduolių skaičius su „Nvidia“ žemiausios pakopos diskretiškais procesoriais. Tačiau laikrodžio greičiu, kuriuo „Xe LP“ galėtų juos nustelbti.

Nesandarus „Geekbench“ bėgimas „Rocket Lake“ mobilusis procesorius turi integruotą 768 branduolių LP GPU, veikiantį 1,5 GHz dažniu. Tai toks pat našumas kaip ir „GTX 1650“. Tai įspūdinga, net naudojant 1,5 GHz, naudojant visą 20 W TDP, o „Intel“ negalėjo paleisti greičio net 1 MHz daugiau, kol jis nebuvo paleistas.

Įsivaizduokite, koks efektyvus turėtų būti šis procesorius. „GTX 1650“ turi šiek tiek mažiau TFLOP ir 75 W TDP: beveik keturis kartus daugiau. LP GPU, įstumtas iki 50 W, dar labiau padidins laikrodžio greitį ir galės įvesti tą patį našumo palaikymą kaip ir „GTX 1660“.

Tačiau geri dalykai tuo nesiliauja. „Linux“ branduolio atnaujinimai Rodyti „Intel“ planuoja būdą, kaip integruotą ir atskirą grafiką paleisti vienu metu ir potencialiai kartu. Tokiu atveju visa „iGPU“ galia gali būti sujungta su atskiro GPU galia, kad būtų sukurtas erdvę taupantis ir ekonomiškai efektyvus 1536 branduolių vieningas GPU. Tai puikus būdas gauti daugiau našumo iš to paties silikono.

Ponte Vecchio: Veri Hesaplama

Kai įžangoje pasakiau, kad svarbu tik žalia GPU arklio galia, melavau prisijungimo paspaudimas patvirtintas. Tai netaikoma jokiam duomenų centro GPU ir Senas tiltas ypač. „Ponte Vecchio“ - tai gudrybės ir metodai, kurie maksimaliai padidina efektyvumą.

Linksmas faktas:
Koduri pasirinko Ponte Vecchio po tiltu Florencijoje, nes jam ten patinka želatina.

Ypač Ponte Vecchio „Aurora“ superkompiuteris tai turėtų nurodyti jums optimizuotų darbo krūvių tipą.

Jei tai jums nedavė ženklo, aš jį parašysiu: dvigubas tikslumas. Iš esmės tai yra kiekvieno duomenų centro GPU sąraše esantis dalykas, o „Koduri“ daugiausia laiko aptarė leidimo metu. Deja, vienintelis skaičius, kurį jis įdės, yra Ponte Vecchio ES teorinis FP64 rodiklis, ~ 40 kartų didesnis nei „Gen11“.

Atliekant dalį servetėlių matematikos, apie 20 TFLOP 64 FP vienoje 1024 pagrindinėje kortelėje. Tačiau nelaikykite to evangelija, nes skaičiuojant nėra pakankamai reikšmingų skaičių, kad gautumėte reikšmingų rezultatų.

Antrasis iš didelio tikslumo darbo krūvių yra ypač žemo tikslumo darbas. Ponte Vecchio palaiko INT8, BF16 ir įprastus FP8 ir FP16 dirbtinio intelekto neuroninių tinklų apdorojimui. Kiekvienoje AB yra sumontuotas matricos variklis (pvz., „Nvidia Tensor“ šerdis), skirtas matricų apdorojimui 32 kartus greičiau nei standartinis AB.

Tačiau nė vienas iš jų nėra ypač naujas. Tikroji „Ponte Vecchio“ stiprybė yra atminties posistemėje, kuri leidžia GPU spręsti problemas naujais būdais.

Norėdami tai padaryti, „Ponte Vecchio“ naudojasi svarbiomis naujomis „Intel“ ryšio technologijomis - „Foveros“ ir „EMIB“ (įterptasis kelių formų jungčių tiltas). „Foveros“ naudoja silikonizuotus būdus sukrauti kelis žetonus ant aktyvaus įrankio įrankio formos, užtikrindami jiems greitį, panašų į mikroschemą, bet sujungiant juos be lusto. Priešingai, EMIB yra „nebylus“ ryšys tarp dviejų mikroschemų, naudojant neaktyvų štampą, tačiau siūlantis didelį pralaidumą už mažesnę kainą.

EMIB ir „Foveros“

EMIB naudojamas norint išaiškinti nuostabų „Ponte Vecchio“ atminties pralaidumą, kad būtų galima tiesiogiai prijungti GPU skaičiavimo įrangą prie HBM. „Foveros“ yra naudojamas susieti du CU dalyse į RAMBO talpyklą, naują „Intel“ talpyklą. „Foveros“ dėka RAMBO neturi jokių apribojimų dėl savo talpos ar pėdsakų ir gali apeiti CU siunčiant / priimant duomenis iš HBM ar kitų pogrupių.

Turėdamas didžiulę talpyklą - turiu omenyje didžiulę, didžiulę, „Intel“ diagramos rodo tokio paties dydžio RAMBO mikroschemą kaip ir CU - tai akivaizdžiai brangu, tačiau atveria keletą puikių galimybių. Pvz., Apdorojant neuroninį tinklą, RAMBO gali laikyti matricas didesnio dydžio nei kitos GPU talpyklos. Matricoms didėjant ir jautrumo lygiui didėjant, kiti GPU praranda našumą, tačiau „Ponte Vecchio“ gali išlaikyti aukščiausią našumą.

Senas tiltas

„RAMBO“ talpykla taip pat palaiko „Xe Memory Fabric“ - nuorodą ir voratinklinį technologijų tinklą, kuris sukuria išteklių telkinius iš kiekvieno GPU ir procesoriaus serverio mazge. Nors kiekvieno GPU RAMBO talpykla sujungiama į vieną banką, kurį gali naudoti viskas, lėčiausias ryšys yra tada, kai procesoriai veikia 63 GB / s sparta per PCIe 5.0.

Neseniai metinio pelno investuotojų susirinkimas„Intel“ patvirtino, kad „Ponte Vecchio“ pradės gabenti 2021 m. Ketvirtąjį ketvirtį. Neaišku, ar tai reiškia visišką „Aurora“ superkompiuterio išleidimą, ar specialų ankstyvą paleidimą.

Programinė įranga

Aparatinė įranga yra puiki ir visiškai nenaudinga be tinkamos programinės įrangos palaikymo. Ir slenkstis yra gana aukštas: jei net 1% žaidimų nėra tinkamai palaikomi, milijonai žaidėjų susvetimėja. Gera žinia ta, kad „Intel“, atrodo, daro viską.

„Intel“ pertvarkyti Instrukcijų rinkinio architektūra (ISA), kuri yra žemiausias programinės įrangos lygis šiuolaikinėms didelio našumo programoms. „Planuojama, kad į„ Gen12 “bus įtrauktas vienas išsamiausių„ Intel EU ISA “tyrimų nuo originalaus„ i965 “. Reikia atnaujinti beveik kiekvieną komandų erdvę, aparatinės įrangos kodą ir įrašo tipo kodavimą. "

Vairuotojų lygiu „Intel“ yra ilgesnis kelias, tačiau daro pažangą. Integruoti GPU tvarkyklės nėra atnaujinamos taip dažnai, kaip jų konkurentai, tuo tarpu paskutiniai dešimt atnaujinimų yra 26 dienos „Intel“, 14 dienų - „Nvidia“ ir 12 dienų - AMD. Tačiau jų stabilumas ir palaikymas labai pagerėjo 2019 m., O „Intel“ architektūrai buvo optimizuoti 275 nauji pavadinimai.

Kita vertus, „Intel“ klientams skirta programinė įranga yra puiki. Neseniai išleistas „Graphics Command Center“ suteikia žymiai daugiau valdymo ir juo lengviau naudotis nei, tarkime, „Nvidia“ „GeForce Experience“. Kaip ir „GeForce Experience“, jis gali optimizuoti žaidimus pagal konkrečias aparatinės įrangos konfigūracijas, tačiau paaiškina, ką daro kiekvienas nustatymas ir koks bus našumas. Vairavimo valdymas yra maloniai paprastas.

„Command Center“ taip pat yra unikalus teikdamas pažangius ekrano valdiklius. Jis siūlo neskausmingą kelių ekranų sąranką ir plačias spalvų stiliaus koregavimo galimybes naudojant atnaujinimo dažnį ir sukimosi sinchronizavimą. Aš asmeniškai jį naudoju tikrindamas savo sistemą, nors joje veikia „Nvidia“ aparatinė įranga.

Kaip premiją „Xe“ produktai palaikys „FreeSync“ ir „G-Sync“ monitorius, nes „Intel“ taip pat palaiko kintamą atnaujinimo dažnį.

Atleiskite

Nors „Intel“ šiek tiek drovisi dėl to, ką jie išleis GDC kovo mėnesį, mes turime didelę galimybę pateikti išsamų pareiškimą. Tokiu atveju galime tikėtis, kad jis bus evakuotas artimiausiais mėnesiais. Labiausiai tikėtinas kandidatas yra birželis.

Pernai spalį „Koduri“ paskelbė ne per subtilų „Twitter“ įrašą užuomina savo naujos plokštelės atvaizdo pavidalu. Joje parašyta „Think Xe“ ir 2020 m. Birželio mėn. Jis atsisako komentuoti, ar istorija turi kokios nors reikšmės, o tai rodo, kad jis tikriausiai taip ir padarė.

Vienas iš tokios datos nutekėjimo privalumų yra tas, kad jei GPU atvyks liepos mėnesį, tai bendruomenei pasakys, ko tikėtis be per didelio jaudulio, nes sirgaliai bus pikti. Taigi laikykite tai neryškiu taikiniu; „Intel“ greičiausiai siekia birželio mėnesio leidimo (laikui bėgant „Computex“), tačiau tai gali užtrukti šiek tiek ilgiau, priklausomai nuo to, kaip viskas vyksta.

„Intel“ atkreipia dėmesį į keletą puikių dalykų ir mes tikimės, kad grafikos erdvėje atsiras trečias didelis žaidėjas. Tačiau kol ateis laikas, galime būti tik atsargūs optimistai.

Apsipirkimo spartieji klavišai: