Speaker
Csaba Nemes
(PPKE-ITK)
Description
Napjainkban a sűrűségmátrix renormálásicsoport algoritmus (DMRG) az alacsony dimenziós erősen korrelált rendszerek szimulációjának vezető numerikus eszköze. Az algoritmus futási idejét lineáris algebrai műveletek dominálják, melyek lehetővé teszik, hogy a GPU-ban rejlő számítási potenciált könnyedén és hatékonyan kiaknázzuk. Az algoritmus legköltségesebb része különböző méretű, párhuzamosan végezhető mátrix-mátrix műveletek soraként írható fel. A prezentációban egy hibrid megoldás kerül bemutatásra, melyben a műveletek egy sorba rendezést követően CPU-n és GPU-n elosztva hajthatók végre. Az algoritmus profilját elemezve a második legidőigényesebb részt a nagy méretű, szélsőségesen aszimmetrikus mátrix-vektor műveletek adják. Méréseink alapján ezen speciális típusú mátrix-vektor szorzásokra indokoltnak találtuk egy optimalizált kernel bevezetését.