Gridrendszerek és -alkalmazások
Kacsuk Péter
MTA SZTAKI
www.lpds.sztaki.hu
kacsuk@sztaki.hu
A grid rendszerek fejlődésében három hullámot lehet megkülönböztetni. Az első hullámként tekinthető tudományos gridek példái az európai EGEE gridrendszer [1], ill. ennek magyarországi verziója, a HunGridnek [2], melyben eredetileg a SZTAKI és az RMKI játszotta a fő szerepet, de mára már a BME, ELTE és NIIFI is biztosít erőforrásokat ebbe a gridbe. Az EGEE projektet és a HunGridet mutatja be célszámunk első cikke, amit Kárász E. írt. A HunGrid mellett létre jött a magyar ClusterGrid [3] is az NIIF gondozásában. Egy másik jelentős nagy európai grid projekt a SEE-GRID [4], amely a délkelet-európai országok közös gridrendszerét kívánja létrehozni. Erről a projektről és eredményeiről számol be Kozlovszky M. és szerzőtársai cikke. Ezek a gridek ma már stabil szolgáltatást nyújtanak, de csak korlátozott számú PC bevonására képesek. A két fent említett magyar tudományos gridben például együttesen kb. 1700 PC van összekötve.
A második hullám a vállalati gridrendszerek kiépítését jelenti. A világszerte megfigyelhető tendenciának megfelelően Magyarországon is megjelent az első vállalat (AMRI), amely elkezdte saját belső gridrendszerének kiépítését és az első hálózati szolgáltató, amely grides szolgáltatás kiépítésén dolgozik (Econet). A harmadik hullám a szolgáltatói (közmű-jellegű) grid megjelenése lesz. Ez a hullám még nem kezdődött el, az ehhez szükséges K+F projektek most alakulnak, vagy indulnak szerte a világban.
A tudományos számításokat támogató gridrendszerek eredeti törekvése az volt, hogy bárki erőforrást tudjon felajánlani a grid rendszerek számára, ill. erőforrást tudjon onnan szerezni dinamikusan, igény szerint, minél több erőforrás bevonásával. Sajnos az eredeti célkitűzés nem valósult meg teljes mértékben. Jelenleg két egymástól jelentős mértékben eltérő irányzat figyelhető meg a tudományos grid rendszerek fejlődésében.
Az első irányzat arra törekszik, hogy olyan grid szolgáltatást hozzon létre, ami a felhasználók számára stabilan, szolgáltatásként érhető el. Egy erőforrás grid erőforrássá alakítását grid-szoftverrendszerek feltelepítésével érik el, amelyek bonyolultak, telepítésük és karbantartásuk komoly szakértelmet igényel. Ennek eredményeképpen a grid erőforrásait nem egyének, hanem intézmények biztosítják, amelyek professzionális rendszergazdákat alkalmaznak és ezzel garantálják a grid magas színtű rendelkezésre állását. Ilyen grid rendszerekre példa a legnagyobb európai grid az EGEE Grid (és annak magyar verziója a HunGrid), vagy az Egyesült Királyságban alkalmazott Nemzeti Grid Szolgáltatás [5], ill. a magyar ClusterGrid, amit az NIIF üzemeltet. Az eredeti célkitűzésből tehát nem teljesül az a kitétel, hogy bárki erőforrást biztosíthat a grid számára és ezért a grid erőforrások száma meglehetősen korlátozott. (A világ legnagyobb ilyen gridjében, az EGEE Gridben is csak kb. 40000 PC van összekötve.) Ugyanakkor bárki használhatja az ilyen gridek erőforrásait, ha sikeresen beregisztrált egy adott grid engedélyezési hatóságánál és onnan egy grid-jogosítványt kapott. A grid-jogosítványnak kiemelt szerepe van a tudományos gridek biztonságtechnikájában. Az ehhez kapcsolódó grid biztonsági kérdéseket részletezi Kővári K. cikke.
A második irányzat, az ún. desktop grid (DG) technológia, az első irányzatnak épp a komplemense az eredeti célkitűzések tekintetében. Ez az irányzat lehetővé teszi, hogy bárki erőforrást allokáljon a grid számára, de jelentősen korlátozza a gridet hasznosító felhasználók számát. Ennek az irányzatnak az egyik közismert példája a SETI Grid rendszer [6], ahol kb. 1,5 millió PC-t használnak. A SETI és több más az egész világra kiterjedő publikus DG projekt (EINSTEIN@home, LHC@home, stb.) a BOINC technológiát [7] alkalmazza akárcsak a SZTAKI Desktop Grid [8], melynek publikus verziója egy, az ELTE által kifejlesztett matematikai alkalmazás [9] végrehajtásába vont be több mint 27.000 számítógépet a világ számos országából. Ugyanakkor a publikus DG rendszereket nem használhatja akárki, hanem egy vagy néhány nagy projekt számára biztosítanak extra számítási kapacitást. Azaz éppen azok, akik a PC-jüket felajánlják, nem profitálnak a rendszer használatából. Ezt az ellentmondást próbálja feloldani az a Jedlik Ányos projekt [10], melynek keretében az Econet munkatársai olyan üzleti modellt próbálnak kidolgozni a desktop gridek alkalmazásában, ami lehetővé teszi a PC donorok jutalmazását is. Ugyancsak ennek a projektnek a keretében a SZTAKI olyan megoldást igyekszik kidolgozni, aminek segítségével lokális desktop gridrendszerek hierarchiába szervezhetők. Az ehhez szükséges új ütemezési megoldásokat mutatja be Farkas Z. cikke.
A desktop gridrendszerek kutatásában és fejlesztésében két magyar intézmény is a nemzetközi élvonalban található. Az Econet kiemelten biztonságos globális desktop gridrendszere már a külföldi vásárlók figyelmét is felkeltette. A SZTAKI Desktop Grid hierarchikus verziója pedig a BOINC fejlesztők figyelmét vonta magára, kísérleti felállítása már két hazai vállalatnál is megtörtént és fogadtatása mindkét helyen igen kedvező volt. A SZTAKI nemzetközi elismertségét mutatja ezen a területen, hogy a 2008 januárjában kezdődő EDGeS (Enabling Desktop Grids for e-Science) EU FP7 projektet koordinálja. Az EDGeS célja épp a fent említett kétféle grid rendszer integrálása egyetlen nagyteljesítményű grid rendszerbe [11].
A feladatok elosztása a gridben komoly kihívást jelent, mivel a különböző tudományos gridek egymástól szeparáltan működnek és nem képesek egy általánosan elfogadott szabvány mentén kölcsönös együttműködésre. Ennek a problémának a megoldására mutat példát Kertész A. cikke, melyben a szerző egy gridek feletti meta-brókert mutat be, ami lehetővé teszi a feladatok elosztását nemcsak egy griden belül, hanem több grid között is.
A grid rendszerek elérésében fontos szerepet játszanak a grid portálok. A SEE-GRID hivatalos portálja a SZTAKI által kifejlesztett P-GRADE portal [12] (ld. Kozlovszky M. cikkét), ami egy általános célú portál, magasszintű grafikus workflow alkalmazások gyors létrehozását és grides futtatását támogatja elrejtve az aktuális grid specifikus tulajdonságait. A P-GRADE portál a legelterjedtebb grid technológiákat támogatja (GT2, GT4, LCG-2, gLite), sőt lehetővé teszi, hogy egy workflow alkalmazás különböző tevékenységei egyidejűleg több különböző típusú gridben is futhassanak [13]. Ezen az elven alapul a P-GRADE GIN VO Resource Test Portal [14], ami az OGF GIN (Grid Interoperability Now) munkacsoportja számára biztosít egy olyan portál megoldást, mellyel a legkülönbözőbb gridrendszerek erőforrásai egyidejűleg tesztelhetők. Ez a HunGrid hivatalos portálja is, amit az ELTE biztosít szervízszinten a magyar felhasználók számára [15]. Pasztuhov D., Sipos A. és Szeberényi I. egy másik GridSphere [16] alapú portált mutatnak be cikkükben, ami egy konkrét alkalmazás támogatására lett létrehozva a BME-n, amely egyben olyan eszközöket biztosít, mellyel más alkalmazások támogatásához is igazítható.
Alkalmazások nélkül a grid nem sokat érne és a mi célszámunk sem lehetne teljes. Kozlovszki M. két magyarországi grides alkalmazást is mutat, amik a SEE-GRID projekt keretében lettek kifejlesztve. Az első egy e-piactér alkalmazás, a második egy mérnöki alkalmazás. Pasztuhov D., Sipos A. és Szeberényi I. egy vasbeton hídgerendák térbeli alakváltozásainak számítására szolgáló grides alkalmazást írnak le. Az ilyen alkalmazások grides támogatására a BME a Saleve rendszert, a SZTAKI a P-GRADE portált fejlesztette ki. A Saleve rendszert részletesebben is bemutatja Dóbé P., Kápolnai R. és Szeberényi I. cikke. A harmadik grid alkalmazás, amit Ádám R. és Bencsik A. cikke mutat be a meteorológiai változók és a levegőben jelenlévő pollenkoncentráció közötti kapcsolatot keresi az allergiás betegek érdekében.
Célszámunk természetesen nem törekedhetett teljességre. Ezzel együtt reméljük, hogy a kedves olvasó ötleteket talál arra nézve, hogyan kezdheti el alkalmazni a magyar és nemzetközi grid rendszereket nagyméretű feladatainak megoldása érdekében.