Katona Zoltán
Folyamatok hibatoleráns futtatása számítógépfürtön
A cikkben két hibatûrô rendszert mutatok be, melyet az egy-két processzoros személyi számítógépekbôl álló számítógépfürtökre dolgoztak ki. Jelen esetben hiba alatt az olyan véletlenül bekövetkezô eseményeket értjük, melyek miatt egy, vagy több számítógép többé nem része a számítógépfürtnek. A kiváltó ok lehet többek között a merevlemez, memória, alaplap, vagy a processzor meghibásodása, áramszünet, de akár az operációs rendszer, vagy bármelyik létfontosságú szoftver lefagyása is. A hibatûrô rendszerek legfontosabb feladata, hogy a több hétig, hónapig futó nagy számításigényû alkalmazást ne kelljen újraindítani egy ilyen nem várt esemény miatt. Biztosítaniuk kell az alkalmazás zavartalan futását, amelyet a hibák detektálásával, illetve ezek kiküszöbölésével érhetnek el.