مهمترین فرایند مدیریت حوادث
فرایند مدیریت حادثه بزرگ برای سازمانها بسیار حیاتی و ضروری است، زیرا به آنها کمک میکند تا تأثیر کسبوکار یک حادثه بزرگ را به حداقل برسانند. فرایند اصلی مدیریت حادثه در درجه اول شامل مراحل زیر است:
مرحله ۱: شناسایی
اعلام حادثه بزرگ:
اولین قدم، شناسایی حوادث احتمالی است. برای سازمانها مهم است که روشهای متعددی برای شناسایی تهدیدات داشته باشند. حوادث بزرگ را میتوان توسط تکنسینها پرچم گذاری کرد، زمانی که آنها در سراسر شبکه مورد آماج تیکت های غیرمعمول قرار میگیرند، یا توسط کارشناسن NOC که ناظر ابزارهای نظارت بر شبکه هستند میتواند شناسایی شود یا بهطور خودکار یک ابزار قاردست یک مسئله شبکه را پرچمگذاری کند و یک تیکت برای هشدار دادن به میز خدمات ارسال نماید. سازمانها همچنین میتوانند یک خط تلفن اختصاصی برای کارکنان میز خدمات ایجاد کنند برای نشان دادن حوادث بزرگ مشکوک.
اطلاعرسانی به ذینفعان:
هنگامیکه یک حادثه بزرگ شناساییشد، باید به تمام ذینفعان کلیدی اطلاع داده شود. چهار گروه اصلی وجود دارد که باید از حوادث مهم مطلع شوند:
- تیم فنی: مهم است که بلافاصله به تیم فنی اطلاع دهید تا بتوانند تصمیمگیری در مورد یک دوره اقدام برای رفع مشکل را شروع کنند.
- مدیریت: مطلع نگهداشتن مدیریت ارشد سازمان یا مدیریت ارشد فناوری اطلاعات: مانند CIO، در مورد حوادث بزرگ به پاسخگویی کمک میکند. سازمانها باید مدیریت را از تمام اقدامات انجامشده برای رفع حوادث بزرگ مطلع کنند.
- ذینفعان کلیدی: مدیران و رؤسای بخش و کارکنان کسبوکار در سطح خدمات نیز باید از حوادث عمده مطلع شوند و بهروزرسانیهای منظم وضعیت را دریافت کنند.
- کاربران: کاربران باید بدانند که کدام خدمات ممکن است به دلیل یک حادثه بزرگ در دسترس نباشد.
مرحله ۲: مهار
جمعآوری تیم حادثه بزرگ
تیم مدیریت حادثه بزرگ MIT یا Major Incident Team باید فوراً گرد هم بیایند. این تیم بهطور خلاصه شامل خود مدیر حادثه بزرگ، تکنسینها، مدیران سطح خدمات و سایر ذینفعان کلیدی است. گاهی اوقات کارکنان خارجی بسیار ماهر برای مقابله با یک حادثه بزرگ آورده میشوند. MIT باهم آنان برای یافتن یک راهحل برای حادثه بزرگ و بازگرداندن عملیات به حالت عادی کار میکند و این نقش مهم برای اوست.
راهاندازی یک پل کنفرانس
یک پل کنفرانس، که بیشتر بهعنوان یک کنفرانس تلفنی شناخته میشود، به عیبیابی مؤثر و ارتباطات متمرکز کمک میکند. این بهعنوان یک کانال ارتباطی روشن و سریع بین اعضای MIT عمل میکند.
آمادهسازی یک اتاق جنگ تعیینشده
داشتن یک اتاق جنگ تعیینشده به همه اعضای MIT اجازه میدهد تا این حادثه را جمعآوری و عیبیابی کنند. این امر تلاشهای همکاری را افزایش میدهد و به MIT کمک میکند تا سریعتر راهحلی پیدا کند.
ایجاد یک تیکت مشکل برای شناسایی مسائل اساسی
یک تیکت مشکل میتواند برای کشف و درک علت اصلی حادثه بزرگ ایجاد شود. این میتواند به جلوگیری از حوادث بزرگ مشابه در آینده با پرداختن به علل حادثه بزرگ کمک کند.
مرحله ۳: Resolution
اجرای طرح Resolution بهعنوان یک تغییر
این یک عمل خوب برای اجرای اصلاح حادثه بزرگ بهعنوان یک تغییر است تا اطمینان حاصل شود که قطعنامه بهدرستی مستند و اجرا میشود. اجرای قطعنامه بهعنوان یک تغییر، خطر اختلال در حلوفصل شکستخورده را به حداقل میرساند.
ادامه مطلب در صفحه بعد...
ممنون عالی
[…] حوادث بزرگ از حادثه و / یا به مدیریت […]
[…] اخص اگر یک حادثه بزرگ Major Incident رخ دهد یا چند حادثهی تکراری اتفاق بیفتد و یا شکافی در […]