تعیین اولویت و نوع اعلان
در زیر سؤالاتی وجود دارد که به تعیین تأثیر و فوریت صحیح کمک میکند تا اولویت مناسب اختصاص یابد. هر صاحب برنامه / خدمات باید این سؤالات را در نظر بگیرد و آماده ارائه اطلاعات لازم به میز خدمت باشد.
- آیا این سرویس کاملاً در دسترس نیست؟
- چند کاربر تحت تأثیر قرار میگیرند؟
- آیا این کاربران ویژه یا VIP هستند؟
- تأثیر آن از چه نوعی است: گسترده، قابلتوجه یا محلی؟
- آیا پیامدهای مالی به همراه دارد؟
- آیا هرگونه برنامههای کاربردی کسبوکار بحرانی یا خدمات زیرساخت اصلی تحت تأثیر قرارگرفته است؟
اگر پاسخ به هر سؤالی بله باشد، اطلاعرسانی مناسب باید آغاز شود (MIN برای P1 یا SIA برای P2، P3، P4)
اطلاعات لازم در هنگام گزارش یک حادثه بزرگ
- نام سرویس چیست؟
- مک یا آدرس IP چیست؟
- تأثیر را برای مشتریان توصیف کنید
- آیا این موضوع بر همه مشتریان تأثیر میگذارد؟
- آیا این حادثه بر مکانهای خاصی تأثیر میگذارد؟
- تاریخ/زمان وقفه اولیه
- آیا این سرویس کاملاً در دسترس نیست؟
- جزئیات فنی؟
- آیا این بر سازمان، کاربران درونسازمانی و مشتریان بیرون از سازمان و یا هر دو تأثیر میگذارد؟
مراجع تشخیص و تشدید حوادث بزرگ
تشخیص حادثه عمده میتواند از منابع مختلف سرچشمه گیرد. پس از شناسایی، مراحل زیر باید از منبع مبدأ انجام شود: بهطورکلی از چهار درگاه برای اعلام و تشخیص حوادث بزرگ وجود دارد:
- تشخیص حادثه بزرگ توسط کارشناسان سرویس دسک
- تشخیص حادثه بزرگ توسط مرکز عملیات شبکه (NOC)
- تشخیص حادثه بزرگ توسط مالک برنامه / خدمات
- تشخیص حادثه بزرگ توسط کاربر
- تشخیص حادثه بزرگ توسط کارشناسان سرویس دسک
هنگامیکه سه تا پنج تماس در همان موضوع دریافت میشود، یا یک تماس برای یک برنامه کسبوکار حیاتی یا خدمات زیرساخت اصلی طرحشده سریعاً موارد زیر را انجام دهید:
- با مالک برنامه/سرویس مرتبط تماس بگیرید تا آنها را آگاه کنید که سرویسکار نمیکند
- تکنسین میز خدمت، اگر پس از ۱۰ دقیقه پاسخ نداد، به مرحله ۲ را بروید.
- مالک برنامه / خدمات، اگر پس از ۱۰ دقیقه پاسخ نداد، مرحله ۳ را ببینید
- مدیر بحران، اگر پس از ۱۰ دقیقه پاسخی نداد، مرحله ۴ را ببینید
- مدیر فناوری اگر بعد از ۱۰ دقیقه پاسخی نداد، مرحله ۵ را ببینید
- مدیر/ معاون CIO
- تأیید اعتبار با مالک سرویس / برنامه که یک مسئله وجود دارد
- صدور اطلاعیه مناسب تعیینشده توسط صاحب برنامه / خدمات، بر اساس تأثیر و فوریت
- اگر اولویت حادثه ۱ بحرانی است و بر یک برنامه کسبوکار بحرانی یا خدمات زیرساخت اصلی تأثیر می بگذارد، مدیر بحران را از طریق سرویس دسک مطلع کنید و از عبارت شبیه "یک حادثه بزرگ در حال وقوع است لطفاً در اسرع وقت به پل بپیوندید" استفاده کنید.
- تشخیص حادثه بزرگ توسط مرکز عملیات شبکه (NOC)
هنگامیکه یک هشدار از سامانههای مانیتورینگ یا کارشناسان شبکه دریافت میشود که دارای پتانسیل فوری است، بهوضوح معیارهای یک حادثه بزرگ را مشخص میکند، اقدامات زیر را انجام دهید:
- حادثه بهطور خودکار از طریق یک اعلان نظارت (یعنی Zabbix / Solarwinds/ Opamanger) وارد میشود.
- تریاژ هشدار
- اولویتبندی حادثه
- عیبیابی و اعتبارسنجی هشدار
- تماس با مالک برنامه / خدمات یا تکنسین
- برای موقعیتهای خاص، از طرف مالک برنامه / خدمات، از طریق خط هشدار با میز خدمت تماس بگیرید
- تماس با خط پل برای کمک.
سرویس دسک اعلان مناسب را بر اساس بحرانی بودن حادثه منتشر خواهد کرد.
ادامه مطلب در صفحه بعد...
[…] (MIM) یاMajor Incident Management ندارد شما نمیتوانید بهسرعت به حوادث بزرگ پاسخ و آن را حلوفصل کنید. اگر چنین فرایندی را در محل […]
[…] (MIM) یاMajor Incident Management ندارد شما نمیتوانید بهسرعت به حوادث بزرگ پاسخ و آن را حلوفصل کنید. اگر چنین فرایندی را در محل […]
[…] Incident Management ندارد شما نمیتوانید بهسرعت به حوادث بزرگ پاسخ و آن را حلوفصل کنید. اگر چنین فرایندی را در […]
خیلی خوب بود
[…] حوادث بزرگ به حادثه و / یا مدیر […]