پاسخ به رویدادها
در هر مرحله از فرآیند مدیریت رویداد و بسته به نوع اهمیت آن رویداد، تعدادی از گزینههای پاسخگویی در دسترس هستند. برخی از گزینههای موجود عبارتند از:
ثبت وقایع: صرف نظر از نوع رویداد، یک عمل خوب باید برای ثبت رویداد و اقدامات انجام شده باشد. این رویداد میتواند به عنوان یک ضبط رویداد وارد شود یا میتواند به عنوان ورودی در سیستم سیستم دستگاه باقی بماند.
هشدار و مداخلهی انسانی: برای رویدادهایی که به مداخلهی انسان نیاز دارد، باید این رویداد رو به افزایش باشد. هدف از هشدار، اطلاعرسانی به منبع صحیح (شخص) برای رسیدگی به این رویداد است.
ثبت حادثه: با شناسایی یک استثناء، میتوان حادثه یا یک مشکل و حتی یک تغییر را ایجاد کرد.
بستن رویداد
یک رویداد در نهایت یا بطور خودکار بسته میشود یا پس از تعیین آن بهعنوان حادثه، مشکل یا تغییر در پروسهی اجرایی عملیات کارکنان فناوری قرار خواهد گرفت و در نهایت بسته خواهد شد.
اساساً بجز نوع رویداد اطلاع INFO، رویدادهایی از جنس هشدار و استثنا بهشدت در مدیریت پیشگیرانه میتوانند کارساز باشند. مهم این است که آن اتفاق ناگوار رخ ندهد!
تبدیل رویداد استثنا و هشدار به اطلاع
بسیاری از نرمافزارهای مانیتورینگ حرفهای دارای گردشکارهای داخلی هستند این یعنی با اتوماسیون هوشمند تعبیه شده در آن میتواند بسیاری از اقدامات پیشگیرانه را نه صرفاً بطور انسانی بلکه از طریق خودکار سازی انجام داد و از تخصیص نیروهای NOC بیشتر برای مدیریت شبکه جلوگیری کنید. برای درک این مسئله به این سناریو دقت کنید.
فرض کنید آستانهی تحمل پر شدن ظرفیت هارد فایل سرور را روی ۹۰٪ گذاشتهاید با رسیدن به این آستانه ابزار مایتورینگ در حال ایجاد یک اعلان هشدار است اما بجای آنکه شما را وارد به انجام کاری بکند، در چنین شرایطی با افزودن یک گردشکار از قبل و یک اقدام سیستمی میتوان در صورت رسیدن به این آستانه، نرمافزار مانیتورینگ یک Job را روی سرور VM فایل سرور اجرا و ظرفیت هارد آنرا به دوبرابر ظرفیت جاری افزایش دهد. بنابراین صرفاً موفقیتآمیز بودن این اجرای خودکار را به سمع و نظر شما میرساند که به نوعی تبدیل یک اعلان هشدار به اعلان اطلاع است!
در سناریوی بعد فرض کنید سازمان دارای دو لینک ارتباطی برای یک سرور خاص است بدیهی است تمام ارتباطات کاربران با این سرور در وهلهی نخست روی یکی از این لینکها سوار است، در هنگام قطعی این لینک، یک رویداد(اعلان استثنا) ثبت میشود مبنی بر Down شدن سرور! که نیاز هست! در حالی که بجای آنکه شما را وارد به انجام کاری بکند، در چنین شرایطی با افزودن یک گردشکار از قبل و یک اقدام سیستمی میتوان در صورت رسیدن به این شرایط، نرمافزار مانیتورینگ پس از انتظاری چند دقیقه، یک سرور موازی FOS – Fail Over Service را روی بالا بیاورد و پایداری سرویس را در بالاترین حد نگاه دارد. شبیه این تفکر در Spanning Tree در کانفیگ روترهای سیسکو را قبلا دیده و شنیدهاید. در این حالت صرفاً موفقیتآمیز بودن این اجرای خودکار را به سمع و نظر شما میرساند که به نوعی تبدیل یک اعلان استثنا به اعلان اطلاع است!
مدیریت رویداد تفکر هوشمندانهای را میطلبد تا با خودکارسازی بسیاری از فعالیتهای انسانی و دستی علاوه بر پیشگیری از وقوع اتفاقات ناخوشایند، پایداری و در دسترسپذیری سرویسها را در بالاترین کیفیت ممکن نگه داریم.
این نکته را مجدد فراموش نکنید هر کاری که دوبار انجام میشود نیازمند یک فرایند سیستماتیک دارد! و باید به نقطهای برسید که خبر بد را به خبر خوب تبدیل کنید!
[…] مقاله مرتبط: مدیریت مشکل با مدیریت رویداد […]
[…] مدیریت پیشگیرانه مشکل با مدیریت رویداد […]
[…] مدیریت پیشگیرانه مشکل با مدیریت رویداد […]