چگونگی مدیریت مشکل پیشگیرانه با فرایند مدیریت رویداد!؟

منتشر شده توسط مدانت در آگوست 29, 2020

دسته بندی

تگ ها

مدیریت مشکل پیشگیرانه با مدیریت رویداد

مدانت

[ مجری تخصصی پیاده‌سازی چارچوب ITIL و تحول دیجیتال ]

پاسخ به رویدادها

در هر مرحله از فرآیند مدیریت رویداد و بسته به نوع اهمیت آن رویداد، تعدادی از گزینه‌های پاسخگویی در دسترس هستند. برخی از گزینه‌های موجود عبارتند از:

ثبت وقایع: صرف نظر از نوع رویداد، یک عمل خوب باید برای ثبت رویداد و اقدامات انجام شده باشد. این رویداد می‌تواند به عنوان یک ضبط رویداد وارد شود یا می‌تواند به عنوان ورودی در سیستم سیستم دستگاه باقی بماند.

هشدار و مداخله‌ی انسانی: برای رویدادهایی که به مداخله‌ی انسان نیاز دارد، باید این رویداد رو به افزایش باشد. هدف از هشدار، اطلاع‌رسانی به منبع صحیح (شخص) برای رسیدگی به این رویداد است.

ثبت حادثه: با شناسایی یک استثناء، می‌توان حادثه یا یک مشکل و حتی یک تغییر را ایجاد کرد.

بستن رویداد

یک رویداد در نهایت یا بطور خودکار بسته می‌شود یا پس از تعیین آن به‌عنوان حادثه، مشکل یا تغییر در پروسه‌ی اجرایی عملیات کارکنان فناوری قرار خواهد گرفت و در نهایت بسته خواهد شد.

اساساً بجز نوع رویداد اطلاع INFO، رویدادهایی از جنس هشدار و استثنا به‌شدت در مدیریت پیشگیرانه می‌توانند کارساز باشند. مهم این است که آن اتفاق ناگوار رخ ندهد!

مطلب مرتبط: مدیریت زیرساخت فناوری اطلاعات (ITIM)

تبدیل رویداد استثنا و هشدار به اطلاع

بسیاری از نرم‌افزارهای مانیتورینگ حرفه‌ای دارای گردشکارهای داخلی هستند این یعنی با اتوماسیون هوشمند تعبیه شده در آن می‌تواند بسیاری از اقدامات پیشگیرانه را نه صرفاً بطور انسانی بلکه از طریق خودکار سازی انجام داد و از تخصیص نیروهای NOC‌ بیشتر برای مدیریت شبکه جلوگیری کنید. برای درک این مسئله به این سناریو دقت کنید.

فرض کنید آستانه‌ی تحمل پر شدن ظرفیت هارد فایل سرور را روی ۹۰٪ گذاشته‌اید با رسیدن به این آستانه ابزار مایتورینگ در حال ایجاد یک اعلان هشدار است اما بجای آنکه شما را وارد به انجام کاری بکند، در چنین شرایطی با افزودن یک گردشکار از قبل و یک اقدام سیستمی می‌توان در صورت رسیدن به این آستانه، نرم‌افزار مانیتورینگ یک Job را روی سرور VM فایل سرور اجرا و ظرفیت هارد آنرا به دوبرابر ظرفیت جاری افزایش دهد. بنابراین صرفاً موفقیت‌آمیز بودن این اجرای خودکار را به سمع و نظر شما می‌رساند که به نوعی تبدیل یک اعلان هشدار به اعلان اطلاع است!

در سناریوی بعد فرض کنید سازمان دارای دو لینک ارتباطی برای یک سرور خاص است بدیهی است تمام ارتباطات کاربران با این سرور در وهله‌ی نخست روی یکی از این لینک‌ها سوار است، در هنگام قطعی این لینک، یک رویداد(اعلان استثنا) ثبت می‌شود مبنی بر Down شدن سرور! که نیاز هست! در حالی که بجای آنکه شما را وارد به انجام کاری بکند، در چنین شرایطی با افزودن یک گردشکار از قبل و یک اقدام سیستمی می‌توان در صورت رسیدن به این شرایط، نرم‌افزار مانیتورینگ پس از انتظاری چند دقیقه، یک سرور موازی FOS – Fail Over Service را روی بالا بیاورد و پایداری سرویس را در بالاترین حد نگاه دارد. شبیه این تفکر در Spanning Tree در کانفیگ روترهای سیسکو را قبلا دیده و شنیده‌اید. در این حالت صرفاً موفقیت‌آمیز بودن این اجرای خودکار را به سمع و نظر شما می‌رساند که به نوعی تبدیل یک اعلان استثنا به اعلان اطلاع است!

مطلب مرتبط: یک حادثه چقدر هزینه روی دست سازمان شما می‌گذارد!؟

مدیریت رویداد تفکر هوشمندانه‌ای را می‌طلبد تا با خودکارسازی بسیاری از فعالیت‌های انسانی و دستی علاوه بر پیشگیری از وقوع اتفاقات ناخوشایند، پایداری و در دسترس‌پذیری سرویس‌ها را در بالاترین کیفیت ممکن نگه داریم.

این نکته را مجدد فراموش نکنید هر کاری که دوبار انجام می‌شود نیازمند یک فرایند سیستماتیک دارد! و باید به نقطه‌ای برسید که خبر بد را به خبر خوب تبدیل کنید!

هادی احمدی

187

مدانت

شرکت‌ مدانت از برندهای محبوب فناوری‌ اطلاعات و ارتباطات در حوزه‌ی آموزش، پیاده‌سازی و عرضه ابزار ITIL، تجارت آنلاین، تحول دیجیتال و ارایه‌‌کننده‌ی محصولات مدیریتی تحت‌وب در ایران است. این مقاله‌ی آموزشی منحصراً مربوط به مدانت بوده و برای نخستین بار توسط این شرکت برای شما تولید و منتشر شده.