مدیریت رویداد در ITIL

مدیریت رویداد در ITIL

رویداد و مدیریت رویداد چیست!؟ ابزارهای مدیریت رویداد و مزایای مدیریت رویداد کدامند؟

تمامی اتفاقات پیرامون ما اعم از اتفاقات شاد و غمگین همگی حاوی پیام های مهمی برای ما هستند که زندگی و تصمیمات روزمره ما را شکل می دهند، خبرهای خوب، هشدارها، خبرهای بد و در نهایت تصمیمات شما در واکنش به این اتفاقات و کسب تجربه برای تکرار اتفاقات خوب و پرهیز از وقوع تجربیات و اتفاقات بد بی شک همگی نشانگر ماهیت و تعریفی است که می توان از آن بنام “رویداد یا اتفاق” یاد کرد.

این اتفاقات خوب و بد در دنیای فناوری اطلاعات بخصوص در مدیریت خدمات IT نیز هر لحظه ای در حال وقوع است.

یک رویداد در واقع هر تغییری است که در بخش مهمی از زیرساخت فناوری اطلاعات و ارتباطات شما رخ می دهد. این می تواند به طور مثال یک سیستم، یک سرویس IT و یا یک قلم پیکربندی باشد. مثلا از کار افتادن یک سرور، تغییر وضعیت یک سرویس از ON به Down، پر شدن ظرفیت هارد دیسک یک سرور، عملیات ناموفق بک آپ گیری خودکار، تغییر پیکربندی یک CI، عدم ذخیره سازی لاگ سرور،  و… این تغییرات لزوماً بد نیستند. اما اهمیت دارند درجه و درصد اهمیت آنها را نیز مدیریت رویداد، تشخیص و اولویت بندی می کند. گاهی اوقات یک رویداد فقط به شما می گوید که چیزی دیگر در حال وقوع است. گاهی، شما را گوش به زنگ یک خطر می کند و گاهی شما را به انجام کاری وا می دارد. در هر صورت اتفاقی، در حال رخ دادن است و تصمیمی در این خصوص باید گرفته شود.

به عنوان مثال، فرض کنید برنامه زمانبندی پشتیبان گیری از یک سرویس را بطور خودکار و روزانه ایجاد کرده اید، رویدادهای زیر محتمل است:

  • تغییر برنامه زمانبندی پشتیبان گیری از روزانه به ماهانه
  • پر شدن ظرفیت فضای ذخیره سازی و عدم امکان ذخیره سازی بک آپ
  • ناموفق بودن امکان بک آپ گیری

در این حال نسخه های پشتیبان خودکار تولید نمی شود اگرچه این موضوع هیچ تاثیر در حال حاضر روی کاربران و یا سرویس های سازمان ندارد اما موضوعی مهم است که باید به آن رسیدگی کرد.

به مراحل تشخیص، اولویت بندی، تشدید و رسیدگی کامل به این نوع اتفاقات در سیستم مدیریت خدمات IT، مدیریت رویداد می گویند.

مدیریت رویداد در ITIL

تعریفی که از مدیریت رویداد در ITIL v3 هست اینست که مدیریت رویداد:”فرایندی برای نظارت بر همه رویدادهای رخ داده شده از طریق زیرساخت IT” است. و این  زیرساخت بستری را برای بررسی عملکرد عادی و تشخیص و تشدید وضعیت شرایط استثنائی فراهم می کند. “این فرایند در مرحله عملیات سرویس و در چرخه حیات ITIL v3 قرار دارد و مسئولیت نشانه گذاری موضوعات و تغییراتی که در زیرساخت های IT رخ داده شده را دارد، نظیر موضوعات مورد انتظار و یا غیر منتظره است.

اما هم اکنون در ITIL ۴ ،”مدیریت رویداد” به “نظارت و مدیریت رویداد “، از بخش تمرینات مدیریت خدمات، تغییر نام داده شده است، و تعریف آن شامل: مشاهده خودکار خدمات و مؤلفه های خدمات، ثبت و گزارش تغییرات انتخاب شده ، تشخیص وضعیت شناخته شده به عنوان رویداد، اولویت بندی عملکرد زیرساخت ها، خدمات، فرایندهای تجاری و رویدادهای امنیت اطلاعات و ارایه پاسخ مناسب به رویدادهای ایجاد شده، از جمله پاسخ به شرایطی که می تواند منجر به بروز خطا یا حوادث احتمالی شود. همگی از مفاهیمی است که در مدیریت رویداد تغییر جای گرفته و این یکی از تمرینات مدیریت خدمات در ITIL ۴ است.

اما جدای تغییر عنوان این فرایند در ITIL ۳ و ITIL 4 واقعاً چه چیز خاصی در مورد مدیریت رویداد وجود دارد و اصلا آیا واقعاً به آن احتیاج داریم؟ در این مقاله به روشنی در خصوص ماهیت، کاربرد و لزو وجود چنین فرایندی، توضیح خواهم داد و پنج دلیل برای بهره مندی سازمان شما با استفاده از یک ابزار مدیریت رویداد، را بشرح زیر تشریح خواهم کرد.

سه نوع رویداد وجود دارد:

اطلاع رسانی – این نوع از رویدادها به شما اطلاع می دهند که چیزی تغییر کرده است اما لازم نیست کار خاصی انجام دهید فقط مطلع باشید کفایت می کند، مثلا، پشتیبان گیری خودکار با موفقیت انجام شده است! یا سرور X همکنون در دسترس است! و یا هسته وب سایت با موفقیت آپدیت شده است همه این ها ماهیت یک اعلان و اطلاع رسانی ذهنی است که البته برای شما خوب است تا بدانید که تغییر با موفقیت اتفاق افتاده است (یعنی الان، می دانید که نسخه پشتیبان گیری با موفقیت تهیه شده! این خبر خوبی است زیرا اگر نمی شد اتفاق نامیمونی خواهد بود) اما از آنجایی که به دلیل این عملیات موفقیت آمیز نمی توانید به فلان سرور جایزه بدهید! J بنابراین هیچ کار خاصی لازم نیست انجام دهید، مطلع شدن شما کافی است.

نوع رویداد اطلاع رسانی، شما را به مدیریت مشکل پیشگیرانه سوق خواهد داد!.

هشدار – این نوع از رویدادها کمی جدی تر است و در واقع ممکن است نیاز به نوعی اقدام داشته باشد. به عنوان مثال ، یک استفاده از پردازنده یک سرور ممکن است به آستانه ظرفیت خود برسد ، بنابراین یک رویداد هشدار دهنده ایجاد می شود تا به مهندسان اطلاع دهد که نیاز به نوعی مداخله دستی است. اگر اقدامی صورت نگیرد، ممکن است سرور در معرض خطر سقوط Down شدن قرار بگیرد که در نتیجه منجر به بروز یک حادثه و در حجم انبوه یک مشکل دامن گیر خواهد شد. در سناریوهایی مانند این ، رویدادهای هشدار دهنده می توانند به جلوگیری از بروز حوادث کمک کنند.

به عبارتی تا وضعیت یه نقطه جوش و قرمز نرسیده باید سریعا کاری کرد. تعیین آستانه ها، باعث می شود تا در خصوص حدود رویدادهای خطرناک جدی تر بیندیشید.

 این نوع از رویدادها نیز شما را به مدیریت مشکل پیشگیرانه سوق خواهد داد!.

استثناء – این نوع از رویدادها یک شرایط استثنائی و خاص است و به این معنی است که چیزی، درست پیش نمی رود! بی تردید می دانید که این، جدی ترین نوع رویداد است و برای تحقیق و حل و فصل نیاز به توجه فوری دارند. در همه موارد، تیمهای مدیریت حادثه یا مدیریت مشکل ( مدیریت مشکل بصورت منفعلانه یا واکنش گرا!) باید درگیر شود. (مدیریت مشکل پیشگیرانه و واکنش گرا را بخوانید)

به طور خلاصه، همه حوادث یا Incident، یک نوع رویداد Event، هستند زیرا نمایانگر تغییرات منفی در زیرساخت IT سازمان هستند، با این وجود همه رویدادها، حادثه تلقی نمی شوند زیرا برخی از تغییراتی که

رویدادها را ایجاد می کنند کاملاً طبیعی و مورد انتظار است. (نظیر اطلاع رسانی موفقیت آمیز بک آپ گیری!)

رویدادها نشان می دهند که زیرساخت های فناوری اطلاعات شما به چه خوبی رفتار می کند – و مدیریت رویداد به شما امکان می دهد حوادث را کاهش دهید ، خدمات دردسرساز را برجسته کنید و عملکرد کل دارایی IT خود را مشاهده کنید. هنگامی که می توانید تصویر کامل را ببینید ، مدیریت مشکل و بهبود خدمات مداوم (CSI) – که اکنون به عنوان “بهبود مداوم” در ITIL ۴ خوانده می شود – قابلیت ها بسیار بهبود یافته اند.

این نوع از رویدادها شما را به مدیریت مشکل واکنش گرا سوق خواهد داد!.

یک مثال برای وقوع هر سه نوع رویداد:

اگر استفاده از ظرفیت هارد یک سرور در حدود ۵۰% است، مطلع شدن شما با ارسال یک پیام اطلاع رسانی توسط ابزار مدیریت رویداد کفایت می کند و شما هم فعلا نیازی به انجام کاری ندارید این را رویداد اطلاع رسانی می نامند و اما اگر آستانه ای را برای همین مورد تعریف کرده اید با این شرط:”اگر ظرفیت هارد دیسک فلان سرور به ۹۵% رسید یک هشدار ارسال کن به…”  این یک رویداد هشدار است و باید سریعا دست به کار شوید تا کار از کار نگذشته! ور در آخر اگر به هردلیلی اقدامی صورت نگرفته و ظرفیت هارد سرور به ۱۰۰% رسید، سرویس موجود بر آن سرور از دسترس و یا انجام عملیات خارج شد در این صورت نوع رویداد استثناء است زیرا دیگر کار از کار گذشته و به حالت نرمال درآوردن این اتفاق صرفا منوط به انجام یک تصمیم و یا عملیات فنی توسط مهندسان شبکه هست.

برعکس حوادث، این رویدادها هستند که همه روزه و هر روز اتفاق می افتند، زیرا این جزو کلیدی  از ماهیت عملیات فناوری اطلاعات است. چه کاربر وارد سیستم شود، یا چه اینکه سیستمی از حالت غیرفعال به فعال تغییر وضعیت دهد و یا پشتیبان گیری در حال اجرا باشد، در هر صورت رویدادها، اتفاقاتی هستند که در پیرامون خدمات IT مرتبا در حال وقوع هستند و استفاده از یک ابزار مناسب برای مدیریت آن بسیار ضروری و پراهمیت است

۵ مزیت استفاده از ابزار مدیریت رویداد

اکنون که اهمیت رویدادها و مدیریت رویدادها در فناوری اطلاعات را درک کردیم، بیایید به فوایدی که یک ابزار مدیریت رویداد می تواند برای سازمان شما به ارمغان بیاورد، بپردازیم. اینکه استفاده از این نوع مدیریت چه سهمی در خلق ارزش دارد و بهره مندی از آن قرار است سازمان را از کجا به کجا برساند:

۱) بهبود زمان تشخیص حادثه و زمان پاسخ

در مدیریت مشکل پیشگیرانه گفتیم که درک وجود یا بروز حوادثی که سبب ایجاد مشکل می شوند پیش از آنکه توسط کاربران اعلام شود بسیار اهمیت دارد بنابراین هنگامی که از یک ابزار مدیریت رویداد استفاده می کنید، می توانید زمان تشخیص و زمان واکنش خود را بهبود ببخشید.

بسته به نوع حادثه، به ثبت درخواست و یا تماس تلفنی از طرف یک کاربر ناراضی، هشدار رویداد قبل از اینکه کسی متوجه شود که چیزی شکست خوردن است وارد عمل می شود. با ابزار مدیریت رویداد ، هشدار به تیمها و افراد لازم برای شروع تحقیقات و تفکیک فعالیت ها بخوبی می تواند از عهده فعالیت های مناسب پیش از وقوع اتفاق خاصی پیشگیری کرد.

بنابراین از آنجایی که تقریباً رویداد، بلافاصله تشخیص داده شده است، کارشناسان شبکه، یرساخت و پشتیبانی قادر به پاسخگویی سریع هستند و می توانند اطلاع رسانی های لازم را به ذینفعان مربوط ارسال کنند تا در صورت لزوم تمهیدات لازم برای جلوگیری و یا کاهش شدت این رویداد تغییر بکار گیرند.

اگر این یک رویداد استثنایی باشد، امتیاز اضافی بهبود زمان شناسایی و پاسخ شما به معنای کاهش خرابی سیستم است. و اگر این یک رویداد هشدار دهنده است، شما این فرصت را دارید که در نهایت از وقوع یک رویدادی خاص و استثنایی جلوگیری کنید.

جلوگیری از وقوع حوادث خود یک ارزش مثبت است که کارشناسان به کمک ابزارهای مناسب مدیریت رویداد می توانند از آن بهره گیرند.

۲) کاهش و صرفه جویی در وقت و هزینه با استفاده از قابلیت های اتوماسیون سازی

با یک ابزار مدیریت رویداد، می توانید برای کل چرخه حیات رویدادهای خود گردش کار ایجاد کنید. این بدان معنی است که هنگامی که یک رویداد ایجاد می شود ، ابزار، می تواند به طور صحیح افراد مرتبط را مطلع کند، رویداد را به قسمت و یا گروه متناظر، اختصاص دهد تا آنها پس از اتمام، رویداد را ببندد و بایگانی کنند. رویدادها همچنین می توانند به صورت خودکار به هشدارهای عملی یا حوادثی که روند ورود به سیستم را سرعت می بخشند نیز تبدیل شوند.

انجام این وظایف از طریق یک گردش کار خودکار به جای نیاز به عملیات دستی، نه تنها روند کار شما را تسریع می کند – بلکه از قوام و صحت عملکرد رسیدگی به رویدادها نیز اطمینان حاصل خواهید کرد. به گونه ای که دیگر سعی نمی شود به خاطر بیاورید که چه کسی با چه چیزی سر و کار دارد، با ابزار مدیریت رویداد که این مسیرها را برای شما خودکار می کند و همین امر سبب کاهش زمان رسیدگی و پیگیری رویدادها و در نهایت کاهش هزینه ها را بدنبال خواهد داشت و خود این سبب خلق ارزش برای سازمان می شود.

۳) تصمیم گیری و اقدامات بهتر از طریق توزیع خودکار گزارشات

بارها تاکید کرده ام که داده های بدون داده کاوی، مشتی اطلاعات انبارشده است که هیچ نفعی برای سازمان ندارد اگر و فقط اگر شما داده کاوی نکنید و گزارشات دقیقی از این داده ها تهیه نشود کلیه دیتاهای ورودی نمی تواند منجر به اخذ تصمیمات درست برای اقدامات آتی و بهبود مستمر شود. گزارشات را می توان برای برجسته کردن نقاط مشکل دار (تکرار هشدار یا استثناء) استفاده کرد و بنابراین سبب بهبود خدمات سازمان خواهد شد. یک ابزار مدیریت رویداد از قبل عملکرد گزارش گیری را هم ارائه می دهد و سازمان شما می تواند از آن استفاده کند. تا از طریق برخی مراحل ساده، گزارشاتی را که ایجاد کنید و همچنین اقدام به خودکار سازی، توزیع – گزارش های زمانبندی شده- سفارشی سازی، اجرا و ارسال گزارشات به افراد مربوطه بدون نیاز به مداخله دستی نمایید.

۴) دید بیشتر به کیفیت ارائه خدمات IT

یک ابزار مدیریت رویداد، به شما این امکان را می دهد تا وضعیت موجود در فناوری اطلاعات -به ویژه زیرساخت ها و برنامه های کاربردی – را بدقت بررسی، مشاهده نمایید تا ببیند چه چیزی سالم است و مشکلات در کجاها وجود دارد.

افزایش دید در ارایه خدمات، نه تنها امکان اصلاح پیشگیرانه را فراهم می کند بلکه سرمایه گذاری های طولانی مدت را نیز برای جلوگیری از بروز حوادث و کاهش زمان خرابی را به حداقل می رساند، علاوه بر آن باعث می شود تحلیل و ریشه یابی علت های ریشه ای آسان تر و سریع تر انجام شود.

۵) پس انداز هزینه عملیاتی

مهمترین پرسش در مدیریت رویداد و انتخاب ابزار آن که در ذهن مدیران انفورماتیک مطرح می شود این است که آیا مانند هر سرمایه گذاری دیگری ، سرمایه گذاری روی ابزار مدیریت رویداد در درازمدت پول سازمان را با سود بر می گرداند یا خیر؟ با توجه به مزایای فوق و امکانات زیر که یک ابزار برای مدیریت رویداد در اختیار شما می گذارد، پاسخ به این سرمایه گذاری “بله” است.

مهمترین امکانات ابزار مدیریت رویداد

  1. بهبود زمان تشخیص و پاسخ
  2. کاهش زمان خرابی
  3. خودکار فرآیندهای عملکرد سرویس
  4. اولویت بندی و تشدید نقاط مشکل زا برای بررسی دقیق تر
  5. انجام تعمیرات پیشگیرانه
  6. گزارشگیری

ابزارهای مدیریت رویداد:

لزوما نرم افزارهای مانیتورینگ به تنهایی مفهوم مدیریت رویداد را نمی رسانند و بلاخص نشانگر تنها ابزار آن هم نیستند بلکه یکی از آن دست ابزارها برای مدیریت رویداد هستند.

  1. نرم افزارهای کنترل ترافیک شبکه
  2. نرم افزارهای مدیریت پیکربندی
  3. نرم افزارهای مدیریت لاگ ها
  4. نرم افزارهای مدیریت سرویس ها
  5. نرم افزارهای مدیریت آلارم ها
  6. نرم افزارهای نظارتی
  7. تحلیلگرها و آنالیزرها
  8. نرم افزارهای پشتیبان گیری
  9. نرم افزارهای امنیتی
  10. دشبوردهای مدیریتی
  11. نرم افزارهای مانیتورینگ

و در کل هر ابزاری که در خصوص تولید ۳ نوع رویداد (اطلاع رسانی، هشدار، استثنا) با اتوماسیون داخلی و تخصیص خودکار به افراد/گروههای مرتبط در خصوص هر سرویس یا CI عمل می کند بعنوان ابزار مدیریت رویداد شناخته می شود که البته لزوم رسیدگی و تصمیم گیری در خصوص حل و فصل رویدادها توسط مهندسان انفورماتیک تکمیل کننده مفهوم فرایند مدیریت رویداد تغییر هستند و گاهی یک ابزار تماما امکان مدیریت رویداد را فراهم میکند و گاهی برای تکمیل فرایند مدیریت رویداد، با ابزار سرویس دسک و سایر فرایندهای ادغام و یکپارچه می شوند.

نتیجه گیری

  1. مدیریت رویداد جدای از مدیریت حادثه است.
  2. ابزارهای تشخیص، خودکارسازی فرایندهای توزیع رویدادها، اولویت بندی، تشدید و گزارشگیری معمولا در نرم افزارهای مانیتورینگ بطور کامل تعبیه شده اند.
  3. یک ابزار ITSM معمولا ابزار مدیریت رویداد را در خود بطور واحد دارد و یا بطور جداگانه عرضه می کند و یا با ابزارهای مانیتورینگ ادغام و یکپارچه می شود.
  4. مهمترین مزیت فنی مدیریت رویداد، اطلاع از اتفاقات، پیش از وقوع خرابی است!
  5. مدیریت رویداد به شدت هزینه های تعمیر، نگهداری و رسیدگی به حوادث بعدی و مشکلات را کاهش خواهد داد.

هادی احمدی

مدانت
مدانت
شرکت‌ مدانت از برندهای محبوب فناوری‌ اطلاعات و ارتباطات در حوزه‌ی آموزش، پیاده‌سازی و عرضه ابزار ITIL، تجارت آنلاین، تحول دیجیتال و ارایه‌‌کننده‌ی محصولات مدیریتی تحت‌وب در ایران است. این مقاله‌ی آموزشی منحصراً مربوط به مدانت بوده و برای نخستین بار توسط این شرکت برای شما تولید و منتشر شده.
0 0 رای ها
امتیازدهی به مقاله
اشتراک در
اطلاع از
guest

حل معادله *

4 نظرات
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
trackback

[…] مقاله مرتبط در خصوص مدیریت رویداد چیست را بخوانید. […]

trackback

[…] مقاله‌ی مرتبط درباره‌ی مدیریت رویداد را مفصل بخوانید. […]

trackback

[…] رویداد چیست و ابزارهای مدیریت رویداد کدامند؟ […]

trackback

[…] رویداد چیست و ابزارهای مدیریت رویداد کدامند؟ […]

error: نیازی به کپی نیست همه چیز در دیدرس شماست
4
0
افکار شما را دوست داریم، لطفا نظر دهید.x