Jak ATOM ONE usnadní práci IT Operations

Blog

 
 Daniel Hejda

Omezení provozu přichází vždy v ten nejhorší čas. Murphyho zákony fungují v oboru IT na 100 %. Nápor požadavků uživatelů můžeme čekat vždy, když máme před dovolenou, nebo před dokončením důležitého - a často i strategického - úkolu. To všechno jsou, dle mého názoru, věci, které se dějí nejen v malých a středních firmách. Proto bych se s vámi chtěl podělit o mou zkušenost, jak těmto věcem předcházet z pohledu IT Operations, kde jsem několik dlouhých let působil.

Během mé letité praxe jsem se potkal s mnohými problémy, které svět IT může přinášet a zejména v době, kdy cloudové systémy byly v ČR využívány maximálně pro provoz e-mailu nebo internetových stránek společnosti. IT se vždy potýkalo s nedostatkem vyškoleného personálu, který by byl schopen dohlížet nad často rozsáhlými infrastrukturami. S příchodem cloudů se toto posunulo ještě mnohem dál a hybridní světy, hyper-convergované infrastruktury nejsou již ničím výjimečným.

IT lidé obecně ztrácí přehled nad tím, co je dnes ve firemním prostředí používáno. Proto se často dostávají do stavu, že nejrychlejším monitoringem je pro ně uživatel, který se ozve, když mu něco nefunguje. Jenže některé systémy jsou natolik kritické, že je potřeba jim věnovat péči. Tato péče není jen jednorázovou aktivitou, kdy se někdo rozhodne, že server aktualizuje. Systém se totiž stále vyvíjí a vznikají v něm často neznámé chyby, které je potřeba řešit. Položme si tedy několik otázek, které si klade nejeden IT manažer, který se musí zodpovídat z nedostupností nebo ze snížené úrovně poskytování služeb (snížení SLA, či OLA). Mohlo by nám v tomto pomoci nějaké IT vybavení, či cloud? Mohli bychom si usnadnit život a dívat se na naše prostředí shora? Mohli bychom nějak řešit problémy, ještě než vzniknout, tedy v době jejich zárodku? Oblast IT Operations je důležitá i v případě, že je nutné plánovat kapacity datových center a je nutné řešit rozpočty a nákupy nového vybavení. Mé odpovědi na otázky, které jsem položil, se vám pokusím vysvětlit v následujících řádcích.

Hlavní oblastí, na kterou bychom se měli zaměřit, je řešení problémů místo incidentů a ideálně jim dokázat přecházet. K tomuto slouží proaktivní reporty, profylaktické kontroly, či testy na kontrolu zdraví (Health Checky). Při profylaktické činnosti bychom se měli zaměřit na kontroly logů, dostatečnost výpočetních prostředků, nastavení systému, nastavené a přiřazené uživatele, nastavená oprávnění, certifikáty, které se blíží své expiraci, konfigurace systémů, identifikace zranitelností, atd… Ano, je toho opravdu hodně. Když tyto informace zkontrolujeme, pak bychom měli vytvořit záznam a zapsat čas profylaktické kontroly do servisního deníku. Na základě zjištění bychom měli vyhodnotit, co se systémem dělat, zda je v pořádku a zda mu nehrozí selhání nebo nedostupnost. Firmy, které si prošly běžnou oblastí provádění profylaktických kontrol, se přesunuly ještě do oblasti sledování změn. Jejich cílem bylo, aby se ujistily, že se systémem nemanipuloval někdo neoprávněný, zda nevznikla nějaká slabá místa v systému, jako například zapomenuté otevřené porty na firewallu, povolená sdílení pro všechny atd. A teprve pak můžeme pokračovat v kontrole dalšího systému. Toto zabere spousty hodin času, který je, jak už bylo zmíněno, velice drahocenný a omezený.

Protože si všechny tyto potřeby uvědomujeme, podařilo se nám je ve službě ATOM ONE zohlednit. Proto jsme postavili část systému tak, aby pomohla právě IT Operations. Služba nabízí pohled shora nebo z tzv. kokpitu, kdy řešíme všechny části prostředí jako celky a v zásadě jako samostatné disciplíny světa IT Operations. Není totiž potřeba řešit jeden problém 10x, protože se vyskytuje na 10 zařízeních, ale můžeme jej řešit globálně. Díky ATOM ONE identifikujeme probléma k němu doplníme například informaci o problémových místech. Velkou výhodou služby je její nenáročnost. V zásadě vám stačí nainstalovat agenta a systém se o všechno postará sám a vy budete mít klid od vyrušování během řešení důležitých úkolů.

img

img

Tím hlavním, co služba ATOM ONE nabízí, je centrální pohled na stav prostředí, kde můžeme shora vidět, ve které oblasti se vyskytují problémy. Dohled tak můžeme udržovat nad certifikáty, stavem operačních systémů, aktualizacemi, změnami v systémech stavem služeb nebo můžeme sledovat stav přístupnosti internetových stránek z veřejné sítě internetu. Je toho však mnohem víc, co nám ATOM ONE nabízí ke sledování z pohledu IT Operation.

img

Každá zobrazená oblast dává možnosti vnořování se do informací, a to z tzv. přehledového dashboardu, kde vidíme opravdu jen základní věci, přes zobrazení částí týkajících se konkrétních oblastí, až po detailní logy a informace přenesené z koncového zařízení. Díky nastavení retenční periody (tzv. recyklace) lze informace získávat od 31 do 730 dní a bude záležet na požadavcích, které má každá společnost jiné.

img

ATOM ONE sleduje i výkonnost systémů v čase a nabízí možnost podívat se na kapacity disků, procesorovou zátěž, operační paměť, zatížení sítě nebo také počty událostí vzniklých za určitý čas a tyto informace položit do širšího kontextu. Tímto kontextem může být průhled nad počtem spuštěných aplikací proti zatížení infrastruktury, či prolnutí takových informací s informacemi o přenesených datech na úrovni sítě. To dává manažerům možnost se lépe rozhodovat v tom, jak dimenzovat infrastruktury a jak identifikovat tzv. bottleneck.

img

Zobrazení zatížení systémů může mít správce k dispozici trvale a grafy pak umístit na operační dashboardy, které bude sledovat IT Operations v kancelářích. Pro manažery pak lépe poslouží přehledové workbooky, které si manažer může vzít na jednání o rozpočtu, anebo si data extrahovat v době, kdy je potřebuje. Výhodou tak je fakt, že reporty v ATOM ONE nikdy nezastarají a vždy zobrazují aktuální stav, což je velkou výhodou oproti pravidelné, i když prováděné (max. 1x za měsíc), profylaktické kontrole.

img

Další, co stojí jistě za zmínku, je získání visibility v prostředí, a to zejména tam, kde existuje například více poboček. Díky ATOM ONE a komponentě Service Map je totiž možné se podívat na infrastrukturu jako celek a sledovat vzájemné interakce služeb, které jsou na zařízeních provozovány, a to bez ohledu na to, zda je podkladový operační systém od společnosti Microsoft, nebo se jedná o nějakou distribuci na bázi Linuxu. Limitou tak není ani umístění daného systému, tedy můžeme mít klidně více datových center, cloud a ještě nějaký housing nebo hosting v datovém centru. ATOM ONE toto všechno zapojí do jedné mapy a pak ukáže, zda mohou zařízení mezi sebou interagovat. A nejen zda mohou, ale hlavně jak vzájemně interagují a zda nevznikají mezi jednotlivými zařízeními problémy, prodlevy, či snížení výkonnosti.

img

Sdílej v médiích

Kontakt

Nenašli jste, co hledáte? Pošlete nám zprávu a zůstaneme s vámi ve spojení.

* Vyžadované pole

Osobní data použijeme pouze pro vypracování odpovědi na dotaz. Pravidla zpracování osobních údajů

map us
map eu
{ } { } { } { }