Program za praćenje pinga u igrama. Nadzor mreže: kako osiguravamo da svi čvorovi velikih tvrtki rade

Po izgledu ove optike koja ide kroz šumu do kolektora možemo zaključiti da instalater nije malo pratio tehnologiju. Nosač na fotografiji također sugerira da se vjerojatno radi o pomorcu - pomorcu.

Ja sam iz mrežnog tima za fizičko zdravlje, drugim riječima, tehnička podrška, odgovorna za to da svjetla na ruterima trepću kako bi trebala. Pod našim okriljem imamo razne velike tvrtke s infrastrukturom u cijeloj zemlji. Mi ne ulazimo u njihov posao; naš je zadatak osigurati da mreža radi na fizičkoj razini i da promet teče kako treba.

Općenito značenje rada je stalno ispitivanje čvorova, uzimanje telemetrije, pokretanje testova (na primjer, provjera postavki za traženje ranjivosti), osiguranje operativnosti, praćenje aplikacija i prometa. Ponekad inventura i druge izopačenosti.

Ispričat ću vam kako je to organizirano i par priča s izleta.

Kako to obično biva

Naš tim sjedi u uredu u Moskvi i snima mrežnu telemetriju. Zapravo, to su stalni pingovi čvorova, kao i primanje podataka o nadzoru ako je hardver pametan. Najčešća situacija je da ping ne uspije nekoliko puta zaredom. U 80% slučajeva za npr. maloprodajnu mrežu to se pokaže kao nestanak struje, pa kada vidimo ovu sliku, radimo sljedeće:
  1. Najprije zovemo davatelja usluga u vezi nezgoda
  2. Zatim - u elektranu o gašenju
  3. Zatim pokušavamo uspostaviti kontakt s nekim na mjestu (ovo nije uvijek moguće, na primjer, u 2 sata ujutro)
  4. I na kraju, ako gore navedeno ne pomogne u roku od 5-10 minuta, izađemo sami ili pošaljemo "avatar" - ugovornog inženjera koji sjedi negdje u Iževsku ili Vladivostoku, ako postoji problem.
  5. S “avatarom” smo u stalnom kontaktu i “vodimo” ga kroz infrastrukturu - imamo senzore i servisne priručnike, on ima kliješta.
  6. Tada nam inženjer šalje izvješće s fotografijama o tome što je bilo.

Dijalozi ponekad idu ovako:
- Dakle, izgubljena je veza između zgrada broj 4 i 5. Provjerite ruter u petoj.
- Red, dalje. Nema veze.
- Dobro, prati kabel do četvrte zgrade, tamo je još jedan čvor.
-... Oppa!
- Što se dogodilo?
- Ovdje je 4. kuća srušena.
- Što??
- Uz izvješće prilažem fotografiju. Ne mogu obnoviti kuću u SLA.

Ali češće je još uvijek moguće pronaći prekid i vratiti kanal.

Otprilike 60% posjeta je gubljenje vremena, jer je ili prekinuta opskrba strujom (lopata, predradnik ili uljez), ili pružatelj usluga ne zna za kvar, ili je kratkotrajni problem otklonjen prije nego što dolazi instalater. Međutim, postoje situacije kada saznamo za problem prije korisnika i prije informatičkih službi korisnika te iskomuniciramo rješenje prije nego što oni uopće shvate da se nešto dogodilo. Najčešće se takve situacije događaju noću, kada je aktivnost u tvrtkama kupaca niska.

Kome to treba i zašto?

U pravilu, svaka velika tvrtka ima vlastiti IT odjel koji jasno razumije specifičnosti i zadatke. U srednjim i velikim poduzećima rad enikey i mrežnih inženjera često se povjerava vanjskim suradnicima. Jednostavno je isplativo i povoljno. Na primjer, jedan trgovac ima svoje vrlo cool IT stručnjake, ali oni su daleko od toga da zamijene usmjerivače i prate kabele.

Što radimo

  1. Radimo na zahtjeve - tikete i panik pozive.
  2. Radimo prevenciju.
  3. Pratimo preporuke dobavljača hardvera, primjerice, glede rokova održavanja.
  4. Povezujemo se s nadzorom kupca i prikupljamo podatke od njega kako bismo reagirali na incidente.
Priča s monitoringom je često da ga nema. Ili je podignuto prije 5 godina i nije baš relevantno. U najjednostavnijem slučaju, ako stvarno nema nadzora, kupcu nudimo jednostavan ruski Zabbix otvorenog koda besplatno - i to je dobro za njega, a nama je lakše.

Prva metoda - jednostavne provjere - jednostavno je stroj koji pinga sve mrežne čvorove i osigurava da odgovaraju ispravno. Ova implementacija ne zahtijeva nikakve promjene ili minimalne kozmetičke promjene na korisničkoj mreži. U pravilu, u vrlo jednostavnom slučaju, Zabbix instaliramo izravno u jedan od naših podatkovnih centara (srećom, imamo ih dva u uredu CROC-a na Voločajevskoj). U složenijem slučaju, na primjer, ako koristite vlastitu sigurnu mrežu - na jednom od strojeva u korisničkom podatkovnom centru:

Zabbix se može koristiti na složenije načine, na primjer, ima agente koji se instaliraju na *nix i win čvorove i prikazuju nadzor sustava, kao i način vanjske provjere (s podrškom za SNMP protokol). Međutim, ako tvrtka treba nešto slično, tada ili već ima vlastiti nadzor ili bira funkcionalno bogatije rješenje. Naravno, ovo više nije softver otvorenog koda i košta, ali čak i banalni točan inventar već smanjuje troškove za otprilike trećinu.

I mi to radimo, ali ovo je priča naših kolega. Ovdje su poslali par screenshotova Infosima:

Ja sam operater "avatara", pa ću vam dalje govoriti o svom radu.

Kako izgleda tipičan incident?

Pred nama su ekrani sa sljedećim općim statusom:

Na ovom objektu Zabbix prikuplja dosta informacija za nas: broj serije, serijski broj, CPU opterećenje, opis uređaja, dostupnost sučelja itd. svi potrebne informacije dostupan iz ovog sučelja.

Običan incident obično počinje činjenicom da kupcu otpadne jedan od kanala koji vodi do, na primjer, trgovine (kojih ima 200-300 u cijeloj zemlji). Maloprodaja je sada pamet, a ne kao prije sedam godina, tako da će blagajna nastaviti raditi - postoje dva kanala.

Uzimamo slušalice i zovemo barem tri puta: dobavljača, elektranu i ljude na licu mjesta (“Da, ovdje smo utovarivali armaturu, dirali smo nečiji kabel... A, vaš? Pa dobro je da pronašli smo ga”).

U pravilu bi bez nadzora prošli sati ili dani prije eskalacije - ne provjeravaju se uvijek isti rezervni kanali. Odmah znamo i odmah odlazimo. Ako postoje dodatne informacije osim pingova (na primjer, model neispravnog dijela hardvera), odmah opremamo terenskog inženjera potrebnim dijelovima. Dalje na mjestu.

Drugi najčešći redoviti poziv je kvar jednog od korisničkih terminala, na primjer, DECT telefona ili Wi-Fi usmjerivača koji je distribuirao mrežu do ureda. Ovdje saznajemo o problemu iz nadzora i gotovo odmah primamo poziv s detaljima. Ponekad poziv ne dodaje ništa novo (“Podižem slušalicu, ništa ne zvoni”), ponekad je vrlo koristan (“Ispao nam je sa stola”). Jasno je da u drugom slučaju ovo očito nije prijelom retka.

Oprema u Moskvi preuzima se iz naših vrućih rezervnih skladišta, imamo ih nekoliko vrsta:

Kupci obično imaju vlastite zalihe komponenti koje često kvare - uredske slušalice, napajanja, ventilatori i tako dalje. Ako trebate isporučiti nešto što nije lokalno dostupno, a ne u Moskvu, obično idemo sami (zbog instalacije). Na primjer, imao sam noćni izlet u Nižnji Tagil.

Ako kupac ima vlastiti nadzor, može nam učitati podatke. Ponekad implementiramo Zabbix u režimu prozivanja, samo da osiguramo transparentnost i kontrolu nad SLA (ovo je također besplatno za korisnika). Dodatne senzore ne ugrađujemo (to rade kolege koji osiguravaju kontinuitet proizvodni procesi), ali možemo se povezati s njima ako protokoli nisu egzotični.

Općenito, ne diramo infrastrukturu korisnika, jednostavno je održavamo onakvom kakva jest.

Iz iskustva mogu reći da je zadnjih deset kupaca prešlo na vanjsku podršku zbog činjenice da smo troškovno vrlo predvidljivi. Jasno planiranje proračuna, dobro upravljanje slučajevima, izvješća o svakoj prijavi, SLA, izvješća o opremi, prevencija. U idealnom slučaju, naravno, mi smo kao čistači za klijentovog CIO-a - dođemo i obavimo to, sve je čisto, ne ometamo.

Još jedna stvar koju vrijedi napomenuti je da u nekim velikim tvrtkama inventura postaje pravi problem, a ponekad smo dovedeni samo da bismo je izvršili. Osim toga, pohranjujemo konfiguracije i njima upravljamo, što je zgodno za razne selidbe i ponovna povezivanja. Ali opet unutra teški slučajevi Ovo također nisam ja - imamo poseban tim koji prevozi podatkovne centre.

I još nešto važno: naš odjel se ne bavi kritičnom infrastrukturom. Sve unutar podatkovnih centara i sve što se odnosi na bankarstvo, osiguranje, operatere i maloprodajne temeljne sustave čini X-tim. Ovo su momci.

Više prakse

Mnogi moderni uređaji mogu pružiti mnogo servisnih informacija. Na primjer, s mrežnim pisačima vrlo je lako pratiti razinu tonera u ulošku. Možete računati unaprijed na razdoblje zamjene, plus imati obavijest od 5-10% (ako ured iznenada počne bijesno tipkati izvan standardnog rasporeda) - i odmah poslati enikey prije nego što računovodstveni odjel počne paničariti.

Vrlo često se od nas uzimaju godišnje statistike koje radi isti sustav praćenja plus mi. U slučaju Zabbixa, to je jednostavno planiranje troškova i razumijevanje što je kamo otišlo, au slučaju Infosima, to je također materijal za izračun skaliranja za godinu, admin opterećenja i svakakvih drugih stvari. Statistika uključuje i potrošnju energije - u posljednjih godinu dana gotovo svi su je počeli tražiti, očito kako bi se interni troškovi raspodijelili između odjela.

Ponekad postoje prava herojska spašavanja. Takve situacije su vrlo rijetke, ali koliko se sjećam ove godine, oko 3 sata ujutro vidjeli smo porast temperature na 55 stupnjeva na Cisco switchu. U udaljenoj serverskoj sobi nalazili su se "glupi" klima uređaji bez nadzora i nisu uspjeli. Odmah smo pozvali rashladnog inženjera (ne našeg) i pozvali dežurnog administratora korisnika. Ugasio je neke od nekritičnih usluga i čuvao poslužiteljsku sobu od termičkog pada sve dok tip s mobilni klima uređaj, a zatim popravak redovnih.

Za Polycom i drugu skupu opremu za video konferencije, razina napunjenosti baterije se vrlo dobro prati prije konferencija, što je također važno.

Svatko treba praćenje i dijagnostiku. U pravilu, to je dugo i teško implementirati bez iskustva: sustavi su ili krajnje jednostavni i unaprijed konfigurirani, ili veličine nosača zrakoplova i s hrpom standardnih izvješća. Izoštravanje datoteke za tvrtku, osmišljavanje implementacije njihovih internih zadataka IT odjela i ispisivanje informacija koje su im najpotrebnije, plus održavanje cijele povijesti ažurnom je problem ako nema iskustva u implementaciji. Kada radimo sa sustavima nadzora, biramo sredinu između besplatnih i vrhunskih rješenja - u pravilu ne najpopularnijih i "debelih" dobavljača, ali jasno rješavaju problem.

Jednom je postojao prilično netipičan tretman. Kupac je trebao predati ruter nekom od svojih zasebnih odjela, i to točno prema inventaru. Usmjerivač je imao modul s navedenim serijskim brojem. Kad smo počeli pripremati ruter za put, pokazalo se da nedostaje ovaj modul. I nitko ga ne može pronaći. Problem malo otežava činjenica da je inženjer koji je prošle godine radio u ovoj grani već u mirovini i otišao je posjetiti unuke u drugi grad. Kontaktirali su nas i zamolili da pogledamo. Srećom, hardver je dao izvještaje o serijskim brojevima, a Infosim je napravio inventuru, pa smo u par minuta pronašli ovaj modul u infrastrukturi i opisali topologiju. Bjegunac je ušao u trag kabelom - nalazio se u drugoj serverskoj sobi u ormaru. Povijest pokreta pokazala je da je tamo stigao nakon što je sličan modul propao.


Snimak igranog filma o Hottabychu, koji precizno opisuje odnos stanovništva prema kamerama

Puno incidenata s kamerom. Jednog dana otkazale su 3 kamere odjednom. Prekid kabela u jednom od odjeljaka. Instalater je upuhao novu u valovitost, dvije od tri kamere su se digle nakon niza šamanizama. Ali treći nije. Štoviše, nije jasno gdje je ona uopće. Dižem video stream - zadnji kadrovi neposredno prije pada - 4 sata ujutro, prilaze trojica sa šalovima na licu, nešto svijetli ispod, kamera se snažno trese, pada.

Nakon što postavimo kameru koja bi trebala fokusirati "zečeve" koji se penju preko ograde. Dok smo se vozili, razmišljali smo kako ćemo označiti točku na kojoj bi se uljez trebao pojaviti. Nije bilo od koristi - u 15 minuta koliko smo bili tamo, 30-ak ljudi je ušlo u objekt samo na mjestu gdje smo mi trebali. Stol za izravno ugađanje.

Kao što sam već naveo primjer gore, priča o srušenoj zgradi nije šala. Nakon što je veza s opremom nestala. Na licu mjesta nema paviljona u kojem se držao bakar. Paviljon je srušen, kabel je nestao. Vidjeli smo da je ruter crkao. Stigao je instalater i počeo tražiti - a razmak između čvorova bio je par kilometara. Ima Vipnet tester u kompletu, standardni - zvonilo s jednog konektora, zvonilo s drugog - išao sam tražiti. Obično je problem odmah vidljiv.


Cable tracking: ovo je valovita optika, nastavak priče sa samog vrha posta o morskom čvoru. Ovdje je na kraju, osim apsolutno nevjerojatne instalacije, otkriven problem da se kabel odmaknuo od pričvršćivača. Ovdje se penju svi i svatko i tresu metalne konstrukcije. Oko pet tisuća predstavnika proletarijata razbilo je optiku.

Na jednom su mjestu svi čvorovi bili isključeni otprilike jednom tjedno. I to u isto vrijeme. Dugo smo tražili uzorak. Instalater je pronašao sljedeće:

  • Problem se javlja uvijek tijekom smjene iste osobe.
  • Od ostalih se razlikuje po tome što nosi vrlo težak kaput.
  • Iza vješalice za odjeću nalazi se stroj.
  • Netko je davno, još u prapovijesti, odnio poklopac stroja.
  • Kad ovaj drug stigne na radilište, on objesi svoju odjeću, a ona ugasi strojeve.
  • Odmah ih ponovno uključuje.

Na jednom mjestu je tijekom noći u isto vrijeme isključena oprema. Ispostavilo se da su nam se domaći majstori priključili na struju, izvukli produžni kabel i uključili kuhalo za vodu i električni štednjak. Kada ovi uređaji rade istovremeno, cijeli paviljon je nokautiran.

U jednoj od trgovina u našoj ogromnoj domovini cijela mreža je stalno padala kada je smjena zatvorena. Instalater je vidio da je sva struja usmjerena na vod rasvjete. Čim se u trgovini ugasi gornja rasvjeta (koja troši puno energije), sva mrežna oprema se gasi.

Bio je slučaj da je domar lopatom pokidao kabel.

Često vidimo samo bakar kako leži s otkinutim valovima. Jednom su lokalni majstori jednostavno bacili dvožilni kabel između dvije radionice bez ikakve zaštite.

Daleko od civilizacije, zaposlenici se često žale da su ozračeni “našom” opremom. Centrale na nekim udaljenim mjestima mogu biti u istoj prostoriji kao i osoba na dužnosti. Sukladno tome, par puta smo naišli na štetne bake koje su ih, milom i zlom, isključile na početku smjene.

U drugom dalekom gradu na optiku je obješen mop. Otrgnuli su valovitost sa zida i počeli je koristiti kao pričvršćivač za opremu.


U ovom slučaju jasno postoje problemi s prehranom.

Što može "veliko" praćenje?

Također ću ukratko govoriti o mogućnostima ozbiljnijih sustava, na primjeru Infosim instalacija. Tu su 4 rješenja spojena u jednu platformu:
  • Upravljanje kvarovima – praćenje kvarova i korelacija događaja.
  • Upravljanje učinkom.
  • Popis i automatsko otkrivanje topologije.
  • Konfiguracijski menadžment.
Ono što je važno je da Infosim podržava hrpu opreme odmah po korištenju, odnosno lako parsira sve njihove interne centrale i dobiva pristup svim njihovim tehničkim podacima. Evo popisa dobavljača: Cisco Systems, Huawei, HP, AVAYA, Redback Networks, F5 Networks, Extreme Networks, Juniper, Alcatel-Lucent, Fujitsu Technology Solutions, ZyXEL, 3Com, Ericsson, ZTE, ADVA Optical Networking, Nortel Networks, Nokia Siemens Networks, Allied Telesis, RADCOM, Allot Communications, Enterasys Networks, Telco Systems, itd.

Odvojeno o inventaru. Modul ne samo da prikazuje popis, već i samu gradi topologiju (barem u 95% slučajeva pokušava i dobije je kako treba). Također vam omogućuje da pri ruci imate ažurnu bazu podataka o korištenoj i neiskorištenoj informatičkoj opremi (mrežnoj, poslužiteljskoj opremi i sl.), te pravovremenu zamjenu zastarjele opreme (EOS/EOL). Općenito, to je prikladno za velike tvrtke, ali u malim tvrtkama veći dio toga radi se ručno.

Primjeri izvješća:

  • Izvješća raščlanjena prema vrstama OS-a, firmware-u, modelima i proizvođačima opreme;
  • Izvještaj o broju slobodnih portova na svakom preklopniku u mreži/po odabranom proizvođaču/po modelu/po podmreži itd.;
  • Izvješće o novododanim uređajima za određeno razdoblje;
  • Obavijest o niskoj razini tonera u pisačima;
  • Procjena prikladnosti komunikacijskog kanala za promet osjetljiv na kašnjenja i gubitke, aktivne i pasivne metode;
  • Praćenje kvalitete i dostupnosti komunikacijskih kanala (SLA) – generiranje izvješća o kvaliteti komunikacijskih kanala prema teleoperatorima;
  • Praćenje kvarova i funkcija korelacije događaja implementirana je pomoću mehanizma analize uzroka (bez potrebe da administrator piše pravila) i mehanizma Alarm State Machine. Root-Cause Analysis je analiza temeljnog uzroka nezgode, koja se temelji na sljedećim postupcima: 1. automatsko otkrivanje i lokalizacija mjesta kvara; 2. smanjenje broja izvanrednih događaja na jedan ključni; 3. utvrđivanje posljedica neuspjeha – tko i što je pogođen neuspjehom.
Također možete instalirati ove stvari na mreži, koje su odmah integrirane u nadzor:


Stablenet – Embedded Agent (SNEA) je računalo malo veće od kutije cigareta.

Instalacija se provodi na bankomatima ili namjenskim mrežnim segmentima gdje su potrebne provjere pristupačnosti. Uz njihovu pomoć provodi se ispitivanje opterećenja.

Praćenje oblaka

Drugi model instalacije je SaaS u oblaku. Učinili smo to za jednog globalnog kupca (tvrtku s kontinuiranim proizvodnim ciklusom s distribucijskom geografijom od Europe do Sibira).

Deseci objekata, uključujući tvornice i skladišta Gotovi proizvodi. Ako su njihovi kanali pali, a podrška im je bila pružena iz stranih ureda, tada su počela kašnjenja isporuka, što je postupno dovelo do daljnjih gubitaka. Sav posao obavljen je na zahtjev i puno je vremena potrošeno na istragu incidenta.

Postavili smo nadzor posebno za njih, a zatim ga dodali u brojna područja na temelju specifičnosti njihovog usmjeravanja i hardvera. Sve je to napravljeno u CROC oblaku. Projekt je vrlo brzo završen i isporučen.

Rezultat je:

  • Zbog djelomičnog prijenosa kontrole nad mrežnom infrastrukturom, bilo je moguće optimizirati barem 50%. Nedostupnost opreme, opterećenje kanala, prekoračenje parametara preporučenih od strane proizvođača: sve se to bilježi unutar 5-10 minuta, dijagnosticira i popravlja unutar sat vremena.
  • Prilikom primanja usluge iz oblaka, kupac prenosi kapitalne troškove za implementaciju svog sustava za nadzor mreže u operativne troškove za pretplatu za našu uslugu, koju može otkazati u bilo kojem trenutku.

Prednost oblaka je što u svojoj odluci stojimo takoreći iznad njihove mreže i možemo objektivnije gledati na sve što se događa. U to vrijeme, da smo unutar mreže, vidjeli bismo sliku samo do čvora kvara i više ne bismo znali što se događa iza njega.

Par slika za kraj

Ovo je "jutarnja slagalica":

I našli smo ovo blago:

Ovo je bilo u škrinji:

I za kraj o najzabavnijem izletu. Jednom sam otišao na maloprodajnu stranicu.

Tamo se dogodilo sljedeće: prvo je počelo kapati s krova na spušteni strop. Tada se u spuštenom stropu stvorilo jezero koje je ispralo i probilo jednu od pločica. Kao rezultat toga, sve se to ulilo u elektriku. Onda ne znam točno što se dogodilo, ali negdje u susjednoj sobi došlo je do kratkog spoja i izbila je vatra. Prvo su se aktivirali aparati za gašenje požara prahom, a onda su stigli vatrogasci koji su sve napunili pjenom. Stigao sam za njima na rastavljanje. Moram reći da je Cisco 2960 radio nakon svega ovoga - uspio sam preuzeti konfiguraciju i poslati uređaj na popravak.

Još jednom, kada je aktiviran sustav praha, Cisco 3745 u jednoj posudi bio je gotovo potpuno ispunjen prahom. Sva su sučelja bila puna - 2 x 48 porta. Moralo se uključiti na licu mjesta. Zapamćeno prošli incident, odlučili smo pokušati ukloniti konfiguracije "na vruće", istresli smo ih, očistili ih najbolje što smo mogli. Uključili smo ga - uređaj je prvo rekao "pfft" i kihnuo veliki mlaz praha prema nama. A onda je zaprktao i ustao.

Echo zahtjev

Zahtjev za eho (ping) je dijagnostički alat koji se koristi za otkrivanje je li određeni host na IP mreži dostupan. Zahtjev za eho izvodi se pomoću ICMP (Internet Control Message Protocol) protokola. Ovaj se protokol koristi za slanje echo zahtjeva ravnopravnoj osobi koja se provjerava. Host mora biti konfiguriran za prihvaćanje ICMP paketa.

Ispitivanje
pingom

PRTG je alat za ping i nadzor mreže za Windows. Kompatibilan je sa svim glavnim Windows sustavima, uključujući Windows Server 2012 R2 i Windows 10.

PRTG je moćan alat za cijelu mrežu. Za poslužitelje, usmjerivače, preklopnike, vrijeme neprekidnog rada i veze s oblakom, PRTG prati sve metrike tako da možete ukloniti administrativne gnjavaže iz jednadžbe. Ping senzor, kao i SNMP, NetFlow i senzori za analizu paketa koriste se za prikupljanje detaljnih informacija o dostupnosti mreže i radnom opterećenju.

PRTG ima prilagodljivi ugrađeni alarmni sustav koji vas brzo obavještava o problemima. Senzor zahtjeva za jekom konfiguriran je kao primarni senzor za mrežne uređaje. Ako ovaj senzor otkaže, svi ostali senzori na uređaju prelaze u način mirovanja. To znači da ćete umjesto niza alarmantnih poruka dobiti samo jednu obavijest.

U svakom trenutku, na Vaš zahtjev, možete prikazati PRTG nadzornu ploču kratki osvrt. Odmah ćete vidjeti je li sve u redu. Kontrolna ploča je prilagodljiva vašim specifičnim potrebama. Kada ste daleko od svog radnog stola, primjerice kada radite u serverskoj sobi, PRTG-u se može pristupiti putem aplikacije za pametni telefon i nikada nećete propustiti nijedan događaj.

Početni nadzor se postavlja odmah tijekom instalacije. To je omogućeno njegovom značajkom automatskog otkrivanja: PRTG pinga vaše privatne IP adrese i automatski stvara senzore za dostupne uređaje. Kada prvi put otvorite PRTG, odmah možete provjeriti dostupnost vaše mreže.

PRTG ima transparentan model licenciranja. PRTG možete testirati besplatno. Ping senzor i funkcija alarma također su uključeni u besplatnu verziju i imaju neograničenu upotrebu. Ako vaša tvrtka ili mreža treba više mogućnosti, nadogradnja licence je jednostavna.

Snimke zaslona
Kratki uvod u PRTG: Ping nadzor

Vaši ping senzori na prvi pogled
- čak i na cesti

PRTG se instalira za nekoliko minuta i kompatibilan je s većinom mobilnih uređaja.

PRTG prati ove i mnoge druge proizvođače i aplikacije umjesto vas

Tri PRTG senzora za praćenje pingova

Senzor
echo zahtjeva


iz oblaka

Cloud Ping Sensor koristi PRTG oblak za mjerenje vremena izvršenja pingova prema vašoj mreži s raznih lokacija diljem svijeta. Ovaj senzor vam omogućuje da vidite dostupnost vaše mreže u Aziji, Europi i Americi. Posebno je ovaj pokazatelj vrlo važan za međunarodne tvrtke. .

Kada kupite PRTG, dobit ćete sveobuhvatnu, besplatnu podršku. Naš zadatak je riješiti vaše probleme što je brže moguće! Posebno za to, zajedno s drugim materijalima, pripremili smo edukativne videozapise i opsežan vodič. Nastojimo odgovoriti na sve zahtjeve za podršku u roku od 24 sata (radnim danima). U našoj bazi znanja pronaći ćete odgovore na mnoga pitanja. Na primjer, upit za pretraživanje "ping monitoring" daje 700 rezultata. Nekoliko primjera:

“Trebam ping senzor koji će prikupljati samo informacije o dostupnosti uređaja, bez promjene njegovog statusa. Je li moguće?"

"Mogu li stvoriti inverzni ping senzor?"


"S PRTG-om smo mnogo mirniji znajući da se naši sustavi neprestano nadziru."

Markus Puke, mrežni administrator, klinika Schuchtermann (Njemačka)

  • Puna verzija PRTG-a za 30 dana
  • Nakon 30 dana – besplatna verzija
  • Za proširenu verziju – komercijalna licenca

Softver za nadzor mreže - verzija 19.2.50.2842 (15. svibnja 2019.)

Usluge poslužitelja

Dostupna je i verzija za oblak (PRTG u oblaku)

Jezici

Engleski, njemački, ruski, španjolski, francuski, portugalski, nizozemski, japanski i pojednostavljeni kineski

Cijene

Besplatno do 100 senzora (cijene)

Sveobuhvatno praćenje

Mrežni uređaji, propusnost, poslužitelji, aplikacije, virtualna okruženja, udaljeni sustavi, Internet stvari i još mnogo toga.

Podržani dobavljači i aplikacije

Nadzor mreže i pinga s PRTG-om: tri praktična primjera

Na PRTG se oslanja 200.000 administratora diljem svijeta. Ovi administratori mogu raditi u raznim industrijama, ali imaju jednu zajedničku stvar - želju da osiguraju i poboljšaju dostupnost i performanse svojih mreža. Tri primjera upotrebe:

Zračna luka Zürich

Zračna luka Zürich je najveća zračna luka u Švicarskoj, stoga je posebno važno da svi njezini elektronički sustavi funkcioniraju besprijekorno. Kako bi to bilo moguće, IT odjel implementirao je softver PRTG Network Monitor tvrtke Paessler AG. S više od 4500 senzora, ovaj alat osigurava da se problemi odmah otkriju i odmah riješe IT stručnjaci. U prošlosti je IT odjel koristio razne programe za nadzor. Ali na kraju je uprava došla do zaključka da je ovo softver neprikladan za specijalizirani nadzor od strane operativnog i tehničkog osoblja. Primjer korištenja.

Sveučilište Bauhaus, Weimar

IT sustave Sveučilišta Bauhaus u Weimaru koristi 5000 studenata i 400 zaposlenika. U prošlosti se za nadzor sveučilišne mreže koristilo rješenje u sandboxu temeljeno na Nagiosu. Sustav je bio tehnički zastario i nije mogao zadovoljiti potrebe informatičke infrastrukture obrazovne ustanove. Nadogradnja infrastrukture bila bi izuzetno skupa. Umjesto toga, sveučilište se okrenulo novim rješenjima za nadzor mreže. IT rukovoditelji željeli su sveobuhvatan softverski proizvod koji je jednostavan za korištenje, jednostavan za instalaciju i koji ima izvrsnu isplativost. Zato su odabrali PRTG. Primjer korištenja.

Komunalne službe grada Frankenthala

Nešto više od 200 zaposlenika javnih komunalnih službi grada Frankenthala odgovorno je za isporuku električne energije, plina i vode stambenim korisnicima i tvrtkama. Organizacija sa svim svojim zgradama također ovisi o lokalno distribuiranoj infrastrukturi koja se sastoji od približno 80 poslužitelja i 200 povezanih uređaja. IT menadžeri u komunalnoj tvrtki Frankenthal tražili su pristupačan softver koji bi zadovoljio njihove specifične potrebe. Prvo je IT instalirao besplatnu probnu verziju PRTG-a. Trenutno se u komunalnom sustavu Frankenthala koristi oko 1500 senzora koji, između ostalog, nadziru i javne bazene. Primjer korištenja.

Praktičan savjet. Reci mi, Greg, imaš li kakve preporuke za praćenje pingova?

“Ping senzori vjerojatno su najvažniji elementi nadzora mreže. Moraju biti pravilno konfigurirani, posebno na temelju vaših veza. Ako, na primjer, nadzirete virtualni stroj, korisno je postaviti ping senzor na vezu s njegovim hostom. Ako host ne uspije, nećete primiti obavijest za svaki virtualni stroj spojen na njega. Osim toga, ping senzori mogu biti dobri pokazatelji funkcionira li mrežni put do glavnog računala ili interneta ispravno, osobito u scenarijima visoke dostupnosti ili failovera.”

Greg Campion, sistemski administrator u PAESSLER AG

EMCO Ping monitor. Besplatni asistent administratora

Ako vaša infrastruktura ima do 5 hostova za virtualizaciju, možete koristiti besplatnu verziju.

Ping Monitor: Alat za nadzor stanja mrežne veze (besplatno za 5 hostova)

Info:
Robusni alat za praćenje za automatsku provjeru povezanosti s mrežom hostova izvršavanjem naredbe ping.

Wiki:
Ping je uslužni program za provjeru veza na TCP/IP mrežama, kao i uobičajeni naziv za sam zahtjev.
Uslužni program šalje zahtjeve (ICMP Echo-Request) ICMP protokola navedenom mrežnom hostu i bilježi dolazne odgovore (ICMP Echo-Reply). Vrijeme između slanja zahtjeva i primanja odgovora (RTT, od engleskog Round Trip Time) omogućuje određivanje kružnih kašnjenja (RTT) duž rute i učestalost gubitka paketa, odnosno neizravno određivanje zagušenja podataka kanala i međuuređaja.
Ping program je jedan od glavnih dijagnostičkih alata u TCP/IP mrežama i uključen je u isporuku svih modernih mreža operativni sustavi.

https://ru.wikipedia.org/wiki/Ping

Program prati mrežne veze slanjem redovitih ICMP zahtjeva i obavještava vas o otkrivenom oporavku/kvaru kanala. EMCO Ping Monitor pruža statistiku veze uključujući vrijeme neprekidnog rada, prekide, kvarove pinga itd.


Robusni alat za praćenje pinga za automatsku provjeru veze s mrežnim hostovima. Redovitim pingom prati mrežne veze i obavještava vas o otkrivenim usponima/padovima. EMCO Ping Monitor također pruža podatke o statistici povezivanja, uključujući vrijeme rada, prekide, neuspjele pingove itd. Jednostavno možete proširiti funkcionalnost i konfigurirati EMCO Ping Monitor za izvršavanje prilagođenih naredbi ili pokretanje aplikacija kada se veza izgubi ili ponovno uspostavi.

Što je EMCO Ping Monitor?

EMCO Ping Monitor može raditi u 24/7 načinu rada za praćenje stanja veze jednog ili više hostova. Aplikacija analizira ping odgovore kako bi otkrila prekid veze i izvijestila o statistici veze. Može automatski detektirati prekid veze i prikazati oblačiće na Windows traci, reproducirati zvukove i slati obavijesti e-poštom. Također može generirati izvješća i poslati ih e-poštom ili spremiti kao PDF ili HTML datoteke.

Program omogućuje dobivanje informacija o statusima svih hostova, provjeru detaljne statistike odabranog hosta i usporedbu performansi različitih hostova. Program pohranjuje prikupljene ping podatke u bazu podataka, tako da možete provjeriti statistiku za odabrano vremensko razdoblje. Dostupne informacije uključuju minimalno/maksimalno/prosječno vrijeme pinga, odstupanje pinga, popis prekida veze itd. Te se informacije mogu prikazati kao mrežni podaci i dijagrami.

EMCO Ping Monitor: Kako radi?

EMCO Ping Monitor može se koristiti za praćenje pinga samo nekoliko hostova ili tisuća hostova. Sva se računala nadziru u stvarnom vremenu namjenskim radnim nitima, tako da možete dobiti statistiku u stvarnom vremenu i obavijesti o promjenama stanja veze za svako računalo. Program nema posebne zahtjeve za hardver - možete pratiti nekoliko tisuća hostova na tipičnom modernom računalu.

Program koristi pingove za otkrivanje prekida veze. Ako nekoliko pingova ne uspije odjednom - prijavljuje prekid rada i obavještava vas o problemu. Kada se veza ipak uspostavi i pingovi počnu prolaziti - program detektira kraj ispada i obavještava vas o tome. Možete prilagoditi prekid rada i vratiti uvjete otkrivanja, kao i obavijesti koje koristi program.

Usporedite značajke i odaberite izdanje

Program je dostupan u tri izdanja s različitim skupom značajki.
Usporedite izdanja

Besplatno izdanje omogućuje praćenje pinga do 5 hostova. Ne dopušta nikakvu specifičnu konfiguraciju za hostove. Pokreće se kao Windows program, tako da se nadzor zaustavlja ako zatvorite korisničko sučelje ili se odjavite iz Windowsa.

Besplatno za osobnu i komercijalnu upotrebu

Profesionalno izdanje

Profesionalno izdanje omogućuje praćenje do 250 hostova istovremeno. Svaki host može imati prilagođenu konfiguraciju kao što je obavijest o primateljima e-pošte ili prilagođene radnje koje se izvršavaju pri gubitku veze i događajima vraćanja. Radi kao Windows usluga, tako da se praćenje nastavlja čak i ako zatvorite korisničko sučelje ili se odjavite iz Windowsa.

Enterprise Edition

Izdanje Enterprise nema ograničenja u broju nadziranih računala. Na modernom računalu moguće je nadzirati 2500+ hostova ovisno o hardverskoj konfiguraciji.

Ovo izdanje uključuje sve dostupne značajke i radi kao klijent/poslužitelj. Poslužitelj radi kao Windows servis kako bi osigurao praćenje pinga u 24/7 modu. Klijent je Windows program koji se može povezati s poslužiteljem koji radi na lokalnom računalu ili s udaljenim poslužiteljem putem LAN-a ili Interneta. Više klijenata se može spojiti na isti poslužitelj i raditi istovremeno.

Ovo izdanje također uključuje web izvješća koja omogućuju daljinski pregled statistike nadgledanja hosta u web pregledniku.

Glavne značajke EMCO Ping Monitora

Nadgledanje pinga s više hostova

Aplikacija može nadzirati više hostova istovremeno. Besplatno izdanje aplikacije omogućuje praćenje do pet hostova; Profesionalno izdanje nema ograničenja za broj nadziranih hostova. Nadgledanje svakog hosta radi neovisno o drugim hostovima. Možete pratiti desetke tisuća hostova s ​​modernog računala.

Detekcija prekida veze

Aplikacija šalje ICMP ping echo zahtjeve i analizira ping echo odgovore kako bi pratila stanje veze u 24/7 modu. Ako unaprijed postavljeni broj pingova ne uspije u nizu, aplikacija otkriva prekid veze i obavještava vas o problemu. Aplikacija prati sve prekide, tako da možete vidjeti kada je domaćin bio izvan mreže.

Analiza kvalitete veze

Kada aplikacija pinga nadzirani host, sprema i prikuplja podatke o svakom pingu, tako da možete dobiti informacije o minimalnom, maksimalnom i prosječnom vremenu odgovora na ping i odstupanju odgovora na ping od prosjeka za bilo koje razdoblje izvješćivanja. To vam omogućuje procjenu kvalitete mrežne veze.

Fleksibilne obavijesti

Ako želite primati obavijesti o izgubljenoj vezi, ponovnoj uspostavi veze i drugim događajima koje otkrije aplikacija, možete konfigurirati aplikaciju da šalje obavijesti e-poštom, reproducira zvukove i prikazuje balone na Windows traci. Aplikacija može poslati jednu obavijest bilo koje vrste ili ponoviti obavijesti više puta.

Grafikoni i izvješća

Sve statističke informacije prikupljene aplikacijom mogu se vizualno prikazati grafikonima. Možete vidjeti statistiku pinga i neprekidnog rada za jedno glavno računalo i usporediti performanse više hostova na grafikonima. Aplikacija može redovito automatski generirati izvješća u različitim formatima koja predstavljaju statistiku domaćina.

Prilagođene radnje

Aplikaciju možete integrirati s vanjskim softverom izvršavanjem vanjskih skripti ili izvršnih datoteka kada se veze izgube ili ponovno uspostave ili u slučaju drugih događaja. Na primjer, možete konfigurirati aplikaciju za pokretanje vanjskog alata naredbenog retka za slanje SMS obavijesti o svim promjenama u statusima glavnog računala.

Po izgledu ove optike koja ide kroz šumu do kolektora možemo zaključiti da instalater nije malo pratio tehnologiju. Nosač na fotografiji također sugerira da se vjerojatno radi o pomorcu - pomorcu.

Ja sam iz mrežnog tima za fizičko zdravlje, drugim riječima, tehnička podrška, odgovorna za to da svjetla na ruterima trepću kako bi trebala. Pod našim okriljem imamo razne velike tvrtke s infrastrukturom u cijeloj zemlji. Mi ne ulazimo u njihov posao; naš je zadatak osigurati da mreža radi na fizičkoj razini i da promet teče kako treba.

Općenito značenje rada je stalno ispitivanje čvorova, uzimanje telemetrije, pokretanje testova (na primjer, provjera postavki za traženje ranjivosti), osiguranje operativnosti, praćenje aplikacija i prometa. Ponekad inventura i druge izopačenosti.

Ispričat ću vam kako je to organizirano i par priča s izleta.

Kako to obično biva

Naš tim sjedi u uredu u Moskvi i snima mrežnu telemetriju. Zapravo, to su stalni pingovi čvorova, kao i primanje podataka o nadzoru ako je hardver pametan. Najčešća situacija je da ping ne uspije nekoliko puta zaredom. U 80% slučajeva za npr. maloprodajnu mrežu to se pokaže kao nestanak struje, pa kada vidimo ovu sliku, radimo sljedeće:
  1. Najprije zovemo davatelja usluga u vezi nezgoda
  2. Zatim - u elektranu o gašenju
  3. Zatim pokušavamo uspostaviti kontakt s nekim na mjestu (ovo nije uvijek moguće, na primjer, u 2 sata ujutro)
  4. I na kraju, ako gore navedeno ne pomogne u roku od 5-10 minuta, izađemo sami ili pošaljemo "avatar" - ugovornog inženjera koji sjedi negdje u Iževsku ili Vladivostoku, ako postoji problem.
  5. S “avatarom” smo u stalnom kontaktu i “vodimo” ga kroz infrastrukturu - imamo senzore i servisne priručnike, on ima kliješta.
  6. Tada nam inženjer šalje izvješće s fotografijama o tome što je bilo.

Dijalozi ponekad idu ovako:
- Dakle, izgubljena je veza između zgrada broj 4 i 5. Provjerite ruter u petoj.
- Red, dalje. Nema veze.
- Dobro, prati kabel do četvrte zgrade, tamo je još jedan čvor.
-... Oppa!
- Što se dogodilo?
- Ovdje je 4. kuća srušena.
- Što??
- Uz izvješće prilažem fotografiju. Ne mogu obnoviti kuću u SLA.

Ali češće je još uvijek moguće pronaći prekid i vratiti kanal.

Otprilike 60% posjeta je gubljenje vremena, jer je ili prekinuta opskrba strujom (lopata, predradnik ili uljez), ili pružatelj usluga ne zna za kvar, ili je kratkotrajni problem otklonjen prije nego što dolazi instalater. Međutim, postoje situacije kada saznamo za problem prije korisnika i prije informatičkih službi korisnika te iskomuniciramo rješenje prije nego što oni uopće shvate da se nešto dogodilo. Najčešće se takve situacije događaju noću, kada je aktivnost u tvrtkama kupaca niska.

Kome to treba i zašto?

U pravilu, svaka velika tvrtka ima vlastiti IT odjel koji jasno razumije specifičnosti i zadatke. U srednjim i velikim poduzećima rad enikey i mrežnih inženjera često se povjerava vanjskim suradnicima. Jednostavno je isplativo i povoljno. Na primjer, jedan trgovac ima svoje vrlo cool IT stručnjake, ali oni su daleko od toga da zamijene usmjerivače i prate kabele.

Što radimo

  1. Radimo na zahtjeve - tikete i panik pozive.
  2. Radimo prevenciju.
  3. Pratimo preporuke dobavljača hardvera, primjerice, glede rokova održavanja.
  4. Povezujemo se s nadzorom kupca i prikupljamo podatke od njega kako bismo reagirali na incidente.
Priča s monitoringom je često da ga nema. Ili je podignuto prije 5 godina i nije baš relevantno. U najjednostavnijem slučaju, ako stvarno nema nadzora, kupcu nudimo jednostavan ruski Zabbix otvorenog koda besplatno - i to je dobro za njega, a nama je lakše.

Prva metoda - jednostavne provjere - jednostavno je stroj koji pinga sve mrežne čvorove i osigurava da odgovaraju ispravno. Ova implementacija ne zahtijeva nikakve promjene ili minimalne kozmetičke promjene na korisničkoj mreži. U pravilu, u vrlo jednostavnom slučaju, Zabbix instaliramo izravno u jedan od naših podatkovnih centara (srećom, imamo ih dva u uredu CROC-a na Voločajevskoj). U složenijem slučaju, na primjer, ako koristite vlastitu sigurnu mrežu - na jednom od strojeva u korisničkom podatkovnom centru:

Zabbix se može koristiti na složenije načine, na primjer, ima agente koji se instaliraju na *nix i win čvorove i prikazuju nadzor sustava, kao i način vanjske provjere (s podrškom za SNMP protokol). Međutim, ako tvrtka treba nešto slično, tada ili već ima vlastiti nadzor ili bira funkcionalno bogatije rješenje. Naravno, ovo više nije softver otvorenog koda i košta, ali čak i banalni točan inventar već smanjuje troškove za otprilike trećinu.

I mi to radimo, ali ovo je priča naših kolega. Ovdje su poslali par screenshotova Infosima:

Ja sam operater "avatara", pa ću vam dalje govoriti o svom radu.

Kako izgleda tipičan incident?

Pred nama su ekrani sa sljedećim općim statusom:

U ovom objektu, Zabbix prikuplja dosta informacija za nas: broj serije, serijski broj, CPU opterećenje, opis uređaja, dostupnost sučelja itd. Sve potrebne informacije dostupne su na ovom sučelju.

Običan incident obično počinje činjenicom da kupcu otpadne jedan od kanala koji vodi do, na primjer, trgovine (kojih ima 200-300 u cijeloj zemlji). Maloprodaja je sada pamet, a ne kao prije sedam godina, tako da će blagajna nastaviti raditi - postoje dva kanala.

Uzimamo slušalice i zovemo barem tri puta: dobavljača, elektranu i ljude na licu mjesta (“Da, ovdje smo utovarivali armaturu, dirali smo nečiji kabel... A, vaš? Pa dobro je da pronašli smo ga”).

U pravilu bi bez nadzora prošli sati ili dani prije eskalacije - ne provjeravaju se uvijek isti rezervni kanali. Odmah znamo i odmah odlazimo. Ako postoje dodatne informacije osim pingova (na primjer, model neispravnog dijela hardvera), odmah opremamo terenskog inženjera potrebnim dijelovima. Dalje na mjestu.

Drugi najčešći redoviti poziv je kvar jednog od korisničkih terminala, na primjer, DECT telefona ili Wi-Fi usmjerivača koji je distribuirao mrežu do ureda. Ovdje saznajemo o problemu iz nadzora i gotovo odmah primamo poziv s detaljima. Ponekad poziv ne dodaje ništa novo (“Podižem slušalicu, ništa ne zvoni”), ponekad je vrlo koristan (“Ispao nam je sa stola”). Jasno je da u drugom slučaju ovo očito nije prijelom retka.

Oprema u Moskvi preuzima se iz naših vrućih rezervnih skladišta, imamo ih nekoliko vrsta:

Kupci obično imaju vlastite zalihe komponenti koje često kvare - uredske slušalice, napajanja, ventilatori i tako dalje. Ako trebate isporučiti nešto što nije lokalno dostupno, a ne u Moskvu, obično idemo sami (zbog instalacije). Na primjer, imao sam noćni izlet u Nižnji Tagil.

Ako kupac ima vlastiti nadzor, može nam učitati podatke. Ponekad implementiramo Zabbix u režimu prozivanja, samo da osiguramo transparentnost i kontrolu nad SLA (ovo je također besplatno za korisnika). Ne ugrađujemo dodatne senzore (to rade kolege koji osiguravaju kontinuitet proizvodnih procesa), ali se možemo spojiti na njih ako protokoli nisu egzotični.

Općenito, ne diramo infrastrukturu korisnika, jednostavno je održavamo onakvom kakva jest.

Iz iskustva mogu reći da je zadnjih deset kupaca prešlo na vanjsku podršku zbog činjenice da smo troškovno vrlo predvidljivi. Jasno planiranje proračuna, dobro upravljanje slučajevima, izvješća o svakoj prijavi, SLA, izvješća o opremi, prevencija. U idealnom slučaju, naravno, mi smo kao čistači za klijentovog CIO-a - dođemo i obavimo to, sve je čisto, ne ometamo.

Još jedna stvar koju vrijedi napomenuti je da u nekim velikim tvrtkama inventura postaje pravi problem, a ponekad smo dovedeni samo da bismo je izvršili. Osim toga, pohranjujemo konfiguracije i njima upravljamo, što je zgodno za razne selidbe i ponovna povezivanja. Ali, opet, u teškim slučajevima nisam ni ja - imamo posebnog koji transportira podatkovne centre.

I još nešto važno: naš odjel se ne bavi kritičnom infrastrukturom. Sve unutar podatkovnih centara i sve što se odnosi na bankarstvo, osiguranje, operatere i maloprodajne temeljne sustave čini X-tim. ovi momci.

Više prakse

Mnogi moderni uređaji mogu pružiti mnogo servisnih informacija. Na primjer, s mrežnim pisačima vrlo je lako pratiti razinu tonera u ulošku. Možete računati unaprijed na razdoblje zamjene, plus imati obavijest od 5-10% (ako ured iznenada počne bijesno tipkati izvan standardnog rasporeda) - i odmah poslati enikey prije nego što računovodstveni odjel počne paničariti.

Vrlo često se od nas uzimaju godišnje statistike koje radi isti sustav praćenja plus mi. U slučaju Zabbixa, to je jednostavno planiranje troškova i razumijevanje što je kamo otišlo, au slučaju Infosima, to je također materijal za izračun skaliranja za godinu, admin opterećenja i svakakvih drugih stvari. Statistika uključuje i potrošnju energije - u posljednjih godinu dana gotovo svi su je počeli tražiti, očito kako bi se interni troškovi raspodijelili između odjela.

Ponekad postoje prava herojska spašavanja. Takve situacije su vrlo rijetke, ali koliko se sjećam ove godine, oko 3 sata ujutro vidjeli smo porast temperature na 55 stupnjeva na Cisco switchu. U udaljenoj serverskoj sobi nalazili su se "glupi" klima uređaji bez nadzora i nisu uspjeli. Odmah smo pozvali rashladnog inženjera (ne našeg) i pozvali dežurnog administratora korisnika. Isključio je neke od nekritičnih usluga i čuvao serversku sobu od termičkog pada sve dok nije stigao tip s mobilnim klima uređajem i zatim popravio obične.

Za Polycom i drugu skupu opremu za video konferencije, razina napunjenosti baterije se vrlo dobro prati prije konferencija, što je također važno.

Svatko treba praćenje i dijagnostiku. U pravilu, to je dugo i teško implementirati bez iskustva: sustavi su ili krajnje jednostavni i unaprijed konfigurirani, ili veličine nosača zrakoplova i s hrpom standardnih izvješća. Izoštravanje datoteke za tvrtku, osmišljavanje implementacije njihovih internih zadataka IT odjela i ispisivanje informacija koje su im najpotrebnije, plus održavanje cijele povijesti ažurnom je problem ako nema iskustva u implementaciji. Kada radimo sa sustavima nadzora, biramo sredinu između besplatnih i vrhunskih rješenja - u pravilu ne najpopularnijih i "debelih" dobavljača, ali jasno rješavaju problem.

Jednom je postojao prilično netipičan tretman. Kupac je trebao predati ruter nekom od svojih zasebnih odjela, i to točno prema inventaru. Usmjerivač je imao modul s navedenim serijskim brojem. Kad smo počeli pripremati ruter za put, pokazalo se da nedostaje ovaj modul. I nitko ga ne može pronaći. Problem malo otežava činjenica da je inženjer koji je prošle godine radio u ovoj grani već u mirovini i otišao je posjetiti unuke u drugi grad. Kontaktirali su nas i zamolili da pogledamo. Srećom, hardver je dao izvještaje o serijskim brojevima, a Infosim je napravio inventuru, pa smo u par minuta pronašli ovaj modul u infrastrukturi i opisali topologiju. Bjegunac je ušao u trag kabelom - nalazio se u drugoj serverskoj sobi u ormaru. Povijest pokreta pokazala je da je tamo stigao nakon što je sličan modul propao.


Snimak igranog filma o Hottabychu, koji precizno opisuje odnos stanovništva prema kamerama

Puno incidenata s kamerom. Jednog dana otkazale su 3 kamere odjednom. Prekid kabela u jednom od odjeljaka. Instalater je upuhao novu u valovitost, dvije od tri kamere su se digle nakon niza šamanizama. Ali treći nije. Štoviše, nije jasno gdje je ona uopće. Dižem video stream - zadnji kadrovi neposredno prije pada - 4 sata ujutro, prilaze trojica sa šalovima na licu, nešto svijetli ispod, kamera se snažno trese, pada.

Nakon što postavimo kameru koja bi trebala fokusirati "zečeve" koji se penju preko ograde. Dok smo se vozili, razmišljali smo kako ćemo označiti točku na kojoj bi se uljez trebao pojaviti. Nije bilo od koristi - u 15 minuta koliko smo bili tamo, 30-ak ljudi je ušlo u objekt samo na mjestu gdje smo mi trebali. Stol za izravno ugađanje.

Kao što sam već naveo primjer gore, priča o srušenoj zgradi nije šala. Nakon što je veza s opremom nestala. Na licu mjesta nema paviljona u kojem se držao bakar. Paviljon je srušen, kabel je nestao. Vidjeli smo da je ruter crkao. Stigao je instalater i počeo tražiti - a razmak između čvorova bio je par kilometara. Ima Vipnet tester u kompletu, standardni - zvonilo s jednog konektora, zvonilo s drugog - išao sam tražiti. Obično je problem odmah vidljiv.


Cable tracking: ovo je valovita optika, nastavak priče sa samog vrha posta o morskom čvoru. Ovdje je na kraju, osim apsolutno nevjerojatne instalacije, otkriven problem da se kabel odmaknuo od pričvršćivača. Ovdje se penju svi i svatko i tresu metalne konstrukcije. Oko pet tisuća predstavnika proletarijata razbilo je optiku.

Na jednom su mjestu svi čvorovi bili isključeni otprilike jednom tjedno. I to u isto vrijeme. Dugo smo tražili uzorak. Instalater je pronašao sljedeće:

  • Problem se javlja uvijek tijekom smjene iste osobe.
  • Od ostalih se razlikuje po tome što nosi vrlo težak kaput.
  • Iza vješalice za odjeću nalazi se stroj.
  • Netko je davno, još u prapovijesti, odnio poklopac stroja.
  • Kad ovaj drug stigne na radilište, on objesi svoju odjeću, a ona ugasi strojeve.
  • Odmah ih ponovno uključuje.

Na jednom mjestu je tijekom noći u isto vrijeme isključena oprema. Ispostavilo se da su nam se domaći majstori priključili na struju, izvukli produžni kabel i uključili kuhalo za vodu i električni štednjak. Kada ovi uređaji rade istovremeno, cijeli paviljon je nokautiran.

U jednoj od trgovina u našoj ogromnoj domovini cijela mreža je stalno padala kada je smjena zatvorena. Instalater je vidio da je sva struja usmjerena na vod rasvjete. Čim se u trgovini ugasi gornja rasvjeta (koja troši puno energije), sva mrežna oprema se gasi.

Bio je slučaj da je domar lopatom pokidao kabel.

Često vidimo samo bakar kako leži s otkinutim valovima. Jednom su lokalni majstori jednostavno bacili dvožilni kabel između dvije radionice bez ikakve zaštite.

Daleko od civilizacije, zaposlenici se često žale da su ozračeni “našom” opremom. Centrale na nekim udaljenim mjestima mogu biti u istoj prostoriji kao i osoba na dužnosti. Sukladno tome, par puta smo naišli na štetne bake koje su ih, milom i zlom, isključile na početku smjene.

U drugom dalekom gradu na optiku je obješen mop. Otrgnuli su valovitost sa zida i počeli je koristiti kao pričvršćivač za opremu.


U ovom slučaju jasno postoje problemi s prehranom.

Što može "veliko" praćenje?

Također ću ukratko govoriti o mogućnostima ozbiljnijih sustava, na primjeru Infosim instalacija. Tu su 4 rješenja spojena u jednu platformu:
  • Upravljanje kvarovima – praćenje kvarova i korelacija događaja.
  • Upravljanje učinkom.
  • Popis i automatsko otkrivanje topologije.
  • Konfiguracijski menadžment.
Ono što je važno je da Infosim podržava hrpu opreme odmah po korištenju, odnosno lako parsira sve njihove interne centrale i dobiva pristup svim njihovim tehničkim podacima. Evo popisa dobavljača: Cisco Systems, Huawei, HP, AVAYA, Redback Networks, F5 Networks, Extreme Networks, Juniper, Alcatel-Lucent, Fujitsu Technology Solutions, ZyXEL, 3Com, Ericsson, ZTE, ADVA Optical Networking, Nortel Networks, Nokia Siemens Networks, Allied Telesis, RADCOM, Allot Communications, Enterasys Networks, Telco Systems, itd.

Odvojeno o inventaru. Modul ne samo da prikazuje popis, već i samu gradi topologiju (barem u 95% slučajeva pokušava i dobije je kako treba). Također vam omogućuje da pri ruci imate ažurnu bazu podataka o korištenoj i neiskorištenoj informatičkoj opremi (mrežnoj, poslužiteljskoj opremi i sl.), te pravovremenu zamjenu zastarjele opreme (EOS/EOL). Općenito, to je prikladno za velike tvrtke, ali u malim tvrtkama veći dio toga radi se ručno.

Primjeri izvješća:

  • Izvješća raščlanjena prema vrstama OS-a, firmware-u, modelima i proizvođačima opreme;
  • Izvještaj o broju slobodnih portova na svakom preklopniku u mreži/po odabranom proizvođaču/po modelu/po podmreži itd.;
  • Izvješće o novododanim uređajima za određeno razdoblje;
  • Obavijest o niskoj razini tonera u pisačima;
  • Procjena prikladnosti komunikacijskog kanala za promet osjetljiv na kašnjenja i gubitke, aktivne i pasivne metode;
  • Praćenje kvalitete i dostupnosti komunikacijskih kanala (SLA) – generiranje izvješća o kvaliteti komunikacijskih kanala prema teleoperatorima;
  • Praćenje kvarova i funkcija korelacije događaja implementirana je pomoću mehanizma analize uzroka (bez potrebe da administrator piše pravila) i mehanizma Alarm State Machine. Root-Cause Analysis je analiza temeljnog uzroka nezgode, koja se temelji na sljedećim postupcima: 1. automatsko otkrivanje i lokalizacija mjesta kvara; 2. smanjenje broja izvanrednih događaja na jedan ključni; 3. utvrđivanje posljedica neuspjeha – tko i što je pogođen neuspjehom.
Također možete instalirati ove stvari na mreži, koje su odmah integrirane u nadzor:


Stablenet – Embedded Agent (SNEA) je računalo malo veće od kutije cigareta.

Instalacija se provodi na bankomatima ili namjenskim mrežnim segmentima gdje su potrebne provjere pristupačnosti. Uz njihovu pomoć provodi se ispitivanje opterećenja.

Praćenje oblaka

Drugi model instalacije je SaaS u oblaku. Učinili smo to za jednog globalnog kupca (tvrtku s kontinuiranim proizvodnim ciklusom s distribucijskom geografijom od Europe do Sibira).

Deseci objekata, uključujući tvornice i skladišta gotovih proizvoda. Ako su njihovi kanali pali, a podrška im je bila pružena iz stranih ureda, tada su počela kašnjenja isporuka, što je postupno dovelo do daljnjih gubitaka. Sav posao obavljen je na zahtjev i puno je vremena potrošeno na istragu incidenta.

Postavili smo nadzor posebno za njih, a zatim ga dodali u brojna područja na temelju specifičnosti njihovog usmjeravanja i hardvera. Sve je to napravljeno u CROC oblaku. Projekt je vrlo brzo završen i isporučen.

Rezultat je:

  • Zbog djelomičnog prijenosa kontrole nad mrežnom infrastrukturom, bilo je moguće optimizirati barem 50%. Nedostupnost opreme, opterećenje kanala, prekoračenje parametara preporučenih od strane proizvođača: sve se to bilježi unutar 5-10 minuta, dijagnosticira i popravlja unutar sat vremena.
  • Prilikom primanja usluge iz oblaka, kupac prenosi kapitalne troškove za implementaciju svog sustava za nadzor mreže u operativne troškove za pretplatu za našu uslugu, koju može otkazati u bilo kojem trenutku.

Prednost oblaka je što u svojoj odluci stojimo takoreći iznad njihove mreže i možemo objektivnije gledati na sve što se događa. U to vrijeme, da smo unutar mreže, vidjeli bismo sliku samo do čvora kvara i više ne bismo znali što se događa iza njega.

Par slika za kraj

Ovo je "jutarnja slagalica":

I našli smo ovo blago:

Ovo je bilo u škrinji:

I za kraj o najzabavnijem izletu. Jednom sam otišao na maloprodajnu stranicu.

Tamo se dogodilo sljedeće: prvo je počelo kapati s krova na spušteni strop. Tada se u spuštenom stropu stvorilo jezero koje je ispralo i probilo jednu od pločica. Kao rezultat toga, sve se to ulilo u elektriku. Onda ne znam točno što se dogodilo, ali negdje u susjednoj sobi došlo je do kratkog spoja i izbila je vatra. Prvo su se aktivirali aparati za gašenje požara prahom, a onda su stigli vatrogasci koji su sve napunili pjenom. Stigao sam za njima na rastavljanje. Moram reći da je Cisco 2960 radio nakon svega ovoga - uspio sam preuzeti konfiguraciju i poslati uređaj na popravak.

Još jednom, kada je aktiviran sustav praha, Cisco 3745 u jednoj posudi bio je gotovo potpuno ispunjen prahom. Sva su sučelja bila puna - 2 x 48 porta. Moralo se uključiti na licu mjesta. Sjetili smo se prethodnog incidenta, odlučili pokušati ukloniti konfiguracije "vruće", istresli ih, očistili ih najbolje što smo mogli. Uključili smo ga - uređaj je prvo rekao "pfft" i kihnuo veliki mlaz praha prema nama. A onda je zaprktao i ustao.