Plus minus
Strona domowa Ireny i Zbigniewa Kuleszów
Serdecznie witamy na domowych, prywatnych serwerach
Dzisiaj jest: 2026-06-23  Aktualizacja strony dnia: [an error occurred while processing this directive]
Jezyki
Rocznica 24 lat pracy serwerów i strony zjk.pl :-) (od 2002)
24 lat nieprzerwanej pracy z systemem FreeBSD / 24 years of continuous work with FreeBSD
system
UWAGA! Ten serwis, strona i podstrony mogą używać cookies i podobnych technologii (brak zmiany ustawienia przeglądarki oznacza zgodę na to)!
Powitanie Autor Irena Zbigniew Elektronika Studenci Serwer Prawo_jazdy Kolejka Pobierz Linki Palmtop Kontakt Info O Tobie Mail
FreeBSD i mikroserwery. Rocznica 18 lat pracy serwerów i strony zjk.pl :-) Nieprzerwanie od 2002 roku.
Info ogólne Infrastruktura Kogo goœcimy? Usługi Sprzęt Technologie FreeBSD Oprogramowanie Aktualizacje Historia Pobierz Linki Kontakt CMS Blog Dla_Róży Mail Zbyszek
Zdjęcia 1 Zdjęcia noc 1 Zasilanie HA-OPNsense PCI riser i9 9900T Chłodzenie Zrobię samemu 32do64 FAQ Aktualizacje 32do64 Zrobię samemu Pobierz Linki Kontakt CMS Blog Dla_Róży
Przypadki Testy odpornoœci Manifest Opinie AI Logi Poczta Mail Zbyszek


**
**Tu spis  Tu spis**
**

PL Tekst


Testy odporności infrastruktury


W celu zweryfikowania rzeczywistej odporności operacyjnej infrastruktury przeprowadzono symulacje awarii różnych kombinacji węzłów oraz analizę zachowania usług podczas degradacji systemu.

Awaria pojedynczego serwera

Utrata dowolnego pojedynczego węzła nie powoduje zauważalnych przerw w działaniu usług dla użytkowników końcowych. Warstwy redundantne automatycznie przejmują obciążenie, a system kontynuuje pracę w trybie zdegradowanym.
W niektórych przypadkach (np. przełączenie MooseFS master) automatyczny failover wymaga kilku minut na pełną stabilizację.
Taka architektura umożliwia wykonywanie aktualizacji, prac serwisowych oraz wymiany sprzętu bez istotnego wpływu na działanie infrastruktury.

Awaria dwóch serwerów

Większość usług pozostaje dostępna. Dostępność usług redundantnych zależy od kombinacji uszkodzonych węzłów.
Potencjalnie niedostępne mogą stać się m.in.:
redundantne serwery pocztowe,
para HA OPNsense,
wybrane repliki usług aplikacyjnych.
Pozostałe elementy infrastruktury kontynuują pracę z ograniczoną redundancją.

Awaria trzech serwerów

Usługi wykorzystujące potrójną replikację lub mechanizmy quorum mogą utracić dostępność, jeśli awaria obejmie wszystkie węzły danej grupy usługowej.
Dotyczy to m.in.:
MooseFS,
SeaweedFS,
klastrów PostgreSQL,
mechanizmów replikacji MySQL wymagających quorum.
Architektura została zaprojektowana w taki sposób, aby degradacja następowała stopniowo i przewidywalnie.

Rozległa awaria wielowęzłowa

Przy jednoczesnej utracie czterech lub większej liczby serwerów dostępność usług ulega dalszej degradacji, jednak wybrane komponenty infrastruktury mogą nadal działać w ograniczonym zakresie.
Celem projektu nie było osiągnięcie pełnej odporności na każdą możliwą awarię, lecz budowa infrastruktury zapewniającej przewidywalne zachowanie systemu, kontrolowaną degradację usług oraz możliwość długoterminowej, stabilnej eksploatacji.

Awaria głównego switcha

"Rozpina" całą wewnętrzna sieć. Aktualnie planowany jest zakup drugiego switcha zarządzalnego i zmianę konfiguracji sieci z trybu LAGG/LACP na LAGG/failover z wykorzystaniem drugiego switcha.

Awaria zasilaczy

Elementy krytyczne serwerowni, zapewniające dostęp do Internetu są chronione podwójnym obwodem z diodami Schottky-ego - jeden z zasilacza głównego, drugim z rezerwowego.


Awaria UPS i sieci energetycznej

Awaria dowolnego, jednego UPS pozostaje bez wpływu na pracę serwerowni.
Awaria dwóch UPS - o ile zasilanie z sieci energetycznej działa - pozostaje bez wpływu na pracę serwerowni.
Dopiero awaria wszystkich trzech źródeł zasilania wyłącza serwerownię.


Czas przywrócenia do pracy

Serwery posiadają indywidualną kopie zapasową na drugim dysku w tej samej obudowie - czas jej przywrócenia to w praktyce tylko czas jej przegrania na uszkodzony dysk systemowy. Kluczowy jest czas usuwania awarii w rozumieniu przywróceniu sprawności samego komputera do działania (np. wymiana dysku).

Czas Recovery (RTO)

Każdy serwer ma lokalną kopię zapasową na drugim dysku zamontowanym w tej samej obudowie.
Przywrócenie systemu po awarii dysku sprowadza się w praktyce do przegrania backupu — zajmuje to zwykle kilka–kilkanaście minut.
Lokalne kopie służą przede wszystkim do szybkiego recovery operacyjnego, natomiast pełne archiwum backupowe pozostaje odseparowane od środowiska produkcyjnego.
Kluczowym czynnikiem jest fizyczny czas naprawy sprzętu (np. wymiana dysku). Dzięki redundancji usług awaria pojedynczego serwera nie powoduje przerw w dostępności większości serwisów.

Czas czas off-site

Kopie znajdują sie w tm samym pomieszczeniu, jest to więc liczy się tylko czas przegrania danych na dysk pośredni + ostateczne dogranie na dysk docelowy - ok. 30 min.


Lokalne backupy

Każdy serwer posiada lokalną kopię zapasową na drugim dysku w tej samej obudowie. Czas przywrócenia systemu po awarii dysku to w praktyce przegranie backupu na nowy dysk — zajmuje to zazwyczaj kilka do kilkunastu minut.

Backupy off-site

Obecnie nie posiadam kopii zapasowych poza lokalizacją (wszystkie backupy znajdują się w tym samym pomieszczeniu). Jest to świadomy kompromis wynikający z priorytetów projektu.
Czas wykonania pełnego backupu na dysk pośredni i finalne zapisanie wynosi około 30 minut.


Monitoring

Posiadam działający stack Prometheus + Grafana, jednak aktualnie go nie używam. Klasyczne narzędzia (Munin, Monitorix, Ganglia, MRTG) dają mi bardziej czytelne i przydatne w moim przypadku informacje.


Tekst PL

Powrót na stronę główną - Informacje o stronie, prawa autorskie, legalność itd. tutaj
Informacje o przetwarzaniu i ochronie danych osobowych, kontakt i zapytania itd. tutaj
Prywatne serwery Zbigniewa Kuleszy zjk.pl. Aktualny dostawca Internetu - Vectra.pl, Wszelkie prawa zastrzeżone. Zespół redakcyjny zjk.pl: zjk7@wp.pl
W sprawie treści i działania strony oraz w sprawie funkcjonowania i udostępniania treści na serwerach zjk.pl - kontakt z administratorem: webmaster@zjk.pl lub zjk7@wp.pl

Valid HTML 4.01 Transitional Valid XHTML 1.0 Transitional Poprawny CSS! Poprawny CSS!

Copyright (c): Zbigniew Kulesza, Sieradz 2002-2026