Rekrutujemy Full Time

DevOps / Infrastructure & Field Support Engineer

Wynagrodzenie 18 000 - 20 000

Data rozpoczęcia ASAP elastyczny

DevOps / Infrastructure & Field Support Engineer

xBerry - jesteśmy firmą badawczo-rozwojową zdobywającą doświadczenie w dostarczaniu niestandardowych rozwiązań dla międzynarodowych klientów od 2016 roku. Zapewniamy szeroką wiedzę specjalistyczną w zakresie systemów wbudowanych, uczenia maszynowego, technologii AR / VR i przetwarzania obrazu.

Obsługa incydentów i konserwacja systemu

Diagnozowanie i rozwiązywanie problemów związanych z:

Klastrami Kubernetes
Kontenerami (Docker)
Linux (Ubuntu)
sieciami
pamięć masowa (w tym NFS),

Analizowanie logów i stanu usług na różnych warstwach aplikacji i infrastruktury,
Restoring full system functionality in production environments,
Przywracanie pełnej funkcjonalności systemów w środowiskach produkcyjnych,
Uczestnictwo w interwencjach na miejscu, gdy problemów nie można rozwiązać zdalnie.

Automatyzacja, obserwowalność i odporność systemu

Projektowanie i tworzenie zautomatyzowanych mechanizmów rozwiązywania problemów,
Wczesne wykrywanie problemów na poziomie infrastruktury i aplikacji,
Zautomatyzowana walidacja stanu kluczowych komponentów systemu:

OS,
Kubernetes,
kontenery,
storage,
sieciami

Tworzenie rozwiązań do kontroli stanu systemu i obserwacji (metryki, alerty, pulpity nawigacyjne),
Tworzenie i utrzymywanie:

elementy runbook,
standardowe procedury odzyskiwania,
zautomatyzowane mechanizmy samoleczenia,

Dokumentowanie typowych incydentów, przyczyn źródłowych i metod rozwiązywania problemów.

Współpraca i doskonalenie architektury

Bliska współpraca z zespołami programistycznymi i architektonicznymi,
Wkład w uproszczenie i standaryzację architektury,
Poprawa ogólnej stabilności i niezawodności systemu,
Wspieranie długoterminowych wysiłków mających na celu redukcję kosztów operacyjnych i interwencji ręcznych.

Wymagania techniczne

Duże doświadczenie w administrowaniu systemem Linux (Ubuntu) i rozwiązywaniu problemów,
Praktyczne doświadczenie z Kubernetes, obejmujące rozwiązywanie problemów z klastrami i analizę kontenerów,
Praktyczna woedza z Dockera
Solidna znajomość zagadnień sieciowych i diagnozowania problemów związanych z siecią,
Doświadczenie w rozwiązywaniu problemów z NFS/pamięcią masową,
Znajomość operacyjna środowisk GPU/CUDA (kompatybilność, stabilność),
Doświadczenie pracy z: