SRE Manager

  • Warszawa
  • It Professionals Sp. Z O.o.
Ogłoszenie opublikowane przez IT Professionals agencję zatrudnienia zarejestrowaną w KRAZ pod nr 21150. Oferujemy Duży wpływ i decyzyjność  przy tworzeniu rozwiązań i dobieraniu technologii. Korzystne warunki zatrudnienia  w oparciu o B2B z wynagrodzeniem wypłacanym w Euro. Pełną elastyczność  dzięki pracy zdalnej z dowolnego miejsca. 25 dni płatnego urlopu Inwestycję w Twój rozwój  poprzez dostęp do platformy szkoleniowej oraz dodatkowe dni wolne przeznaczone na samorozwój. Przyjazną atmosferę  wśród doświadczonych specjalistów opartą na współpracy, zaufaniu i wspierającą rozwój zawodowy. Obowiązki Prowadzenie, mentoring i wspieranie członków zespołu SRE. Nadzór nad monitorowaniem, alertowaniem i rozwiązywaniem problemów systemowych. Zapewnienie wysokiej dostępności i niezawodności systemów produkcyjnych i usług. Koordynacja reakcji na incydenty systemowe i awarie. Przeprowadzanie przeglądów po incydentach oraz zapewnienie skutecznego rozwiązania incydentów i działań następczych. Zarządzanie i optymalizacja infrastruktury, aby spełniała obecne i przyszłe wymagania. Identyfikowanie możliwości automatyzacji w celu poprawy niezawodności systemu i efektywności operacyjnej. Ścisła współpraca z zespołami deweloperskimi, operacyjnymi i produktowymi w celu integracji niezawodności w cyklu życia oprogramowania. Skuteczna komunikacja z interesariuszami na temat wydajności systemu, incydentów i statusu projektów. Definiowanie i śledzenie kluczowych wskaźników wydajności (KPI) w celu mierzenia niezawodności systemu i wydajności zespołu. Zapewnienie zgodności systemów z politykami bezpieczeństwa i wymaganiami prawnymi. Wymagania Kluczowa wiedza i doświadczenie:  Doświadczenie w prowadzeniu i zarządzaniu zespołem SRE lub DevOps,  lub też wieloletnie doświadczenie w obszarze SRE i aspiracje do roli managera.  Biegłość w AWS, Azure lub Google Cloud oraz narzędziach do infrastruktury jako kodu (IaC) takich jak Terraform. Dobra znajomość języków programowania Python (najchętniej z Django) lub ewentualnie PHP czy Node.js. Umiejętności skryptowania przy użyciu Python, Bash lub PowerShell do automatyzacji infrastruktury. •    Doświadczenie z narzędziami monitoringu takimi jak Prometheus lub Grafana do monitoringu w czasie rzeczywistym i alertowania. Doświadczenie w zarządzaniu i reagowaniu na incydenty systemowe i awarie. Umiejętność priorytetyzacji zadań i zarządzania wieloma projektami jednocześnie. Doświadczenie w planowaniu i realizacji projektów, w tym zarządzanie zasobami i przestrzeganie harmonogramów. Doświadczenie we współpracy z zespołami wielofunkcyjnymi, w tym deweloperskimi, operacyjnymi i produktowymi. Przydatne doświadczenia i umiejętności:  Dużą zaletą będzie doświadczenie zdobyte w szybko rozwijającej się, globalnej firmie SaaS. Skupienie się na automatyzacji procesów w celu poprawy efektywności i redukcji interwencji manualnych. Umiejętność korzystania z danych i metryk do podejmowania decyzji i wprowadzania usprawnień. Zrozumienie najlepszych praktyk bezpieczeństwa i wymagań zgodności.  Doświadczenie w dostrajaniu wydajności i planowaniu pojemności.