Görəcəyiniz işlər:
- Mikroservis əsaslı tətbiqlər üçün xidmət səviyyəsi göstəriciləri (SLI) və məqsədlərini (SLO) müəyyənləşdirmək və həyata keçirmək
- İnformativ panellər, metriklər və xəbərdarlıq mexanizmləri quraşdırmaq və təkmilləşdirmək
- Sistem müşahidəsini davamlı yaxşılaşdırmaq - metriklər və izləmə sistemlərini təkmilləşdirərək sistem performansına daha dərin nəzarət, problem həlli vaxtını azaltmaq və proaktiv incident aşkarlanmasına dəstək vermək
- İnfrastruktur, tətbiq və xidmət etibarlılığı üçün yüksək standartlar təyin edərək kod review vasitəsilə ən yaxşı təcrübələri irəli sürmək, mühəndisləri təlim etmək və komandalar arasında arxitektura və deployment proseslərinə təsir etmək
- Strukturlaşdırılmış növbətçilik dəstək prosesinin (On Call) inkişafına və tətbiqinə töhfə vermək
- İnsidentlər və əməliyyat anormallıqlarını araşdırmaq, həll etmək, əsas səbəb təhlili aparmaq və sonrakı təhlil prosesini həyata keçirmək
- Təkrarlanan və ya manual əməliyyat tapşırıqlarını ("toil") müəyyən etmək, səmərəlilik və etibarlılığı artırmaq üçün skriptlər və ya avtomatlaşdırma həlləri hazırlamaq
- Development, QA və Platform komandaları ilə sıx işbirliyi edərək etibarlılıq, genişlənə bilmə qabiliyyəti və təhlükəsizliyin sistem və tətbiq dizaynlarına inteqrasiya edilməsini təşviq etmək
- Yeni texnologiyaları və yenilikləri izləmək, sistem davamlılığını və əməliyyat mükəmməlliyini artıran yeni alətlər və ya yanaşmaların qəbulu üçün tövsiyələr vermək
Bizim üçün uyğun namizəd:
- Kompüter Mühəndisliyi və ya Kompüter Elmləri sahəsində ali təhsil
- Əla ünsiyyət bacarıqları - komanda təşkilatdaxili digər komandalarla sıx əməkdaşlıq edəcək
- Linux təcrübəsi və şəbəkə sistemləri ilə tanışlıq
- Python, Java və ya Go proqramlaşdırma dillərindən biri ilə təcrübə (Java üstünlükdür)
- Mürəkkəb, genişmiqyaslı distributed sistemlərdə konteyner orkestrləşdirilməsi (nümunə: kubernetes), yük balanslaşdırıcıları (load balancers), verilənlər bazaları və storage sistemləri ilə tanışlıq
- Güclü problem həll etmə qabiliyyəti(troubleshooting) və mövcud problemləri həll etməyi öyrənmək istəyi
- Monitoring frameworklər ilə təcrübə, (OpenTelemetry üstünlükdür)
- Prometheus + Thanos, Grafana Tempo, Grafana Loki ilə təcrübə (üstünlükdür)
- OpenShift ilə təcrübə (üstünlükdür)
Vakansiyalardan daha tez xəbərdar olmaq üçün Telegram kanalımıza abunə olun!