مهندس موثوقية الموقع الأول - Dubai, United Arab Emirates - Quadcode

    Default job background
    Description

    مراجعة العمليات والمنصة والبنيةالتحتية؛
    تنفيذ Grafana OnCall؛
    مراجعة وإعادةصياغة عمليات ITSM إذا لزمالأمر.

    المسؤوليات فيالدور:

    تحديد الاختناقات وإعدادالتوصيات لتحسين موثوقية الخدمات؛
    الاستجابة لحالات الطوارئالخاصة بالمنصة، وتحديد أسباب الفشل وحلها، وتجميع تقارير ما بعدالوفاة؛
    تطوير أدوات المراقبة والتنبيه لضمان التوافرالعالي والكشف السريع عن المشكلات المحتملة: (Grafana، GrafanaOnCall، Prometheus Alert manager، وما إلى ذلك)؛
    المشاركةالنشطة في عمليات إدارة التغيير، بما في ذلك تقييم وتنسيق التغييراتفي البنية التحتية ضمن جلسات المجلس الاستشاري للتغيير(CAB)؛
    تنفيذ ودعم عمليات ITSM لتحسين سير عمل الفريقوتحسين جودة الخدمة.
    تطوير وصيانة الوثائق في حالةمحدثة.

    متطلبات:

    أكثرمن 3 سنوات من الخبرة في SRE/DevOps؛
    فهم مبادئ SRE،والخبرة العملية في تنفيذ ممارسات SRE؛
    فهم المبادئ والخبرةالعملية في بناء أنظمة مرنة؛
    خبرة في أنظمة المراقبةوالتسجيل (Prometheus، Graylog، Grafana).
    تجربة مع أدواتالتشغيل الآلي لبناء البرامج ونشرها (CI/CD): GitLab،Jenkins؛
    فهم مبادئ المحاكاة الافتراضيةوالحاويات؛
    فهم البنية التحتية باعتبارها نهج التعليماتالبرمجية (IaC) والخبرة؛
    إتقان لغة برمجة لتطوير البرامجالنصية للأتمتة (Python، Nodejs، Golang، وما إلى ذلك)، والقدرة علىفهم رمز الخدمة؛
    فهم بروتوكولات الشبكة، والطوبولوجيا،ونماذج الشبكة؛
    خبرة في أدوات إدارة التكوين: Ansible,Chef؛
    الخبرة الأساسية مع قواعد البيانات العلائقية، مثلPostgreSQL؛
    خبرة في إدارة أنظمة التشغيلLinux؛
    إتقان اللغتين الإنجليزية والروسية (الحد الأدنىB2).