ანოტაცია
თანამედროვე ღრუბლოვანი მიკროსერვისული არქიტექტურები, მიუხედავად მათი მოქნილობისა და მასშტაბირებადობისა, ხშირად აწყდება რთულ გამოწვევებს, როგორიცაა ფარული ხარვეზები, კასკადური მარცხი და სისტემის არაპროგნოზირებადი ქცევა. ეს სტატია იკვლევს ქაოსის ინჟინერიის, როგორც DevOps-ის პროაქტიული მეთოდის, გამოყენებას Google-ის „Online Boutique“ აპლიკაციის მაგალითზე, რომელიც განლაგებულია Google Kubernetes Engine-ზე (GKE). Chaos Mesh-ის გამოყენებით ჩატარებულმა ექსპერიმენტებმა (CPU Hog, Memory Hog, Network Latency, Packet Loss) გამოავლინა კრიტიკული სისუსტეები, მათ შორის „ჩუმი მარცხი“, მეხსიერების ამოწურვა (OOMKilled) და არაადეკვატური timeout/retry მექანიზმები. Prometheus-ისა და Grafana-ს მეშვეობით გაზომილი KPI-ებით (პასუხის დრო, შეცდომების სიხშირე, CPU/მეხსიერების მოხმარება) და Locust-ის მიერ სიმულირებული მომხმარებლის ტრაფიკით, განხორციელდა სისტემის ოპტიმიზაცია. ეს მოიცავდა Horizontal Pod Autoscaler-ის (HPA) დანერგვას, რესურსების ლიმიტების კორექტირებასა და timeout/retry მექანიზმების გაძლიერებას.
განმეორებითმა ექსპერიმენტებმა აჩვენა სისტემის მდგრადობის სტატისტიკურად მნიშვნელოვანი გაუმჯობესება, რაც ხაზს უსვამს ქაოსის ინჟინერიის, როგორც DevOps-ის განუყოფელი ნაწილის, მნიშვნელობას. სტატია გვთავაზობს პრაქტიკულ რეკომენდაციებს სისტემის სანდოობის გაძლიერებისა და SDLC-ში ქაოსის ინჟინერიის ინტეგრირებისთვის.
წყაროები
დემჩენკო ნ. (2025). DevOps-ის ეფექტიანობის ოპტიმიზაცია ქაოსური ინჟინერიის გამოყენებით, ბიზნესისა და ტექნოლოგიების უნივერსიტეტი. 80 გვ.
Basiri, A., Behnam, N., de Rooij, R., Hochstein, L., Kosewski, L., Reynolds, J., & Rosenthal, C. (2016). Chaos Engineering: Building Confidence in System Behavior through Controlled Experiments. Netflix Technology Blog.
Rosenthal, C., & Jones, N. (2020). Chaos Engineering: System Resiliency in Practice. O’Reilly Media. 267 p.
Zhang, X., Liu, Y., & Wang, J. (2022). Performance Optimization in Kubernetes-Based Microservices. Journal of Cloud Computing, 11(3), 45–56p.