HelloWorld logo
08.05.2026. ·
2 min

GitHub na ivici izdržljivosti: AI agenti izazvali velike padove sistema

HelloWorld

GitHub se suočava sa neviđenim rastom saobraćaja koji je izazvao nedavne padove sistema i ozbiljne probleme sa spajanjem koda. Kompanija je priznala da trenutna infrastruktura mora da se poveća čak 30 puta kako bi izdržala nalet automatizovanih AI agenata. Ovi incidenti su otkrili kritične tačke u arhitekturi koje sada zahtevaju hitnu migraciju na nove tehnologije i sisteme.

Glavni uzrok nestabilnosti je nagli porast agentic development procesa koji su preopteretili Git storage i Actions sisteme. Od kraja 2025. godine broj automatizovanih zahteva raste eksponencijalno i stvara ogroman pritisak na sve povezane baze podataka. Inženjeri sada ubrzano sele kritične delove koda sa Ruby monolita na efikasniji Go jezik kako bi sprečili dalje kolapse.

Bagovi u Merge Queue sistemu i napadi na pretragu

Dva velika incidenta u aprilu 2026. godine dodatno su uzdrmala poverenje korisnika u stabilnost ove platforme. Prvi incident je pogodio merge queue operacije i doveo do nenamernog poništavanja commit-ova u preko 600 repozitorijuma. Iako nije bilo trajnog gubitka podataka stanje glavnih grana u pogođenim projektima bilo je potpuno netačno.

Drugi veliki pad sistema bio je direktno povezan sa Elasticsearch podsistemom koji pokreće funkcije pretrage i prikaza issue-a. Cluster je postao potpuno preopterećen usled verovatnog napada botneta što je onesposobilo korisnički interfejs za rad na projektima. Ovaj sistem još uvek nije bio potpuno izolovan kao kritična tačka neuspeha što je omogućilo da kvar jednog dela sruši širi spektar usluga.

Nova arhitektura i prelazak na multi cloud model

Strategija za budućnost uključuje potpunu promenu načina na koji GitHub obrađuje podatke i zahteve korisnika. Webhook servisi su već izmešteni iz MySQL baza na specifične backend sisteme kako bi se smanjilo opterećenje primarnih skladišta. Plan tima je da se izoluju svi kritični servisi kako kvar na jednom podsistemu ne bi mogao da izazove lančanu reakciju.

Pored migracije na Azure resurse kompanija aktivno radi na prelasku na multi cloud model rada. Ovakav pristup je neophodan da bi se postigla maksimalna otpornost i niska latencija koju zahtevaju moderni razvojni procesi. Poseban fokus biće stavljen na optimizaciju za velike monorepoze koji su postali dominantan trend u industriji softvera.

Veća transparentnost i statusi u realnom vremenu

Korisnici su jasno poručili da im je potrebna veća transparentnost tokom trajanja incidenata na mreži. GitHub je odgovorio ažuriranjem svoje statusne stranice koja sada uključuje precizne brojke o dostupnosti svih servisa. Cilj je da programeri u svakom trenutku znaju da li je problem na njihovoj strani ili je reč o globalnom kvaru.

Tim inženjera trenutno radi na novom dizajnu API interfejsa koji će omogućiti efikasnije skaliranje i rad. Detaljna analiza uzroka svih nedavnih padova biće javno objavljena kako bi zajednica imala uvid u preduzete korake. Transparentna komunikacija ostaje prioritet dok se platforma prilagođava novoj eri razvoja softvera uz pomoć veštačke inteligencije.

Napiši komentar

Iz ove kategorije