Facebook og Instagram ramt af stort nedbrud

Illustration: Screendump
De store sociale medier, Facebook og Instagram, er ramt af nedbrud i både USA og Danmark og sandsynligvis i flere lande.

Facebook og en række apps fra koncernen bag det sociale medie, Instagram samt beskedtjenesterne WhatsApp og Messenger, er ramt af et større nedbrud mandag aften.

Det sociale netværk og de tilknyttede apps begyndte at vise fejlmeddelelser - eller loader ikke indhold som de skal - tidlig mandag aften, lyder det fra flere brugere.

Det var mange flere tjenester end Facebook og Instagram, der blev ramt af gårsdagens nedbrud. Her er det tjenesten Downdetector.com omkring kl. 18.30, der viser brugerrapporterede problemer på en lang række sites. Illustration: Skærmdump/Version2

Ifølge webstedet downdetector.com, der overvåger webtrafik og aktivitet på websites, opstod problemerne omkring kl. 17:30 dansk tid på samtlige tjenester - Facebook, Instagram, WhatsApp og Facebook Messenger.

Det er ikke ualmindeligt at digitale tjenester kortvarigt er ramt af fejl, men det er sjældent, at så mange sammenkoblede apps hos verdens største sociale mediekoncern går ned. Der er således heller ingen meldinger om årsagen til problemerne eller om en løsning er på vej.

Facebook-koncernen har ifølge New York Times i årevis arbejdet på at integrere den underliggende tekniske infrastruktur bag Facebook, WhatsApp og Instagram.

To ansatte i Facebooks sikkerhedsteam oplyser til det amerikanske avismedie, at det er usandsynligt, at der er tale om et cyberangreb. Det skyldes, at teknologiplatformene bag Facebooks tjenester stadig er tilstrækkeligt dekoblede til, at et hackerangreb sandsynligvis ikke kan påvirke dem alle på én gang.

Udvikler Søren Pedersen har haft uploaded et retweet af nogle observationer om nedbruddet, se nedenfor:

Illustration: Screendump Søren Pedersen

Skriv gerne dine observationer omkring nedbruddet, der kan belyse detaljer om hændelsen, eller årsager til den.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Følg forløbet
Kommentarer (28)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
#1 Søren Larsen

"To ansatte i Facebooks sikkerhedsteams oplyser til det amerikanske avismedie, at det er usandsynligt, at der er tale om et cyberangreb. Det skyldes, at teknologiplatformene bag Facebooks tjenester stadig er tilstrækkeligt dekoblede til, at et hackerangreb sandsynligvis ikke kan påvirke dem alle på én gang."

Faktum er at deres DNS records ikke er tilgængelig. Hvad det end er der har ramt dem, er de da ikke tilstrækkeligt dekoblede til at det ikke kunne ramme alle tjenester på én gang, så hvordan man kan konkludere at det ikke er et angreb, forstår jeg ikke.

  • 2
  • 4
#3 Thomas Adams

Et hurtigt opslag viser at facebook.com bruger disse navneservere.

Name Server: A.NS.FACEBOOK.COM Name Server: B.NS.FACEBOOK.COM Name Server: C.NS.FACEBOOK.COM Name Server: D.NS.FACEBOOK.COM

Hvis SOA er forsvundet, så kan man vel ikke lavet et lookup på A.NS.FACEBOOK.COM så den kan fortælle hvor facebook.com peger hen? :)

Det virker som en klassisk måde at skyde sig selv i foden på...

  • 1
  • 1
#7 Poul-Henning Kamp Blogger

Men så lang tid kan det vel ikke tage at få BGP routes op igen - eller?

Der er rygter om at der er gået keystone-cops i den: Dem der ved hvordan man fixer BGP har ikke direkte adgang til at logge på routerne, dem der kan logge på routerne kan ikke komme igennem til dem og fysisk adgang er åbenbart "collateral damage" lige nu.

Når jeg bliver diktator, bliver det lovfæstet at grundlovsdag skal alle computere der ikke direkte holder nogen i live være fysisk slukkede fra 11:30 til 13:30, så folk faktisk får styr på koldstart.

  • 20
  • 1
#8 Michael Cederberg

Oh what a fragile web we weave ...

... det her er kun begyndelsen. Efterhånden som vi spinder vores arbejdsprocesser ind i IT og vores IT bliver spundet ind internettet og alle dets services, så bliver vores verden blot mere skrøbelig. Det er naturligvis ironisk eftersom ARPANET oprindeligt blev designet til at være robust sådan at det kunne fungere selv hvis dele af nettet blev udslettet.

  • 7
  • 0
#13 Christian Nobel

Oh what a fragile web we weave ...

... det her er kun begyndelsen.

Det viser jo desværre hvor kollektivt dumme vi er ved at blive.

Man kan sige at sålænge det kun er den stinkende mudderpøl der er nede, så er det en gevinst, men alt er jo, som du siger, vævet ind i edderkoppens spind.

Når (og ikke hvis) det store nedbrud kommer, så må man håbe at menneskeheden lærer bare lidt, når der skal ryddes op i ruinerne.

  • 3
  • 0
#15 Michael Cederberg

Resten af internettet virker da fint, som designet vil jeg sige. Bare fordi en bombe rammer en del (Facebook) så køre resten videre.

Det var ment som en mere generel kommentar.

Denne gang var det facebook og alle der depender på facebook authentication fik et problem. Næste gang er det amazon. Eller google. Eller også finder nogen ud af at pille ved BGP (på måder jeg ikke forstår) sådan at dansk internet traffik ender i langbortistan og så stopper mange virksomheder med at fungere. Eller der findes et hul i cisco's firewalls der gør at alle er nødt til at tage strømmen indtil et patch er klart ...

Vi har gjort os meget sårbare selvom internettet egentligt er designet til ikke at være det. Vi har gjort os sårbare fordi der er dukket så mange dependencies op på tværs af internettet. IP er stadigvæk meget robust. Det er bare alt det vi har bygget ovenpå der ikke er det.

Russerne lavede for et par år siden en internet-unplug hvor de testede hvad der skete hvis nogen cuttede forbindelsen (det kunne både være russerne eller fremmede magter). Det er på tide at vesten, Danmark og diverse virksomheder tester det samme.

  • 7
  • 0
#18 Henrik Kramselund Jereminsen Blogger

Det er naturligvis ironisk eftersom ARPANET oprindeligt blev designet til at være robust sådan at det kunne fungere selv hvis dele af nettet blev udslettet.

Det er en myte at internet er designet til at modstå atomangreb

Der var dog forskning igang på RAND omkring Telefon netværk som havde disse ting under behandling

fra mit speciale: The evolution of the Internet is an interesting and long story, and the roots can be traced as far back as to notes written by J.C.R. Licklider of MIT in August 1962 [Leiner, 2000]. The first reference to the architecture we call the TCP/IP Reference Model can be found in the historical document A protocol for Packet Network Interconnection, [Cerf and Kahn, 1974].

Regarding the design and goals of the Internet Protocols, and the family of protocols, there is a lot of misconception. One such rumor says that the ARPANET and protocols were designed to withstand a nuclear attack - which is why it is designed without a single controlling entity. This rumor is believed to be caused by the parallel work done at RAND 1 involving design of networks for transmission of secure voice communications for the US military. The work carried out was done in parallel, and the researchers were unaware of each other during the 1960s where the work was carried out [Leiner, 2000]. The RAND document describing attacks on infrastructure is part of the RAND series On Distributed Communications Networks, [Baran, Paul, et al.].

  • 1
  • 0
#19 Kjeld Flarup Christensen

Undrer mig de ikke har bagdørs adgang via konsol/serial port via et separat netværk..

Det har de.

Men de har også adgangskontrol på den slags ting.

...adgangskontrol som forudsætter at deres systemer er oppe.

Jeg så sådan en tingest på EoT messen https://www.bifrostconnect.com/

Det kræver kun at der er en person on site, som kan gå ind og sætte den på konsolporten, og trykke på en knap. Så opretter den forbindelsen via GSM.

Jeg tror Facebook ville have givet en arm for sådan en i går.

  • 1
  • 0
#20 Sune Marcher

Det kræver kun at der er en person on site, som kan gå ind og sætte den på konsolporten, og trykke på en knap. Så opretter den forbindelsen via GSM.

Jeg tror Facebook ville have givet en arm for sådan en i går.

Det kræver at de kan komme ind i rummet.

Der var rygter om at de havde fysisk-adgang problemer fordi de bruger Internet of Trash låse, der var på samme netværk som alt det andet der ikke virkede...

  • 3
  • 0
#22 Steffen Schumacher

...adgangskontrol som forudsætter at deres systemer er oppe.

Mener du på konsoludstyret, eller selve routeren der skal tilgås via konsollen?

Hvis #1, så er det netop det smarte ved digis løsning - udover man kan bruge auth via egen radius etc, så kan man også altid (forudsat der er internet adgang uafhængigt af produktions infra) logge på dem via digis cloud løsning og tilgå konsolporte den vej og helt uafhængig af noget lokalt og også selvom de sidder bag NAT(PAT). Det kan så selvfølgelig være at det er for meget tillid at have til eg. digi for nogle, men der vil jo normalt stadig være beskyttelse af selve routerne på konsolen.

Hvis #2, så har alle de vendors jeg har arbejdet med altid haft mulighed for at falde tilbage til et lokalt konfigureret user/password hvis tacacs/radius etc ikke er tilgængelig - det kan selvfølgelig også være en fejlconfig her. Derfor burde det normalt være muligt logge på hvis ellers man kan nå ind i konsoludstyret.

Der er nok meget sjældent nogen der har et separat OOB/Aux LDAP/AD til hvis det første smelter/bliver utilgængeligt, og det vil nok heller ikke virke super godt i praksis da folk glemmer passwords eller kontoer bliver lukket grundet inaktivitet etc.. men hvis ikke man vil stole på fx. digi så er det det man er nød til.

  • 0
  • 0
#24 Baldur Norddahl

Jeg synes folk undervurderer hvor omfattende det kan være at få et netværk i Facebooks størrelse online igen. Hvis et script har slettet opsætningen, så er det langt fra nok at etablere adgang til systemet. Teknikkerne kan ikke finde på en ny opsætning og må først have adgang til en backup. Dernæst kan det være tricky at finde ud af i hvilken rækkefølge det skal indlæses og et ton af andre tekniske problemer, som vi udefra ikke har mulighed for at kende til.

Bare tænk på hvor mange routere og switche der er world wide i Facebooks datacentre. At logge ind på dem alle manuelt er uoverkommelgt. Antallet af teknikkere med adgang og knowhow er sat efter at skibet sejler fuldautomatisk. Det har været nødvendigt at få et automatisk system til at rette fejlen.

  • 7
  • 0
#25 Michael Cederberg

Det er en myte at internet er designet til at modstå atomangreb

Men jeg tror vi kan blive enige om at hvis et IP netværk er sat fornuftigt op så kan man opnå god fejltolerance. Dit (selv)citat modbeviser ikke at det var et designmål - det siger blot at ARPANET ikke var først. Alas, jeg er ikke IT historiker. Pointen var mere at det er meget sværere med de services der kører ovenpå IP og af samme grund er de færreste fejltolerente.

  • 0
  • 0
#26 Steffen Schumacher

@baldur Hvorfor tror du at alt config er wipet på alt udstyr? Disgruntles employee + ansible eller hvad tænker du? Meget udstyr har lokale config backups, så fx juniper ville være lette at rulle tilbage til forrige config hvis der ellers er adgang til konsollen og det blot er en configbøf. Men der var skriveri om at det de rigtige folk ikke kunne få adgang, så jeg tror mere det handler om adgang til konsol, eller at auth også gik ned..

  • 0
  • 0
#27 Baldur Norddahl

Meget udstyr har lokale config backups, så fx juniper ville være lette at rulle tilbage til forrige config hvis der ellers er adgang til konsollen og det blot er en configbøf.

Det ville måske virke for en lille biks men Facebook er massivt. Det er simpelt ikke realistisk for et lille team af operatører at logge ind på tusinder af switche og routere for at lave en manuel tilbagerulning.

Alt er gætterier på nuværende tidspunkt. Jeg kan sagtens forestille mig at det har været mere effektivt at fikse det automatiske system. Og så manuelt få lige præcis nok online til at automatikken kan komme ind og lave resten.

  • 1
  • 0
Log ind eller Opret konto for at kommentere