Der AWS-Ausfall erinnert uns daran, dass das Schicksal des Internets in den Händen einiger weniger liegt

Der AWS-Ausfall erinnert uns daran, dass das Schicksal des Internets in den Händen einiger weniger liegt

Zu dieser Zeit betreiben wir Websites von Privat- und Unternehmensservern aus, die sich oft in unseren Häusern und Büros befinden. Als das Internet wuchs, bauten wir Server-Racks, Standorte und Rechenzentren. Im Laufe der Zeit haben Unternehmen und Dienste aller Größen jedoch die Serverlast auf Cloud-Dienste von Drittanbietern verlagert, wie sie heute genannt werden.

Die Logik ist fundiert. Wir leben in Häusern, aber wir bauen unsere Häuser nicht physisch. Die Bereitstellung und Entwicklung von Websites ist für den von ihnen bereitgestellten Service nicht unbedingt erforderlich. Nun, es ist, als ob es ohne Server keinen Service gäbe. Aber der Server läuft über APIs, Skripte und andere Algorithmen und Programme, die vom Unternehmen entwickelt wurden, um Ihnen Dinge wie Ihren Netflix-Stream, Ihre Coinbase-Wallet-Kontodaten oder den nächsten potenziellen Tinder-Benutzer bereitzustellen.

Die Fähigkeit von Cloud-Diensten wie Amazon Web Services (AWS) und Microsoft Azure, bei ausreichender Bezahlung schnell zu wachsen (oder je nach Bedarf zu schrumpfen), macht sie zu einer intelligenten Geschäftslösung für jedes IT-Unternehmen jeder Größe. Man weiß zum Beispiel nie, wann aus einem kleinen Unternehmen ein Großunternehmen wird und wann es zehn statt fünfhundert Benutzer gleichzeitig bedienen muss.

Dies ist der offensichtliche Vorteil cloudbasierter Webdienste. Der Nachteil ist, was diese Woche mit AWS passiert ist.

AWS-Fehler

Riesige Teile von AWS fielen am Dienstagnachmittag auseinander. Das AWS Health-Dashboard bietet einen guten Überblick über den fast siebenstündigen Ausfall. Im Hintergrund handelte es sich, zumindest laut Amazon, nicht um einen Angriff, Hack oder Denial-of-Service-Angriff (DDoS). Es handelte sich um ein paar Fehlfunktionen von APIs in einer riesigen Dienstleistungsbranche.

Wir alle leben in Angst vor einem großen DDoS-Angriff oder einem Angriff, der diese Systeme (eigentlich jedes System, auf das wir angewiesen sind) durchbricht und in die Knie zwingt, was jedoch selten der Fall ist. Als Cloudflare im Jahr XNUMX ausfiel, wurde dies zunächst als Angriff auf ihr System angesehen. Wir stellten jedoch schnell fest, dass es sich lediglich um eine fehlerhafte Softwareimplementierung handelte, in erster Linie um einen menschlichen Fehler.

Obwohl sich der AWS-Ausfall auf die von Amazon so genannte „US-EAST-1-Region“ beschränkte, waren die Auswirkungen erheblich und weitreichend. Dies war auf verbraucherorientierten Plattformen wie Disney+ und natürlich auch auf Amazon.com und bestimmten Alexa-Diensten zu spüren.

Als ich den aktuellen Beitrag auf Twitter gepostet habe, war mir klar, wie viele Leute praktisch mit dem Kopf ins Gesicht schlugen und riefen: „Also war ich draußen!“

Mir kam der Gedanke, dass viele dieser Benutzer keine Ahnung hatten, dass AWS hinter ihren bevorzugten Benutzer- und Geschäftssystemen steckt. Darüber hinaus kennt niemand die genaue Zahl (außer Amazon), aber aktuelle Berichte behaupten, dass AWS Millionen von Menschen bedient. Microsofts Azure meldet auch Millionen von Benutzern und die meisten Fortune-XNUMX-Unternehmen. Google Cloud hat große Namen wie Verizon, NewsCorp und Facebook.

Muss sich etwas ändern?

Die weit verbreitete Nutzung von Cloud-Diensten ist keine schlechte Sache, obwohl der Mangel an Informationen zu Verwirrung und Fingerabdrücken führen kann, wie zum Beispiel bei dem Mann, der die Befehle auf seinem System nicht ändern konnte und mehrere Fehlermeldungen erhielt, die seine Systeme einem externen Händler vorwarfen. wie AWS).

Die Kombination aus der großen Reichweite von Cloud-Systemen und dem allgemeinen Mangel an Echtzeitinformationen und Feedback für betroffene Servicekunden gibt Anlass zur Sorge. Das Ausmaß eines Stromausfalls ist sicherlich besorgniserregend, insbesondere wenn man bedenkt, dass der nächste unvermeidbar ist.

Vorbei sind die Zeiten, in denen jemandes Server-Rack ausfiel und der Standort ausfiel. Wir haben jetzt kleine Ausfälle in großen Cloud-Systemen wie AWS, Axure und Cloudflare, die einen Tsunami von Ausfällen verursachen.

Jemand auf Twitter fragte: „Was ist mit der Skalierung und dem Lastausgleich passiert?“ „Das ist eine gute Frage. AWS basiert auf Hunderten separater Cloud-Server-Cluster und bietet jede Menge Redundanz, Skalierung und Lastausgleich. Und auch das reicht manchmal nicht aus. Komplexe Systeme können sich schlecht verhalten und sind besonders anfällig für Software-Updates, die kollidieren können.“ mit veraltetem Code Aufgrund der Tatsache, dass alle diese Cloud-Dienste, einschließlich AWS, so leistungsstark und verteilt sind, dass sie immer noch von fehlbaren Menschen programmiert, ausgeführt und gewartet werden.

Wie können wir also die Öffentlichkeit besser aufklären und, was noch wichtiger ist, AWS, Azure, Cloudflare und andere vor solchen Ausfällen schützen, die nicht nur zum Ausfall von Websites und Diensten, sondern auch zum Verlust von Millionen von Menschen führen? Amerikanische Dollar?

Vielleicht ist es an der Zeit, einen Schritt zurückzutreten und die Integrität und Sicherheit von Cloud-Systemen genau so zu untersuchen, wie wir Wassersysteme überwachen. Es scheint, dass keiner von ihnen zu groß ist, um zu scheitern, aber alle sind zu wichtig, um beschädigt, verletzt oder verloren zu werden.