bug

#13: Fast genau richtig

Im zweiten Golfkrieg bemerkte man, dass das Raketenabwehrsystem Patriot bei langer Betriebszeit zunehmend ungenau wurde. Das führe 1991 dazu, dass eine feindliche Scud-Rakete nicht abgefangen wurde und in der Folge 28 Personen starben.

Die Untersuchung zeigte, dass das Problem ein Rundungsfehler war, der mit steigender Betriebsdauer immer größer wurde. Ursprünglich war das Patriot System nie für lange Einsätze konzipiert worden. Als mobiles System, sollte es immer nur für wenige Stunden am gleichen Ort sein.

Durch die Bedrohungslage im zweiten Golfkrieg setzte man das System nun unter völlig anderen Bedingungen ein. Leider schenkte man diesen geänderten Rahmenparametern zu wenig Beachtung, um den folgenschweren Fehler zu verhindern.

#9: Amazing Grace

Grace Hopper wird oft zugeschrieben, dass sie den Begriff „Bug“ für einen Softwarefehler geprägt hat. Das ist so nicht ganz korrekt. In dieser Folge erzähle ich, was es mit der Geschichte auf sich hat und wer Grace Hopper war.

Die Geschichte vom ersten Bug ist nur eine von vielen Anekdoten im Leben einer außergewöhnlichen Frau. Amazing Grace, wie sie damals genannt wurde, entwickelte den ersten Compiler und legte damit den Grundstein für die Art, wie wir heute Computer programmieren.

#4: Das Jahrtausend-Ding

Das Jahr 2000 war etwas ganz Besonderes. Nicht nur, dass es irgendwie nach Science Fiction aussah, wenn die Jahreszahl plötzlich mit 2 statt mit 1 begann. In den Tiefen unserer IT-Systeme schlummere ein Fehler aus den Urzeiten der Computer. Damals wurde nämlich wegen knappem Speicher die Jahreszahl nur mit zwei anstatt mit vier Ziffern gespeichert. Was würde denn geschehen, wenn der Zähler von 99 auf 00 umspringt? Würde das unsere Technik ins Jahr 1900 zurückkatapultieren?

Glücklicherweise blieb damals die große Katastrophe aus. Aber man kann in der Retrospektive viel aus dieser Geschichte lernen, zum Beispiel den adäquaten Umgang mit Legacy-Systemen.

#3: Bad Units on Mars

Der Weltraum, unendliche Weiten. Wir schreiben das Jahr 1999. Dies sind die Abenteuer des Mars Climate Orbiter, der seit 286 Tagen auf seiner Reise zum Mars ist. Doch am Ziel angekommen reißt der Kontakt ab und die Sonde verglüht wahrscheinlich in der Atmosphäre des roten Planeten. Die Mission ist verloren. Grund dafür ist ein Fehler bei der Berechnung der Flugbahn. Die Systeme nutzen nämlich unterschiedliche Einheiten. Während die NASA mit metrischen Einheiten rechnet, verwendet der Hersteller der Sonde imperiale Einheiten. Ein kleiner Fehler mit großen Folgen.

#2: Error Inside

Beim Pentium FDIV-Bug kam es bei bei manchen Gleitkommadivisionen zu Ungenauigkeiten. Obwohl der Fehler relativ selten war und für die meisten Leute keinerlei Auswirkung hatte, entwickelte sich die Sache damals für Intel in ein PR-Desaster. Das lag nicht zuletzt am schlechten Umgang mit den öffentlichen Meinungen.

Begleitet mich heute auf eine Reise in die 90er, lernt die Ursprünge der Firma Intel und die kurze Geschichte der x86 Prozessoren kennen und findet heraus, welches große WTF für die fehlerhaften Divisionen im Pentium verantwortlich war.

Achtung: Nach dieser Folge habt ihr eventuell große Lust, in die Tiefen des Internets abzutauchen und euch Details zu alten Prozessoren durchzulesen. In dem Fall: einfach machen.

#1: A Knightmare on Wall Street

Die Geschichte von Knight Capital mutet wie ein Best-of von Bad Practices in der Softwareentwicklung an. Viele Jahre hat das Unternehmen Glück. Aber an diesem schicksalhaften 1. August 2012 wird eine Kettenreaktion in Gang gesetzt, die das Unternehmen in nur 45 Minuten einen Verlust von 460 Millionen Dollar beschert.

Ich verzichte bei dieser Geschichte auf die meisten Fachbegriffe aus der Finanzwelt. Das spare ich mir für Wolfgangs Börsen-Podcast auf. Außerdem rechne ich durch, wieviele Sekunden Jeff Bezos arbeiten muss, um mein Gehalt zu übertreffen.

Erkenntnis der Folge: Wenn man sich direkt am Anfang der Recherche verliest und statt „Peg“ versehentlich „Pug“ liest, so bekommt man diesen Mops nicht mehr aus dem Kopf.

#0: Hello World – Eins oder Null, das ist hier die Frage!

Da der erste Schritt bekanntlich der schwerste ist, fange ich einfach mit dem nullten Schritt an. Ich erzähle etwas über das Konzept von Digitale Anomalien und über meinen Background. Am Beispiel vom Off-by-one-Bug erkläre ich, wie und warum Fehler in Programmen auftreten und wie eine vernünftige Fehlerkultur hier helfen kann.

Und weil ich das Prinzip vom Hauptspeicher mit MS-Excel verglichen habe, werde ich höchstwahrscheinlich in der Computer-Hölle landen und für die nächsten 1000 Jahre Solitär auf einem alten Computer mit Windows 3.11 spielen müssen.