Wenn Weltraumpartikel das Smartphone abstürzen lassen
Mit der fortschreitenden Miniaturisierung der Schaltkreise wächst nach einer Studie die Gefahr, dass elektronische Systeme durch Single Event Upsets (SEU) gestört werden
Wenn der Computer abstürzt oder das Smartphone einfriert und man die Maschine neu starten muss, geht wohl jeder davon aus, dass dies Hersteller oder das Betriebssystem verschulden. Bharat Bhuva, Elektroingenieur-Professor an der Vanderbilt University, wo er in der Radiation Effects Research Group arbeitet, ist allerdings anderer Meinung. Wie er letzte Woche auf dem Jahrestreffen der American Association for the Advancement of Science in Boston sagte, ist die Ursache oft das Weltraumwetter, d.h. elektrisch geladene Partikel, die mit der kosmischen Strahlung von der Sonne oder aus dem Weltraum auf die Erde gelangen.
Das sei "wirklich ein großes Problem", meint Bhuva, auch wenn dies der Allgemeinheit meist verborgen bliebe. Die kosmische Strahlung besteht aus hochenergetischen Primärteilchen, meist Protonen, die beim Aufprall auf die irdische Atmosphäre in "Kaskaden von Sekundärteilchen" (Neutronen, Myone, Pione, Alpha-Teilchen) zerfallen. Millionen dieser Sekundärteilchen treffen jede Sekunde auf den Körper auf, aber wir können diesen subatomaren Wind nicht wahrnehmen, der überdies für den Menschen nicht schädlich zu sein scheint.
Ein Teil dieser Teilchen ist jedoch, so Bhuva, derart energetisch aufgeladen, dass diese die mikroelektronischen Schaltkreise beeinflussen und mitunter einzelne Datenbits im Speicher verändern. Das nennt man einen Single Event Upset (SEU), der vorübergehend zu einer Störung des Systems führen kann. Da es aber zu keinen dauerhaften Schädigungen führt, spricht man auch von einem Soft Error. Das ist bekannt, weswegen versucht wird, die Halbleiterbauteile etwa durch eine Ummantelung zu schützen, oder Vorkehrungen für Fehlerkorrekturen zu treffen.
Ganz harmlos sind diese Soft Errors nicht immer. Bhuva weist beispielsweise ausgerechnet auf einen Fehler in einer elektronischen Wahlmaschine 2003 in Belgien hin, wo durch eine Veränderung eines einzelnen Bits 4.096 zusätzliche Stimmen hinzugefügt wurden. Auf den Fehler stieß man nur, weil der Kandidat dadurch mehr Stimmen erhielt, als möglich war. So können also nicht nur etwaige russische Hacker, sondern auch das Weltraumwetter Wahlen manipulieren. In einem anderen Fall ist durch einen solchen "Single Bit Flip" 2008 der Autopilot eines Flugzeugs stehengeblieben. Das Flugzeug fiel innerhalb von 23 Sekunden mehr als 200 Meter ab, wodurch ein Drittel der Passagiere verletzt wurde. Und es gebe eine Reihe von unerklärten Fehlern in Computern von Fluggesellschaften, die zur Absage von Hunderten von Flügen geführt hätten und auf SEUs zurückgehen könnten.
Allerdings sei es schwer festzustellen, wie häufig SEUs vorkommen, sagt Bhuva. Es ist nicht vorhersehbar, wann die Partikel auftreffen, die ja überdies keinen physischen Schaden verursachen. Zudem könne ein EU-Vorkommnis zahlreiche Ursachen haben: "Es kann ein Softwarefehler oder eine Hardware-Schwäche sein. Man kann nur dann einen SEU feststellen, wenn man alle anderen Ursachen ausschließt."
Je kleiner die Schaltungen werden, desto weniger Energie ist erforderlich, um ein Bit von 0 auf 1 oder von 1 auf 0 zu schalten
Untersucht wurden vom Team von Bhuva im Auftrag von großen Chipherstellern zuletzt die in Chips verwendeten, nur 16 Nanometer großen 3D-Transistoren (FibFET). Die Hersteller seien beunruhigt, da das Problem zunimmt, wenn die Transistoren immer kleiner werden und die Leistung der Systeme sich vergrößert: "Mikroelektronische Schaltungen sind überdies überall und unsere Gesellschaft wird zunehmend von ihnen abhängig." Je kleiner die Schaltungen werden, desto weniger Energie ist erforderlich, um ein Bit von 0 auf 1 oder von 1 auf 0 zu schalten, weswegen bei einem Auftreffen eines geladenen Teilchens häufiger dazu kommt. Andererseits hat sich wegen der Miniaturisierung die Trefferhäufigkeit verringert.
Die Wissenschaftler setzten integrierte Schaltungen einem Neutronenstrahl aus und erforschten, wie viele SEUs in den Chips zustande kamen. Gemessen wird in FITs (Failure in Time), wobei ein FIT einen Fehler in einem Transistor in einer Milliarde Betriebsstunden bedeutet. Da sich in vielen Geräten Milliarden von Transistoren befinden und es Milliarden von elektronischen Systemen gibt, würde sich das extrem schnell addieren. In der Regel liegt die Fehlerrate zwischen 100 und 1000 FITs.
Die Untersuchung habe bestätigt, dass es "ein ernsthaftes und zunehmendes Problem" sei, sagt Bhuva, ohne allerdings Genaueres über diese zu sagen, da die Vanderbilt-Studien proprietär, also Geschäftsgeheimnisse, sind. Dass es auch auf der Erde ein Problem darstelle, habe man bereits anhand von Untersuchungen über die Strahlungsauswirkungen bei militärischen Anwendungen und in der Weltraumtechnik gesehen. Bhuva relativiert die Gefährdung aber wieder, da die neuen 16-Nanometer-Schaltungen mit der 3D-Architektur deutlich weniger störanfällig seien wie die vorherigen Generation der 2D-Architektur. Allerdings steige die SEU-Fehlerrate weiter an, da immer mehr Transistoren verwendet werden.
Die Systeme wirklich vor den Partikeln zu schützen, sei aufwendig. Damit kein Partikel durchdringen könne, wäre eine drei Meter dicke Betonummantelung erforderlich, aber man könne die Störungsanfälligkeit bei wichtigen Systemen deutlich durch Redundanz verbessern, indem Prozessoren dreifach angelegt werden und ihre Ergebnisse ausgewertet werden. Wenn zwei Prozessoren zum selben Ergebnis, kann dies als richtiges gewertet werden, da es äußerst unwahrscheinlich ist, dass sich in zwei Prozessoren gleichzeitig ein SEU ereignet. Das würde die Nasa machen, um die Zuverlässigkeit der Computer im Weltraum zu maximieren.
Bis auf die Unterhaltungselektronik würde aber das Problem in den meisten Branchen wie in der Luftfahrt, bei medizinischen Geräten, in der IT oder in den Finanz- und Energieunternehme ernst genommen. Es sei zwar ein großes Problem für die Industrie und die Ingenieure, "aber die Allgemeinheit muss sich darüber keine großen Gedanken machen". Es sei denn eben, der Computer stürzt mal wieder wegen dem Sonnenwind ab.