Freitag, April 19, 2024

Das böse Büro

Uriel Fanellis Blog in deutscher Sprache

Uriel Fanelli

Die berühmte App, die Ihren Virus verfolgt. Mit Graphen. Quantum. Von der KI.

Seit Beginn der Pandemie der schlechten Gesundheit wurde das Problem der Rückverfolgung von Menschen als vorbeugende Methode der Epidemie zumindest haarig eingesetzt . Und alle, außer allen, haben darüber gesprochen, außer den beteiligten Technologen. Dass Technologen zum Schweigen gebracht werden, ist in einer postfaschistischen Welt normal, in der die Menschen immer noch an die Lügen von Gentile und Croce glauben, aber da es nicht einfach ist, sich zu beruhigen, habe ich jetzt mein Wort.

Gut. Angenommen, wir machen es. Morgen rufen sie mich an und sagen mir: "Machen Sie die App, die Benutzer rund um die Uhr verfolgt, damit wir die anderen unter Quarantäne stellen, wenn einer krank wird." Aha. Um es zu sagen, es scheint einfach. Gehen wir zur Aufschlüsselung dieser "Spezifikation".

Sprechen wir also über die Kapazität, ansonsten scheinen wir für INPS zu arbeiten. Wie viele dieser Apps möchten wir haben? Die Südkoreaner , die Guten, sagen, sie hätten es vor Ort getan, weil sie sich keine Sorgen um die Privatsphäre machen und gute Bürger sind, die sich ausspionieren lassen.

Ok. Aber nicht jeder hat ein Handy. Oder besser gesagt: Italien war das Land der Rekorde, das zuerst eine größere Anzahl von SIM-Karten als die Einwohnerzahl erreichte. Aber ich möchte denen helfen, die behaupten, es sei machbar, und so entfernen wir ältere Menschen, entfernen wir die Stoner wie Serra, die sich rühmen, kein Handy zu haben, und sagen wir, es gibt 30 Millionen. Die Hälfte der Bevölkerung. (Darunter zu gehen macht wenig Sinn: Wenn A B infiziert oder wir A oder B kennen oder überhaupt nichts wissen).

Gut.

Es geht darum, einen Logpoint mit dem Standort des Mobiltelefons zu sammeln. Wie oft sollten wir die Position einnehmen? Wenn wir glauben, dass wir Leute zur Arbeit schicken und die Leute mit der U-Bahn nach Mailand fahren, nehmen wir uns eine Minute Zeit. (Natürlich haben wir ein perfektes GPS, das auch in Innenräumen funktioniert). Ansonsten steigt man auf die Rolltreppe und ich verliere alle, die ihm nahe stehen.

Wenn wir den Logpoint also sofort senden, sind das 30 Millionen Logpoints pro Minute, was 500.000 Transaktionen pro Sekunde entspricht. Unsere Backend-Gateway-API sollte viel besser dimensioniert sein als der INPS-Server. Angenommen, die Daten werden JEDE STUNDE gesendet: Wir sammeln sie auf dem Mobiltelefon und senden sie stündlich. Aha. Wir sind bei 8334 TPS. Nachhaltiger. Die Anzahl der Logpoints und die E / A ändern sich jedoch kaum. Lagerung.

Wie lange müssen wir die Daten aufbewahren, dh wie lange müssen wir eine Person überwachen? Wir sagten, wenn ich mich nicht irre, 12 Tage "intakte Asymptomatizität". Wir haben viele Logpoints, 518.400.000.000. Es ist nicht unmöglich, weil wir Liebhaber von Teradata, Cloudera & Co. sind. Wenn wir die Anweisungen der toskanischen Ars verwenden, gibt es 14, aber die Datenmenge ändert sich wenig

Um die Hardware zu kaufen und etwas von Grund auf neu zu montieren, träumen wir davon, denn die Hardware zu haben, sie zu montieren, Energie, USV, Netzwerk, Kühlung und alles zu haben, dauert Wochen, wenn nicht Monate. Nachdem wir die Option auf der grünen Wiese aufgegeben haben, müssen wir etwas Vorhandenes verwenden.

Wir müssen uns also fragen, an wen wir die Daten verkaufen. Nehmen wir auch an, ein lokales Telekommunikationsunternehmen verfügt über die gesamte Hardware, die Sie benötigen, und wir vermieten sie an diese. Gut. Andernfalls müssen wir einen Azure-Mandanten, Amazon, Google usw. kontaktieren.

Gut. Jetzt, da wir wissen, wo wir es platzieren sollen, müssen wir die Logik dafür schreiben. Unser Job sollte also:

  • Für eine Person, die krank wurde (IMSI, MSISDN, was auch immer).
  • Gehen Sie zurück und suchen Sie nach allen, mit denen er Kontakt hatte .

Erste Frage: Was ist "Kontakt"?

Wir verwenden immer die Definition von toskanischem ARS.

Wenn wir alle diejenigen nehmen, die 15 Minuten lang weniger als zwei Meter passiert haben (nehmen wir an, das GPS fährt auch mit der U-Bahn, drinnen bei der Arbeit und praktisch überall. Und das hat die Präzision eines Meters. Töte diesen Satelliten), wenn dies der Fall ist '12 Tage hintereinander in die U-Bahn gefahren (sagen wir 10, weil dazwischen ein Wochenende liegt), sind wir fertig. Und wenn wir jemanden finden, der zur Arbeit gegangen ist, wird seine Firma dann gestoppt? Es ist als "Kontakt" zu betrachten: Laut Definition war er in einer geschlossenen Umgebung mit ihm, sagt ARS Toskana. Was beginnt kompliziert zu werden, nicht wahr?

Oder besser gesagt, nein: Wenn wir am Anfang der Infektion stehen und ungefähr zehn Fälle haben, ist dies schnell erledigt. Wenn wir in Italien sind und bereits mehr als einhunderttausend haben und sie zur Arbeit schicken, hätte die öffentliche Verwaltung Millionen und Abermillionen von Menschen in die vorbeugende Quarantäne gebracht.

Er sollte eine Liste von 2 oder 3 Millionen Menschen erhalten und sie dann alle erreichen und ihnen sagen, dass sie unter Quarantäne gestellt werden sollen. Alternativ sollten sie abwischen. Aha. Schade, dass 2 oder 3 Millionen Tampons nicht da sind: Quarantäne und das wars.

Also gut, fügen wir unserer APP einen Alarm hinzu, der Ihnen sagt, dass Sie unter den vermuteten Infektionen ausgewählt wurden, weil Sie mit einem Infizierten die Wege gekreuzt haben. Komm nach Hause und wage es nicht auszugehen. " Und da es nicht genug Tampons gibt, muss er zu Hause bleiben und hoffen.

Wir schreiben also eine App, die für den Fall, dass ein Mann X krank ist, die Firma schließt, für die er gearbeitet hat, jeden benachrichtigt, der mit ihm lebt, und jeden, der mit ihm gereist ist.

Ich bin kein Soziologe oder Psychologe, also möchte ich nicht wissen, was diese Millionen von Menschen, die diese Warnung erhalten, tun würden. Konzentrieren wir uns also auf diesen Algorithmus:

  • Für jeden Infizierten (IMSI, MSISDN, was auch immer)
  • Suchen Sie nach all jenen, die in den letzten 12 Tagen, weniger als zwei Metern und länger als 15 Minuten mit ihm in Kontakt waren, ODER nach jenen, die länger mit ihm in einer geschlossenen Umgebung waren, auch wenn mehr als zwei Meter).

Aber jetzt haben wir ein Problem: 12, 14 Tage Zeit. Ein Mann hat einen anderen infiziert, der nach ein paar Tagen ansteckend wird. Wenn also 4 Tage vergangen sind, müssen wir einen weiteren Schritt tun: nicht nur alle, die Tizio getroffen haben, sondern alle, die diejenigen getroffen haben, die einen Typen getroffen haben.

Wenn wir am Anfang der Pandemie stehen und Dutzende von Fällen haben, sind wir mit einigen tausend freiwilligen Quarantänen vor Ort. Wenn wir bereits im Begriff sind, einhunderttausend zu haben, erhalten wir auf diese Weise einen durchschnittlichen exponentiellen Trend. Dies sollte uns nicht überraschen, denn wir haben nicht an eine sehr einfache Sache gedacht: WIR SCHREIBEN EINE SIMULATION DER PANDEMIE. Und wenn die Ansteckung exponentiell verläuft, zieht der Algorithmus eine exponentiell zunehmende Anzahl von Namen heraus.

Gut. Geben wir also die Spezifikationen unseren Funkenexperten, und wir haben so etwas.

  • Für jeden Infizierten (IMSI, MSISDN, was auch immer)
  • Suchen Sie nach all jenen, die in den letzten 12 Tagen, weniger als zwei Metern und länger als 15 Minuten mit ihm in Kontakt waren, ODER nach jenen, die länger mit ihm in einer geschlossenen Umgebung waren, auch wenn mehr als zwei Meter).
  • Berechnen Sie für jeden Verdächtigen, wie lange es her ist, dass der Kontakt aufgetreten ist, und teilen Sie ihn durch zwei Tage, um einen Rekursionsfaktor n zu erhalten.
  • Iterieren Sie den Algorithmus n-mal für jeden Verdächtigen der Stufe n.

Wie wächst dieses Zeug? Was ist Rechenkomplexität? Nun, es wird von der durchschnittlichen Anzahl der getroffenen Personen und der durchschnittlich verstrichenen Zeit sowie von blablabla abhängen. Aber warum berechnen wir es: Wir haben bereits die Formel und es ist das übliche Exponential mit einem R0 von 2,5. Wir schreiben eine Simulation der Epidemie, oder? Wir wissen also bereits, wie diese Zahl wachsen wird. Wir brauchen keine Beweise, wo Sie nur denken müssen .

Die Anzahl unserer Simulationen wächst also ebenso wie die Anzahl der Epidemien. Wenn wir also wie in Korea sind und am Anfang stehen, gibt es kein Problem, wir stoppen die Epidemie, wenn wir ein paar hundert, vielleicht Tausende von Fällen sind.

Wenn wir uns jedoch bereits in der aktuellen Situation befinden und Hunderttausende von Infizierten infiziert sind, beauftragen wir die APP auch, infizierte Personen zu warnen, in Quarantäne zu Hause zu bleiben (und gehen Sie daher NICHT einmal zum Einkaufen oder zur Arbeit ), um die öffentliche Verwaltung nicht zu überfluten, würden wir innerhalb von 12, 14 Tagen Millionen von Menschen alarmieren.

Und sie sind keine gewöhnlichen Menschen: Es sind hauptsächlich diejenigen, die zur Arbeit gehen, und diejenigen, die auf einer Fahrt von mehr als 15 Minuten die öffentlichen Verkehrsmittel benutzen. Im Grunde genommen würden wir also städtische Transportmittel treffen, die Häuser sehr großer Familien und Arbeitsplätze.

Und hier ist, dass unser Algorithmus unnötig komplex und teuer wird und personenbezogene Daten überproportional verwendet.

Warum sage ich unnötig belastend? Denn bei so vielen Infizierten wäre es möglich, ohne Beibehaltung der Benutzerdaten die Orte zu berechnen, an denen die Infektionen auftreten, und alle Orte des gleichen Typs zu schließen, ohne die Benutzerdaten beizubehalten.

Aber wir wollten den Schaden abmildern, oder? Sicher. Und es ist für einige Kranke möglich, dies zu tun. Wenn Sie jedoch hunderttausend Kranke in der Nähe haben, ist es nicht sinnvoll, nach einer großen Anzahl zu suchen: Es lohnt sich mehr, die Orte zu finden, an denen diese Kontakte stattfinden, und sie im Voraus zu schließen.

Nur in sehr wenigen Fällen ist eine solche App sinnvoll.

Und selbst in diesem Fall gibt es jetzt ein kleines Problem. Denn wenn es ein paar Dutzend Fälle gibt, haben wir eine geringe Prävalenz. Und um eine niedrige Prävalenz zu stoppen, reichen 30 Millionen Mobiltelefone NICHT aus. Verwenden Sie einfach die Stichprobenschätzungsformel, um zu verstehen, dass, wenn wir 10.100 von 60 Millionen Fällen abfangen möchten, die "Stichprobe" unserer Schätzung katastrophal hoch wird und wir in der Praxis ALLE, ALLE Male verfolgen müssen.

Lassen Sie uns noch einmal zusammenfassen: Damit die Strategie funktioniert und wir das Leben so lassen können, wie es ist, und NUR die Kranken stoppen, ist Folgendes erforderlich:

  • Kommen Sie zum Beginn der Pandemie.
  • ALLE Bürger werden verfolgt, nicht nur die Hälfte oder die meisten.
  • Die Menschen isolieren sich auch zu Hause (aber wenn sie wenige sind, bringen wir sie ins Krankenhaus, ist das sinnvoll).

So funktioniert es im Fall von Südkorea. Wer das System wahrscheinlich bereits vor Beginn der Infektion erstellt hat: Um Dinge zu programmieren, API-Gateways zu erstellen usw., müssen heldenhafte Programmierer und skalierbare Infrastruktur und Speicher vorhanden sein. ein paar Wochen, vielleicht drei. Koreaner gingen wahrscheinlich zur Arbeit, sobald die Chinesen das Problem meldeten.

Wenn Sie HEUTE zufällig in Europa ankommen, können Sie dies nicht tun, da wir zu spät ankommen. Dann gibt es einen weitaus effektiveren Algorithmus, dh eine "Partikel" -Methode, die der für die Berechnung von verwendeten Methode ähnlich ist Flüssigkeiten.

  • Eine geringere Anzahl von Mobiltelefonen wird verwendet.
  • Es wird beobachtet, an welchen Stellen die Patienten verdächtige Kontakte hatten.
  • Die fraglichen Orte sind geschlossen und alle Orte des gleichen Typs. (oder disziplinieren Sie sie wie bei Supermärkten)

Diese Methode ist rechnerisch einfacher, erfordert weniger nachverfolgte Personen, erfordert KEINE persönlichen Daten (wir identifizieren Orte) und meldet insbesondere infiziertes Personal in Krankenhäusern, infizierten Seniorenheimen und anderen Ausbrüchen sehr gut.

Die Moral der Geschichte ist sehr einfach: Wenn Sie mit hunderttausend und mehr Infizierten spät ankommen, ist die Methode zur Verfolgung von Personen komplexer als die Methode zur Identifizierung der gefährlichsten Orte .

Der Nachteil ist, dass die REALEN Probleme auftauchen: Krankenhäuser mit Krankenschwestern, als Lager genutzte Erholungsheime, städtische Transportmittel (früher zur Arbeit gegangen) und viele, aber viele Unternehmen.

Genau das, was Sie NICHT wissen wollen. Es wäre nützlich zu wissen, aber wir bevorzugen einen Ansatz, der jetzt zu spät ist, um effektiv eingesetzt zu werden .

Ich bin kein Fan von Verschwörungstheorien, aber JETZT aufzuspüren ist meiner Meinung nach nur ein Versuch, die Einstellung der Menschen zur Rückverfolgung zu ändern. " Heute verfolgt zu werden ist gut ", sagen sie uns.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert