Fortælling/Aprilsnar2012

Fra DDHFwiki
Skift til: navigering, søgning

Email sent til medlemmerne d. 1 april 2012

From:    Poul-Henning Kamp <phk@phk.freebsd.dk>
Subject: Datamuseum redder POLSAG
Message-Id: <19945.1333270489@critter.freebsd.dk>
Date:    Sun, 01 Apr 2012 08:54:49 GMT

Som det er medlemmerne af Dansk Datahistorisk Forening bekendt, har
politiet for nyligt opgivet udviklingen af POLSAG systemet, fordi
det var alt for langsomt til at være til nogen nytte.

Takket være et snarrådigt medlem af foreningen, blev det arrangeret
at en komplet kopi af POLSAG programmerne, med kildetekst, testmiljø
og dokumentation blev overdraget til Dansk Datahistorisk Forening,
idet alle involverede var enige om det historiske i at skrotte et
IT system efter at have brugt en halv milliard kroner på udvikling.

Foreningen har naturligvis ikke mulighed for at købe et komplet sæt
af de moderne computere POLSAG er skrevet til at køre på, men da
programmerne er nogenlunde normale UNIX programmer der bruger en
SQL baseret database, er de forbavsende portable.

Den UNIX computer vi har flest af i samlingen er Regnecentralens
RC9000, så det faldt naturligt at installere POLSAG på en af disse.

Efter at have rettet nogle få ting som den lidt aldrende C++ compiler
ikke helt helt forstod, fik vi det på bornholmske politistationer
så forhadte POLSAG skærmbillede op.

Hvad der overraskede alle, herunder de to medarbejdere fra CSC
som hjalp os med at få POLSAG i luften, var svartiderne. 

Det siger sig selv at når man sidder og leger med systemet i, hvad
der for alle praktiske formål er en enkelt bruger situation, kører
det naturligvis hurtigere end hvis alle bornholmske betjente sidder
og taster. 

Men et af de helt centrale ankepunkter fra de bornholmske betjente
var søgetiden, når man f.eks skulle søge "på tværs" af sager, for
at se om en bestemt mobiltelefon eller nummerplade var nævnt i andre
opklarede eller uopklarede kriminalsager.

Dette er i POLSAG grove træk lavet som en slags "Googling", en
intelligent fritekstsøgning på tværs af hele databasen.

På den test-database som blev brugt under udviklingen, tog det
typisk omkring 93 sekunder for CSCs servere at lave en fritekst
søgning efter "mobiltelfon nokia 53531448".

På foreningens RC9000 tog det knap 14 sekunder.

På mange andre tests der indeholdt noget der mindede om fritekstsøgning
så vi tilsvarende forbedringer af svartiden. 

Det har taget os hele natten at finde ud af hvad der foregik, og det
viser sig at der er en god og spændende forklaring.

Den RC9000 vi valgte (serienummer (010-42-012) er udstyret med en
"RC8000-chip" og tilsyneladende har nogen hos Regnecentralen/ICL
rodet med at bruge den som en slags "co-processor" for databasesøgninger.

Så vidt vi kan se, kører RC8000 chippen en variant af den software
som JTAS brugte til telefonoplysningen og så snart søgningen
indeholder ciffre, bliver RC8000 chippen sat på sagen.

Det mest underlige af det hele er, at selv søgninger uden numerisk
indhold ser ud til at gå hurtigere, hvis man tilføjer et ikke obligatorisk
søgekriterie på numerisk form, f.eks tager søgningen "indbrud april" fire
gange længere end "indbrud (1) april".

Hvis der er nogen blandt medlemmerne som ligger inden med yderligere
information og særligt hvis nogen har kildeteksten til dette setup,
vil POLSAG projektgruppen meget gerne ringes op på tlf. 01042012

-- 
Poul-Henning Kamp       | UNIX since Zilog Zeus 3.20
phk@FreeBSD.ORG         | TCP/IP since RFC 956
FreeBSD committer       | BSD since 4.3-tahoe
Never attribute to malice what can adequately be explained by incompetence.