pastebin, wtf?!?

Ich moechte hier eine kleine Reihe einleiten, die ich "pastebin, wtf?!?" nennen moechte. Die Idee kam von einem online Freund und nicht von mir selber (ich nenne keine Namen, ausser wenn gewuenscht). Vor einiger Zeit hab ich angefangen pastebin Eintraege zu beobachten. Ich war fasziniert und angezogen von der Tatsache was Leute alles Posten auf solchen Seiten. Auch ich hab dort schon verschiedenen Source Code hochgeladen, doch war ich immer vorsichtig mit Passwort, Configs und Logfiles und anderem Security Kram. Das Thema hat mich so gepackt, dass ich eine Mail an Pastebin schrieb, ob Sie mir die Datenbank zur Verfuegung stellen, weil ich eine Statistik aufstellen wollte. Leider bekam ich nie eine Antwort und auch nie die Datenbank, wer weiss was da fuer sensitive Daten drinnen sind...ich moechte garnicht dran denken. Ich musste mir meine eigene Datenbank aufbauen. Also schrieb ich mir einen Crawler, der das Archiv alle 18min abfragt und nach neuem Material abforstet. Er ist freundlich und haelt sich an die Regeln. Er macht nur Requests, wenn es absolut noetig ist und ist sehr ruhig. Ich wollte die Server und den Traffic nicht belasten, nachdem die ja schon einiges an Traffic haben muessten. Ich hab viele lustige und erschreckende Sachen entdeckt und moechte hier ab und an, manche DAUs vorstellen. Ich hab zum Glueck weniger Informationen als pastebin selber. Ich moechte damit pastebin nichts unterstellen, aber die Datenbank ist nicht sonderlich transparent, leider. Es waere interressant, ob sie im Hintergrund die IPs loggen und den Eintraegen zuweisen, um sich abzusichern, so koennte man mehrere Posts einer Person zuordnen. Ich hab auch schon drueber nachgedacht Variablennamen ueber mehrere Dateien zu matchen, um so komplexere Skripte wieder einigermassen zusammenzustueckeln. Fals jemand gute Ideen zur Visualisierung hat, oder was besonderes schauen moechte, sagt bescheid. so long