Was passiert, wenn man das Periodensystem auf den Duden ablässt.

2020-06-29

Als in einem Telegram-Chat ein Freund die Frage “Lassen sich mit dem Periodensystem eigentlich beliebige Worte/Buchstabenkombinationen darstellen, oder gibts da zufällig Sachen, die nicht gehen? müsste man mal den Duden gegenprüfen.” in den Raum stellte, ohne so wirklich eine Antwort zu erwarten konnte ich es natürlich nicht lassen, meine kleine Programmierumgebung anzuwerfen um mal eben ein kleines Programm für diese Analyse zu entwickeln.

Die Frage kam um 22:04, schon 15 Minuten später war ein kleiner Codeblock fertig, der zumindest ein einzelnes Wort auf die “Schreibbarkeit” überprüfen konnte. Mit der Datensammlung von Alex Gustafsson hatte ich schnell eine geeignete Datenbasis gefunden.

Mein leichtes nölen im Chat, dass der Code jetzt über alle Einträge laufen müsse wurde lediglich mit einem “go big or go home” kommentiert. Das kann ich natürlich nicht auf mir sitzen lassen! :)

Codeblock

Was ein Glück, dass ich außerdem über einen extrem schnellen Duden-Datenbank-Klon verfüge den ich ebenfalls integrieren konnte. Ein paar Programmzeilen mehr und schon kämpfte sich mein Computer durch die knapp 250.000 Datensätze. Ein paar Momente später - es dauerte in der Tat gut drei Minuten - bekam ich eine kleine Textdatei mit 4366 Wörtern zurückgeliefert - gar nicht mal so viel, nur knapp 2% des Duden-Korpus lassen sich demnach mit dem Periodensystem-Wortschatz nachbilden. Das längste Wort ist dabei lustigerweise mit 22 Zeichen “Universalgeschichtlich”. (U-Ni-V-Er-S-Al-Ge-Sc-H-I-C-H-Tl-I-C-H)

Es setzt sich aus den Abkürzungen der Elemente Uran, Nickel, Vanadium, Erbium, Schwefel, Aluminium, Germanium, Scandium, Helium, Iod, Kohlenstoff und Thallium zusammen. Wer mag, kann diese Elemente in der Wikipedia nachschlagen, da verbergen sich teilweise echt spannende Anwendungsgebiete dahinter!

Hinter diesem Link verbergen sich alle Wörter die mein Algorithmus nachbilden konnte und hier findet sich das passende Jupyter-Notebook, viel Spaß beim schmökern!

statistik

(Spannende) Landkarten - Spielereien mit Wikidata

Installationsnotizen - OpenStreetMap-Tileserver