Om Jernkorset.dk

Jernkorset.dk er bare det foreløbige seneste stop på et længere familieprojekt.

  • Peter Mærsk skrev brevene.
  • Else Mærsk, Peters datter, skrev dem ind på maskine i 1990’erne.
  • Jørgen Dalager, gift med Aase Mærsk Berthelsen, Peters barnebarn, har scannet og indsamlet materiale rundt om brevsamlingen.
  • Jeg, Christian Dalager, søn af Jørgen og Aase, har bygget jernkorset.dk.
    Hvis du har feedback eller bruger jernkorset til et eller andet vil jeg meget gerne høre fra dig. Fang mig på på [email protected] eller på LinkedIn: linkedin.com/in/dalager

Sprogteknologi og data

Brevene er skrevet på dansk anno 1911–1918 med en retskrivning der kan være svær at læse i dag. Websitet bruger AI-baseret sprogteknologi til at gøre samlingen mere tilgængelig:

  • Semantisk søgning — Alle 665 breve er indekseret med en multilingual embedding model (multilingual-e5-small, 384 dimensioner), så man kan søge på semantisk nærhed fremfor blot nøgleord.
  • Stemningsanalyse — Hvert brev er analyseret med en sentimentanalyseteknik beskrevet i et paper om Concept Vector Projection (CVP), fra Aarhus Universitet, der giver kontinuerlige sentiment scores baseret på semantiske embeddings. Metoden er udviklet specifikt til historiske og litterære tekster og klarer sig bedre end traditionelle dictionary-baserede værktøjer på ældre dansk.
  • Emne-grupper og relaterede breve — Brevene er grupperet i emneklynger og forbundet via lighed, så man kan udforske tematiske sammenhænge på tværs af samlingen.
  • Sproganalyse — Psykolingvistiske mål som ordlængde, sætningskompleksitet og pronomenfordeling afdækker hvordan krigens pres forandrede Peters skriftsprog over tid.
  • Data om krigens slag — Historiske slag er korreleret med brevenes datering og afsendelsessted, så man kan undersøge om der er korrelationer mellem krigsbegivenheder og brevenes indhold.

Hele datasættet — breve, indlejringer, stemninger, emner og steddata — genereres fra kildefilerne via en automatiseret datapipeline og eksporteres som statiske JSON-filer, der indlæses direkte i browseren uden behov for en server.

Kildekode

Koden til dette projekt er open source og tilgængelig på GitHub.