java, markdown, lotus notes

Sådan trækker du formateret tekst ud af Lotus Notes uden at røre programmet

Kilde 20-02-17 ~Et minuts læsning · 180 ord

Forfatteren har sat sig for at finde en metode, som trækker alle data - også formatteret tekst (kaldet RichText) - ud af database-systemet Lotus Notes og gemme dem i markdown-format. Vel at mærke uden at programmere så meget som en linie i Lotus Notes.

Dataene kan trækkes ud fra det oprindelige RichText-felt i Notes eller ved konvertere indholdet af feltet til MIME. Men begge dele vil indebære, at der skal programmeres i Notes. Derfor vælger forfatteren en tredje metode: At webskrabe de HTML-dokumenter, der genereres på den tilhørende server, som hedder Lotus Domino (senere omdøbt til IBM Domino).

Til det brug udnytter forfatteren, at Lotus Domino har en række http-kommandoer, der kan vise RichText, dvs. indholdet af feltet med den formaterede tekst, i browseren. Dette indhold høster han herefter dokument for dokument ved hjælp af java-biblioteket Remark.

Konklusionen er, at metoden får trukket langt hovedparten af den formaterede tekst ud af Lotus Notes, men der ryger nogle ting i svinget. Det gælder bl.a. inline billeder, skriftfarver, skriftstørrelser og ord, som er sat med halvfed, kursiv eller understregning på samme tid.