Hallo words-l, 

Op soortgelijke wijze als het internationalization project gettext te
werk gaat om programma's te internationalizeren lijkt het me
aanbevelenswaardig zoniet noodzakelijk om onze woorden lijsten van een
header deel te voorzien.

In eerste instantie wil ik voorstellen om dit header deel nog niet
bovenaan de woordenlijst te plaatsen maar als apart bestand met
dezelfde stamnaam maar met extensie `.wlh' toe te voegen.  Spoedig zal
een kleine tool nodig zijn om de header en data van elkaar te scheiden
en na modificatie weer te verenigen.

De header bevat de volgende informatie:

* een-regelige titel bv General list of Dutch words of List of energy
  related words
* copyright regel
* naam eerste auteur en mail en jaartal
* referentie naar GNU GPL
* open regel om deze eenmalige in te voeren info te scheiden van wat
  informatie die per update anders kan zijn
* Project-Id-Version: dutch 0.0f
* WL-Revision-Date: 1996-08-09 11:23 MET DST

En de volgende velden om eventueel character set conversie te
doen. Mbt tot mime-version weet ik niet of dat van belang is omdat ik
niet weet wat dat precies behelst, gettext gebruikt het dus ik zet het
er maar vast bij misschien hebben we er iets aan, op dit moment dus
slechts een constante.  Charset spreekt voor zich, hoewel de basis
naar mijn mening de standaard iso set moet zijn, maar voor konversies
kunnen we eventueel ook ansi en ascii toe laten, zolang je het weet
kun een script er op anticiperen, als je de charset niet kent zul je
zelf moeten ingrijpen.  Transfer encoding is 7-bit en 8-bit in het
algemeen maar met unicode in aantocht zullen misschien ook ooit
16-bits lijsten worden aangeleverd.

* MIME-Version: 1.0
* Content-Type: text/plain; charset=ISO-8859-1
* Content-Transfer-Encoding: 8-bit

En een md5sum om de checksum van woordenlijst te doen, op deze wijze
kan altijd de integriteit van de woordenlijst bepaald worden.  Niemand
kan ongestraft zomaar een woord er in stoppen zonder dat dat
onopgemerkt wordt.

Zo'n header zou er bijvoorbeeld zo uitkunnen zien

# SOME DESCRIPTIVE TITLE.
# Copyright (C) YEAR Nederlandstalige TeX Gebruikersgroep.
# FIRST AUTHOR <EMAIL@ADDRESS>, YEAR.
# This program is free software; you can redistribute it and/or
# modify it under the terms of the GNU General Public License.
#
# Project-Id-Version: PACKAGE VERSION
# WL-Revision-Date: YEAR-MO-DA HO:MI +ZONE
# Last-Modifier: FULL NAME <EMAIL@ADDRESS>
# MIME-Version: 1.0
# Content-Type: charset=CHARSET (iso-8859-1, ascii)
# Content-Transfer-Encoding: ENCODING (7-bit, 8-bit, 16-bit)
# MD5sum: md5 checksum

Dit alles lijkt misschien een beetje overdreven maar ik denk dat het
voor het onderhoud van de lijsten noodzakelijk is om een dergelijke
administratie bij te houden.  Omdat centraal administreren geen
oplossing is voor vrijwilligers projecten op het internet, moeteb de
administratie gegevens meegedistribueerd worden.  Vandaar deze aanpak.
Ik zal me ontfermen over het schrijven van een script om deze header
te genereren, als het goed is heeft perl alles in zich om dit te doen.

Voor de emacsen onder ons zal wl-mode.el (zie de misc dir van mijn
dutch package) rechtstreeks met deze header overweg kunnen, helaas is
het nog in een beta fase, maar ik ben heel hard bezig steeds beter te
worden in lisp.

Erick
