4.4. Informazioni utili per il funzionamento degli indicizzatori [del primo tipo]

È necessario un server web (suo nome comune httpd) anche senza grandi caratteristiche (ma è molto diffuso il famoso Apache, non si dovrebbero trovare difficoltà nel reperirlo), che una volta installato, se non è stata impostata la sua partenza automatica all'avvio del calcolatore, può essere chiamato in ogni momento sicuramente in uno di questi modi: rcapache start, /etc/init.d/apache start, /etc/rc.d/init.d/apache (o httpd) start oppure anche httpd &.

Si deve tenere presente che ogni distribuzione può avere un personale modo di posizionare i dati del server web, questi dovrebbero avere una directory radice (chiamata ServerRoot) che contiene i dati base per il funzionamento del sito web e una directory radice per i documenti (chiamata DocumentRoot). Per determinarli quando il server web è già installato dovrebbe essere sufficiente utilizzare lo script rgrep fornito con i parametri qui indicati:

rgrep ServerRoot\ \" /etc

rgrep DocumentRoot\ \" /etc

Nel caso si disponga del programma rgrep, allora si può fare valere questa indicazione ponendo prima del modello di occorrenza -r.

La sbarra (\ ) significa che la shell non deve prendere per elementi da interpretare per sé, come di solito avviene per le virgolette e gli spazi, il carattere che segue.

Una volta disponibile DocumentRoot probabilmente si troverà qui un file index.html d'esempio: lì è che parte l'indicizzazione [del primo tipo]. index.html è il file che viene visualizzato quando dando indirizzi come http://localhost non si specifica un file particolare, proprio in questo esempio visualizzerà proprio il primo, quello della posizione DocumentRoot, questo presenterà probabilmente collegamenti simili al precedente, per esempio http://localhost/manual/ che porterà alla visualizzazione della documentazione del server web (Apache). Probabilmente la verifica per determinare se questo file avrà bisogno di alcune modifiche per far vedere tutta la documentazione da indicizzare darà esito positivo. Un esempio di come dovrebbe essere questo file lo si può trovare nella directory server_web/htdocs/ fra gli esempi di configurazione.

Per sapere come procedere nel caso di una installazione già pronta del server web si può proporre di nuovo una ricerca con rgrep:

rgrep Alias\ / /etc

Questo comando fornirà informazioni utili per rendersi conto come comporre gli indirizzi. Ad esempio potrebbe apparire una riga come questa:

Alias /doc/ /usr/doc/

Allora significherà che per raggiungere ad esempio /usr/doc/ildp/index.html, l'indirizzo per il browser web dovrà comporsi così:

http://localhost/doc/ildp/

Dunque, per avere indicizzate le pagine web legate all'esempio (tutti file elencati in pagine web sotto /usr/doc/ildp, si dovrà aggiungere a questo indirizzo al primo file index.html. Per fare questo si possono utilizzare i modificatori HTML (es. Netscape Composer, ) o anche semplicemente un modificatore di testo come quelli elencati in [v. Programmi necessari].

Può in questa fase essere utile indextoolmklink il quale permette di generare un file indice ipertestuale in formato HTML (index.html) degli elementi presenti in una directory (con anche un opzione per addentrarsi nelle directory, -r, --recursive). Maggiori informazioni sul suo funzionamento sono disponibili mediante il parametro --help.