Swish-e (Simple Web Indexing System fo Human – Enchanced) merupakan
system open source yang dapat digunakan secara gratis untuk mengindeks
halaman web dan file lainnya. Sebelum menginstall swish-e, ada beberapa paket
yang direkomendasikan, yaitu sebagai berikut.
1. Libxml2
Libxml2 digunakan untuk parsing file
dengan format HTML dan XML. Swish-e bias
diinstall tanpa libxml2, tetapi parsing
HTML tidak seakurat jika libxml2 diinstall.
Libxml2 tidak bisa digunakan pada swish-e jika
libxml2 tidak diinstall sebelum menginstall swish-e.
jika libxml2 diinstall pada lokasi
yang tidak standar (contohnya –prefix
$HOME/local), maka harus ditambahkan dirrektory
bin pada $PATH sebelum menginstall Swish-e.
2. Zlib Compression
Library Zlib Compression digunakan
untuk compressing text yang disimpan pada index
Swish-e. Zlib juga harus diinstall sebelum menginstall Swish-e.
3. Perl Modules
Walaupun swish-e dibuat dengan
bahasa pemrograman c, banyak fitur yang digunakan
perl seperti web spider dan module untuk membantu filtering dokumen yang
ditulis pada perl. Modul-modul perl yang mungkin diperlukan.
- LWP
- URI
- HTML::Parser
- HTML::Tagset
- HTML::Types
Berikut cara menginstall Bundle::LWP
dengan module CPAN yang akan menginstall
banyak module.
Perl –MCPAN –e ‘install Bundle::LWP’
Jika ingin menggunakan HTML-Template
dengan swish.cgi untuk menghasilkan output, maka install,
HTML::Template
HTML::FillInform
Jika ingin menggunakan Template-Toolkit
dengan swish.cgi untuk menghasilkan output, maka harus
menginstall,
Template
INSTALL SWISH-E
Setelah diinstall beberapa hal di
atas, proses installasi swish-e dapat dilakukan
dengan cara berikut.
1. 1. Download program
swish-e dan pilih versinya pada situs
http://swishe.org/download/
atau dapat juga melalui terminal dengan sintak wget.
2. Masuk ke folder dimana file
swish-e-2.4.7.tar.gz disimpan dan ekstrak file tersebut.
3. Masuk ke folder swish-e-2.4.7 dan
ketikkan sintak-sintak berikut.
4. Mengecek versi swish-e yang sudah
diinstall.
Setelah proses installasi swish-e
dilakukan, mungkin diperlukan beberapa hal berikut.
Indexing PDF Documents
Indexing file PDF membutuhkan paket xpdf.
Indexing dokumen MS Word
Indexing file MS word membutuhkan program Catdoc.
Indexing MP3 ID3 Tags
Indexing tag MP3 ID3 membutuhkan module Perl MP3::Tag. Bisa dilihat
di situs
Indexing dokumen MS Excell
Indexing MS Excel didukung dengan module perl berikut.
Spreedsheet::ParserExcel
HTML::Entitie