Arquivo de palavras não significativas (stopwords)

stw=@[<file>]
Através de um arquivo de palavras não significativas (stopwords) é evitada a geração de termos não significativos (pronomes, preposições, etc.). Um arquivo de palavras não signifcativas é um arquivo texto ASCII com uma palavra por linha.
Dica:
Se for colocado stw=@ o MX interpreta que deve utilizar o nome padrão atribuídodo pelo MicroISIS, isto é: <nome da base>.stw.
Exemplo:

mx cds fst=@cds.fst stw=@
É equivalente a:
mx cds fst=@cds.fst stw=@cds.stw

Dica: Lembre que um arquivo de palavras não significativas só tem sentido se forem utilizadas as técnicas de indexação palavra por palavra: TI 4, TI 8, TI 1004 o TI 1008. Além disto, por definição, palavras não significativas podem ter até 10 caracteres de tamanho.
Exemplo:
O seguinte exemplo utiliza um arquivo de stopwords. O exemplo supõe a existência de um arquivo de stopwods ( cds.stw ) com o seguinte conteúdo:

A
AN
AND
AS
BY
FOR
FROM
IN
INTO
ITS
OF
ON
THE
TO
UPON
WITH

Linha de comando:

mx CDS "fst=24 4 v24" stw=@cds.stw
Mfn= 1
24 «Techniques for the measurement of transpiration of individual plants»
26 «^aParis^bUnesco^c-1965»
30 «^ap. 211-224^billus.»
84Utilitários CISIS - Manual de Referência
Utilitário MX
70 «Magalhaes, A.C.»
70 «Franco, C.M.»
24 «TECHNIQUES^m1^o1^c1^l1»
24 «MEASUREMENT^m1^o1^c4^l2»
24 «TRANSPIRATION^m1^o1^c6^l2»
24 «INDIVIDUAL^m1^o1^c8^l1»
24 «PLANTS^m1^o1^c9^l1»
..

Dica:
Os exemplos não indicam base ou arquivo de destino, por isso as mudanças são vistas na tela, mas em seguida são perdidas.

Deixe um comentário