O programa MXTB permite contar o conteúdo dos campos, por exemplo, quantidade de vezes que aparece cada autor, quantidade de vezes que aparece cada descritor, quantidade de vezes que aparece um autor e uma revista (juntos), etc. O resultado da execução de MXTB é um arquivo mestre com um registro por palavra/frase diferente encontrada. Cada registro contem, entre outros dados, cadeia de caracteres, freqüência, etc. MXTB é um programa de tabulação para registros do arquivo mestre em múltiplas colunas, que define as chaves de tabulação através da linguagem de formatação. À medida que os registros são lidos, o formato provido é executado e os dados resultantes são tomados como valores para as correspondentes chaves de tabulação.
Todas as n-tuplas possíveis são tabuladas e, ao final, são entregues como registros individuais do arquivo mestre junto com suas freqüências. O processo de tabulação acontece na memória, usando uma técnica de hash. Isto requer uma quantidade de memória suficiente para carregar todas as n-tuplas geradas, suas freqüências, mais um espaço adicional. Quanto maior for este espaço, mais rápida será a execução (será visto com maior detalhamento quando for explicado o parâmetro class mais adiante neste capítulo). Este programa utilitário pode ser usado para produzir tabelas acumulativas de alguns dados armazenados no arquivo mestre. Por exemplo: uma lista de autores
contendo as freqüências que há em uma base de dados bibliográfica, ou uma lista destes desmembrados por ano de publicação, ou outro dado. Opcionalmente, MXTB pega uma especificação adicional de formato para conseguir um valor para o processo de tabulação. Neste caso, a informação numérica de saída é a soma destes valores para uma tupla em particular.
MXTB – Apresentação
mxtb \cisis\cds\cds create=frecaut 40:(v70/)
Esta linha de comando grava um registro no arquivo mestre frecaut para cada ocorrência diferente do campo 70 em \cisis\cds\cds, como é indicado a seguir:
MFN 1 1 «Magalhaes, A.C.» 998 «999999997» 999 «2» MFN 2 1 «Franco, C.M.» 998 «999999998» 999 «1» ...
Campos dos registros de frecaut :
TAG | CONTEÚDO |
1 | Cadeia de caracteres a contar, no exemplo, um autor gerado pelo formato (v70/). (categoria) |
998 | Máximo possível de ocorrências de uma categoria menos a freqüência Encontrada. (999999999 – freqüência) |
999 | Quantidade de vezes que ocorre o conteúdo do campo com TAG 1 de frecaut no arquivo de entrada \cisis\cds\cds . (freqüência) |
O campo 998 provê uma forma simples de realizar listagens em ordem descendente das categorias encontradas (por exemplo, com o comando MSRT freqaut 10 v998 ). O MXTB também pode pegar um valor a ser tabulado externo, isto quer dizer: no lugar de somar o valor um para cada ocorrência encontrada, pode somar um valor entrado mediante um formato, inclusive este valor não precisa ser fixo, pode ser um campo da mesma ou outra base de dados, ond