Tópicos em Bancos de Dados: Sistemas de Informação
Inteligentes 1997/2
Definições e Convenções usadas neste trabalho
-
Texto Fonte de Documento: é um texto em linguagem natural
contendo comandos de formatação usando a linguagem SGML
-
Documento: é um número que identifica um texto fonte
de um documento em linguagem natural na coleção.
-
Palavra: é uma palavra em linguagem natural
-
Vocabulário: é o conjunto de todas as palavras contidas
dentro da coleção
-
Termo: é um número que identifica uma palavra dentro
do vocabulário
-
Frequência: é o número de vezes que um dado
termo ocorre dentro de um documento
-
idf: do inglês inverse documente frequency representa
o inverso da frequência de um termo dentro da coleção.
-
norma: é a norma de um documento dentro da coleção