Página web para el curso Recuperación de Información::

Escuela de Ciencias de la Computación e Informática::

Universidad de Costa Rica

Temas Relacionos a Compresión


Presentación

  El presente sitio web, corresponde al exámen del curso CI-2414 Recuperación de Información.

   Se tratará en éste, algunos algortimos utilizados en la compresión de datos, específicamente, de la familia de algortimos  Huffman.


¿Qué es compresión de texto?

   Compresión de texto se refiere al proceso mediante el cuál, se representa un texto utilizando menos espacio del que realmente ocupa. Este proceso por lo genral involucra, sustituir los símbolos que componen el texto, por otros que ocupen menos bits o bytes para su representación.


¿Por qué comprimir?

   Las ventajas principales que se obtienen al utilizar algoritmos de compresión son:

 - Se reduce el espacio necesario para almacenar el texto.

- Se reducen los accesos a disco y el tiempo requerido para transmitir datos.

- En algunos casos, se acelera el tiempo de búsqueda en el texto.


Desventajas de comprimir la información

  La desventaja principal que tienen los procesos de compresión, es el tiempo requerido para comprimir - descomprimir la información.

   No obstante, como se muestra en este sitio web, existen técnicas que permiten lidiar con esta pérdida, hasta el punto de volverla insignificante comparada con las ganancias en tiempo que se obtienen una vez que el texto ya esta comprimido.
    Más aún, algunos métodos no requieren, salvo en circunstancias mut raras, descomprimir el texto, por lo que el ahorro es aún más significativo