Presentación
El presente sitio web, corresponde al exámen del curso CI-2414 Recuperación de Información.
Se tratará en éste, algunos algortimos utilizados en la compresión de datos, específicamente, de la familia de algortimos Huffman.
¿Qué es compresión de texto?
Compresión de texto se refiere al proceso mediante el cuál, se representa un texto utilizando menos espacio del que realmente ocupa. Este proceso por lo genral involucra, sustituir los símbolos que componen el texto, por otros que ocupen menos bits o bytes para su representación.
¿Por qué comprimir?
Las ventajas principales que se obtienen al utilizar algoritmos de compresión son:
- Se reduce el espacio necesario para almacenar el texto.
- Se reducen los accesos a disco y el tiempo requerido para transmitir datos.
- En algunos casos, se acelera el tiempo de búsqueda en el texto.
Desventajas de comprimir la información
La desventaja principal que tienen los procesos de compresión, es el tiempo requerido para comprimir - descomprimir la información.
No obstante, como se muestra en
este sitio web, existen técnicas que permiten lidiar con esta pérdida, hasta el
punto de volverla insignificante comparada con las ganancias en tiempo que se
obtienen una vez que el texto ya esta comprimido.
Más aún, algunos métodos no requieren, salvo en circunstancias mut raras, descomprimir el
texto, por lo que el ahorro es aún más significativo