Representación de la información y compresión de datos
- nicole lippert
- 15 nov 2021
- 3 Min. de lectura

Todos los datos almacenados en tu computadora, ya sean valores numéricos, textos, imágenes, sonidos, etc, están representados por patrones de bits (que como expliqué anteriormente son combinaciones de ceros y unos).
A continuación, vamos a explicar con un poco más de detalle cómo es que se almacena toda esta información:
Representación de valores numéricos:. Se utiliza la notación binaria, es decir, se usan bits para representar a un número en base 2. Con 16 bits y utilizando notación binaria podemos almacenar cualquier entero comprendido dentro del rango que va de 0 a 65535. Si el número fuera mayor, hay un overflow.
Representación de textos: La información en forma de texto se suele representar por medio de un código en el que se asigna un patrón determinado de bits a cada uno de los distintos símbolos que aparecen en el texto. Existen diferentes tipos de códigos de caracteres para hacer estas representaciones:
o ASCII: Usa patrones de 7 bits para representar las letras mayúsculas y minúsculas del alfabeto inglés, además de los signos de puntuación, los dígitos 0 a 9.
o ISO desarrolló un número de extensiones del código ASCII, cada una de ellas diseñada para soportar a un grupo de lenguajes. Los estándares ASCII ampliados definidos por ISO representaron un gran avance a la hora de permitir comunicaciones multilingües a nivel mundial.
o Unicode: usa patrones de 16 bits para representar la mayoría de los lenguajes usados en el mundo, incluso emojis. Unicode está compuesto por 65.536 patrones de bits diferentes, lo cual es suficiente para poder escribir textos en idiomas como el chino, el japonés y el hebreo.
Representación de imágenes: se representan como una colección de puntos (pixeles, los elementos más pequeños de una imagen). Se codifica la apariencia de cada píxel y la imagen completo se representa como una colección de píxeles codificados. Esta es una técnica llamada mapa de bits. En el caso de una imagen simple en blanco y negro, cada píxel puede representarse mediante un único bit, cuyo valor dependerá de si el píxel correspondiente es negro o blanco. Entonces, cada color ocupa un byte y cada pixel 3 bytes.
Representación de sonidos: se representa con una técnica de muestreo similar a las imágenes. Se hace un muestreo de la amplitud de la onda de sonido a intervalos regulares y se graba la serie de valores obtenidos. Para esta técnica se emplea una tasa de muestreo de 8000 muestras por segundo. Los datos de cada muestra se representan se representan con 16 bits.
Compresión de datos:
Almacenar o transferir datos a menudo demanda reducir el tamaño de estos conservando la información subyacente. Se han diseñado numerosos métodos de compresión de datos con el fin de reducir el tamaño de los mismos, algunos de ellos son con pérdidas de información y algunos sin.
Técnicas genéricas de compresión
· Codificación por longitud de secuencia: se sustituyen secuencias de elementos de datos con un código que indica el elemento repetido y el número de veces que ese elemento aparece dentro de la secuencia.
· Codificación dependiente de la frecuencia: la longitud del patrón de bits utilizado para representar un elemento de datos es inversamente proporcional a la frecuencia con que ese elemento aparece.
· Codificación diferencial o relativa: se almacena las diferencias entre unidades de datos consecutivas en lugar de almacenar las unidades completas; es decir, cada unidad se codifica en términos de su relación con la unidad anterior.
· Codificación por diccionario: se construye el mensaje a comprimir mediante referencias a un diccionario (bloques componentes)
§ Procesadores de texto: podemos codificar una palabra completa mediante una referencia única a un diccionario.
Compresión de imágenes:
· GIF: se reduce a 256 el número de colores se pueden a asignar a un pixel en un byte. Hay pérdida de información.
· JPEG: comprime por brillo (color 24 bits, 3 bytes).
· TIFF: almacena la imagen junto con su información.
Compresión de audio y video:
· MPEG: se comprime dividiendo el video en imágenes. De esta forma, se codifican algunas imágenes y se guarda la información de las variaciones de las imágenes intermedias (solo se graban las variaciones con respecto a la imagen anterior).
· MP3: elimina los detalles que el oído no puede percibir (enmascaramiento temporal y de frecuencia)



Comentarios