“データ圧縮”と聞いて、みなさんは何をイメージしますか?
自分には関係ない…と思われる方もいらっしゃるかもしれませんが、ファイルの"圧縮"、画像・音楽データの"圧縮"形式など、私たちがパソコンや周辺機器で扱うデータには"圧縮"が深く関わっています。
今回は圧縮・解凍の仕組みや活用術をご紹介します。
「データ圧縮」とは、データの内容をまったく、またはほとんど損なうことなく、サイズ(容量)の小さいデータに変換することをいいます。また、圧縮されたファイルやフォルダを元に戻すことを「解凍」といいます。
データを布団に例えてみましょう。布団を押し入れにしまいたいけれど、そのままでは4枚しか入らない。そんなとき、布団圧縮袋を使って布団の空気を抜いて小さく圧縮すると、たくさんの布団を積み込むことができます。布団は布団のまま、大きさを変える、これが圧縮です。
データを圧縮して、内容をまったく損なうことなく元に戻せる(解凍できる)圧縮のしかたを「可逆圧縮」といいます。複数のデータをひとつにまとめるZIPやLZHが代表的です。
目視では確認できないような細かい部分や、聞き取れない音など、データの一部を省いたり変換したりして小さくすることを「非可逆圧縮」といいます。JPEGなどの画像データや、MP3などの音声のデータが代表的です。非可逆圧縮では、データを元に戻すことはできません。
布団に例えると、空気だけを抜いて圧縮し、圧縮袋から出せば元通りになる場合が「可逆圧縮」、布団から綿や羽毛を抜いてかさを減らすことが「非可逆圧縮」といえます。
「ふとんふとんふとんふとん…」と、「ふとん」という文字が1000回入力されたテキストデータがあったとします。
これを、「ふとん×1000」と表すと、情報量がぐっと小さくなりますね。極端な例ですが、これが圧縮の基本的な考え方です。(実際には複雑な数学理論が用いられています)
このテキストデータを実際にZIP形式で圧縮すると、ファイルの大きさは約1/6になります。
パソコン、テレビ、スマートフォンなど、私たちの周りにはたくさんのデータであふれています。圧縮しないでこれらを保存したりやり取りしようとすると、ハードディスクはすぐにいっぱいになりますし、ネットワークに負荷がかかり、送受信ができなくなります。
映像を圧縮しなければ、一本の映画を見るのに何枚ものDVDに分けなければなりません。デジタル放送の映画を見るときにも、適切に圧縮されているからこそ、リアルタイムに高画質の映像を楽しむことができます。
私たちの周りにあるデータは、圧縮された適切な形式だからこそ、素早く、適正な品質でやり取りできるのです。