你是否有过文件文件太大,导致无法以正常的
email
方式发送出去
(
很多
email
都有容量大约
25MB
每封信的限制啊!
)
又或者学校、厂商要求使用
CD
DVD
来传递归档用的数据,但是
你的单一文件却都比这些传统的一次性储存媒体还要大!那怎么分成多片来刻录呢?
还有,你是否
有过要备份某些重要数据,偏偏这些数据量太大了,耗掉了你很多的磁盘空间呢?
这个时候,那个
好用的『
文件压缩
』技术可就派的上用场了!
因为这些比½大型的文件透过所谓的文件压缩技术之后,可以½他的磁盘使用量½低,可以达到减低
文件容量的效果。此外,有的压缩程序还可以½行容量限制,
使一个大型文件可以分区成为数个小
型文件,以方便软盘片携带呢!
那么什么是『文件压缩』呢?我们来稍微谈一谈他的原理好了。目前我们使用的计算机系统中都是使
用所谓的
bytes
单位来计量的!不过,事实上,计算机最小的计量单位应该是
bits
才对啊。此外,
我们也知道
1 byte = 8 bits
。但是如果½天我们只是记忆一个数字,亦即是
1
这个数字呢?他会如
何记录?假设一个
byte
可以看成底下的模样:
□□□□□□□□
Tips
由于
1 byte = 8 bits
,所以每个
byte
当中会有
8
个空格,而每个空格可以是
0, 1
这里½是做为一个约略的½绍,
更多的详细资料请参考
第零章的计算器概论
吧!
由于我们记录数字是
1
,考虑计算机所谓的二½制喔,如此一来,
1
会在最右边占据
1
bit
而其他的
7
bits
½会自动的被填上
0
啰!你看看,其实在这样的例子中,那
7
bits
应该是
『空的』才对!不过,为了要满足目前我们的操作系统数据的存取,所以就会½该数据转为
byte
型态来记录了!而一些聪明的计算机工程师就利用一些复杂的计算方式,
½这些没有使用到的空间
『丢』出来,以让文件占用的空间变小!这就是压缩的技术啦!
另外一种压缩技术也很有趣,他是½重复的数据½行统计记录的。举例来说,如果你的数据为『
111....
共有
100
1
时,
那么压缩技术会记录为『
100
1
』而不是真的有
100
1
的位存在!这样也能够
精简文件记录的容量呢!
非常有趣吧!
简单的说,你可以½他想成,其实文件里面有相当多的『空间』存在,并不是完全填满的,
而『压
缩』的技术就是½这些『空间』填满,以让整个文件占用的容量下½!
不过,这些『压缩过的文件』
并无法直½被我们的操作系统所使用的,因此,
若要使用这些被压缩过的文件数据,则必须½他『还
原』回来未压缩前的模样,
那就是所谓的『½压缩』啰!而至于
压缩后与压缩的文件所占用的磁盘
空间大小,
就可以被称为是『压缩比』啰
!更多的技术文件或许你可以参考一下:
.
RFC 1952
文件:
http://www.ietf.org/rfc/rfc1952.txt
.
鸟哥站上的备份:
http://linux.vbird.org/linux_basic/0240tarcompress/0240tarcompress_gzip.php
这个『压缩』与『½压缩』的动作有什么好处呢?最大的好处就是压缩过的文件容量变小了,
所以
你的硬盘容量无形之中就可以容纳更多的资料。此外,在一些网络数据的传输中,也会由于数据量的
½低,
好让网络带宽可以用来作更多的工作!而不是老是卡在一些大型的文件传输上面呢!目前很
多的
WWW
网站也是利用文件压缩的技术来½行数据的传送,好让网站带宽的可利用率上升喔!