用哈弗曼编码实现压缩软件

2012-11-12
    1.什么是哈夫曼树?
    哈夫曼树是一种最优二叉树,它的最优点体现在它的的带权路径长度最小。(结点的带权路径长度为:结点的路径长度乘以结点的权值,树的带权路径长度为所有叶子结点带权路径长度之和)
    2.什么是哈弗曼编码?
    从哈弗曼树的根结点开始,按照左子树分配代码“0”,右子树分配代码“1”的规则,直到叶子结点为止,每个叶子结点的哈弗曼编码就是从根结点开始,一直到该叶子结点为止,把途中经过的代码按顺序串起来就OK了。
    3.什么是哈弗曼压缩?
    Huffman( 哈夫曼 ) 算法在上世纪五十年代初提出来了,它是一种无损压缩方法,在压缩过程中不会丢失信息熵,而且可以证明 Huffman 算法在无损压缩算法中是最优的。 Huffman 原理简单,实现起来也不困难,在现在的主流压缩软件得到了广泛的应用。对应用程序、重要资料等绝对不允许信息丢失的压缩场合, Huffman 算法是非常好的选择。
    哈夫曼压缩,一般用来压缩文本和程序文件。哈夫曼压缩属于可变代码长度算法一族。意思是个体符号(例如,文本文件中的字符)用一个特定长度的位序列替代。因此,在文件中出现频率高的符号,使用短的位序列,而那些很少出现的符号,则用较长的位序列。
    有了以上的基本概念,我们就可以动手实现哈弗曼压缩软件了!
    4.哈弗曼压缩软件的实现:
    在文件中,所有的数据都是以字节的形式存在的,一个字节是8位,所以所有可能出现的字节在0——256之间(不包括256),所以,第一步要做的事情就是,把文件所有的字节的出现频率统计出来,并用频率做为权值生成一棵哈弗曼树:
    Java代码
    int[] ByteCount = new int[256];//字节频率统计
    InputStream fis = new FileInputStream(pathName_former);
    InputStream bis = new BufferedInputStream(fis);//创建文件输入流
    while(bis.available()>0){
    int tmp = bis.read();
    ByteCount[tmp]++;
    }//统计频率
    //构造哈弗曼树
    hfmTree hfm = new hfmTree(ByteCount);
    Java代码
    public hfmTree(int[] rank){//根据频率构造哈弗曼树
    //把频率不为零的字节加入节点优先级队列
    PriorityQueue nodes = new java.util.PriorityQueue();
    for(int i=0;i
    if(rank[i]!=0){
    nodes.add(new hfmNode(rank[i],i));
    }
    }
    //构造哈弗曼树
    while(nodes.size()!=1){
    hfmNode node_1 = nodes.poll();//1
    hfmNode node_2 = nodes.poll();//2
    hfmNode addNode = new hfmNode(node_1.getRank()+node_2.getRank(),0);
    addNode.setLeft(node_1);
    addNode.setRight(node_2);
    nodes.add(addNode);
    }
    root = nodes.poll();
    }//构造函数(correct)
分享到:
0
相关阅读
友情链接
© 2018 我考网 http://www.woexam.com 中国互联网举报中心 湘ICP备18023104号 京公网安备 11010802020116号
违法和不良信息举报:9447029@qq.com