博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
数据结构-04-霍夫曼压缩(Huffman Compression)
阅读量:2384 次
发布时间:2019-05-10

本文共 524 字,大约阅读时间需要 1 分钟。

###Huffman Compression - 霍夫曼压缩 主要思想:放弃文本文件的普通保存方式:不再使用7位或8位二进制数表示每一个字符,而是用较少的比特表示出现频率最高的字符,用较多的比特表示出现频率低的字符。

使用变长编码来表示字符串,势必会导致编解码时码字的唯一性问题,因此需要一种编解码方式唯一的前缀码,而表示前缀码的一种简单方式就是使用单词查找树,其中最优前缀码即为Huffman首创。

以符号F, O, R, G, E, T为例,其出现的频次如以下表格所示。

Symbol F O R G E T Frequence 2 3 4 4 5 7 Code 000 001 100 101 01 10 则对各符号进行霍夫曼编码的动态演示如下图所示。基本步骤是将出现频率由小到大排列,组成子树后频率相加作为整体再和其他未加入二叉树中的节点频率比较。加权路径长为节点的频率乘以树的深度。

输入图片说明

有关霍夫曼编码的具体步骤可参考 Huffman 编码压缩算法 | 酷 壳 - CoolShell.cn 和 霍夫曼编码 - 维基百科,自由的百科全书,清晰易懂。

转载于:https://my.oschina.net/corwien/blog/693370

你可能感兴趣的文章
PHP Backdoors: Hidden With Clever Use of Extract Function
查看>>
Tachyon:吞吐量超过HDFS 300多倍 来自伯克利的分布式文件系统
查看>>
RSA推荐的知名博客(转载freebuf)
查看>>
Pid NameSpace浅分析
查看>>
webx3 mvc
查看>>
hive导入nginx日志
查看>>
唯品会日志平台建设
查看>>
groovy rules
查看>>
深入分析Java ClassLoader原理
查看>>
Hadoop深入学习:Combiner
查看>>
通过FTP进行突破IP筛选
查看>>
RSA 2014 ALL PPT download
查看>>
Tomcat Servlet Examples threats
查看>>
tomcat manager源代码分析
查看>>
java debug 渗透测试
查看>>
修改文件时间与创建新文件:touch
查看>>
f5 icontrol exploit
查看>>
Insecure default in Elasticsearch enables remote code execution
查看>>
java漏洞分析
查看>>
Linux入侵审查浅谈转自2cto
查看>>