名称 (NAME)
sq - 压缩一个排过序的单词列表 unsq - 解压一个排过序的单词列表
总览 (SYNOPSIS)
sq < infile > outfile
unsq < infile > outfile
描述 (DESCRIPTION)
sq 压缩 一个 排过序的 单词 列表 (一个 字典). 比如:
- sort /usr/dict/words | sq | compress > words.sq.Z
会大概以4为因数压缩字典.
unsq 解压 sq 的 输出. 比如:
- compress -d < words.sq.Z | unsq | sort -f -o words
会 解压 sq 压缩 的 字典. 根据 文档 描述, 它 通过 省略 相同 的 词头 来 压缩, 用 一个 单独 的 字符 取代这个 词头, 这个 字符 对 与 前一个词 相同的 字符数 进行 编码. 词头 的 大小 用 一个 编了码 的 可打印 的 字符 表示: 0-9 代表 0-9, A-Z 代表 10-35, a-z 代表 36-61.
作者 (AUTHOR)
Mike Wexler
参见 (SEE ALSO)
compress(1), sort(1).
#p#
NAME
sq - squeeze a sorted word list unsq - unsqueeze a sorted word list
SYNOPSIS
sq < infile > outfile
unsq < infile > outfile
DESCRIPTION
sq compresses a sorted list of words (a dictionary). For example:
- sort /usr/share/dict/words | sq | compress > words.sq.Z
will compress dict by about a factor of 4.
unsq uncompress the output of sq. For example:
- compress -d < words.sq.Z | unsq | sort -f -o words
will uncompress a dictionary compressed with sq. The squeezing is achieved by eliminating common prefixes, and replacing them with a single character which encodes the number of characters shared with the preceding word. The prefix size is encoded as a single printable character: 0-9 represent 0-9, A-Z represent 10-35, and a-z represent 36-61.
AUTHOR
Mike Wexler
SEE ALSO
compress(1), sort(1).