directory search
archive archive/tar archive/zip bufio bufio(缓存) builtin builtin(内置包) bytes bytes(包字节) compress compress/bzip2(压缩/bzip2) compress/flate(压缩/flate) compress/gzip(压缩/gzip) compress/lzw(压缩/lzw) compress/zlib(压缩/zlib) container container/heap(容器数据结构heap) container/list(容器数据结构list) container/ring(容器数据结构ring) context context(上下文) crypto crypto(加密) crypto/aes(加密/aes) crypto/cipher(加密/cipher) crypto/des(加密/des) crypto/dsa(加密/dsa) crypto/ecdsa(加密/ecdsa) crypto/elliptic(加密/elliptic) crypto/hmac(加密/hmac) crypto/md5(加密/md5) crypto/rand(加密/rand) crypto/rc4(加密/rc4) crypto/rsa(加密/rsa) crypto/sha1(加密/sha1) crypto/sha256(加密/sha256) crypto/sha512(加密/sha512) crypto/subtle(加密/subtle) crypto/tls(加密/tls) crypto/x509(加密/x509) crypto/x509/pkix(加密/x509/pkix) database database/sql(数据库/sql) database/sql/driver(数据库/sql/driver) debug debug/dwarf(调试/dwarf) debug/elf(调试/elf) debug/gosym(调试/gosym) debug/macho(调试/macho) debug/pe(调试/pe) debug/plan9obj(调试/plan9obj) encoding encoding(编码) encoding/ascii85(编码/ascii85) encoding/asn1(编码/asn1) encoding/base32(编码/base32) encoding/base64(编码/base64) encoding/binary(编码/binary) encoding/csv(编码/csv) encoding/gob(编码/gob) encoding/hex(编码/hex) encoding/json(编码/json) encoding/pem(编码/pem) encoding/xml(编码/xml) errors errors(错误) expvar expvar flag flag(命令行参数解析flag包) fmt fmt go go/ast(抽象语法树) go/build go/constant(常量) go/doc(文档) go/format(格式) go/importer go/parser go/printer go/scanner(扫描仪) go/token(令牌) go/types(类型) hash hash(散列) hash/adler32 hash/crc32 hash/crc64 hash/fnv html html html/template(模板) image image(图像) image/color(颜色) image/color/palette(调色板) image/draw(绘图) image/gif image/jpeg image/png index index/suffixarray io io io/ioutil log log log/syslog(日志系统) math math math/big math/big math/bits math/bits math/cmplx math/cmplx math/rand math/rand mime mime mime/multipart(多部分) mime/quotedprintable net net net/http net/http net/http/cgi net/http/cookiejar net/http/fcgi net/http/httptest net/http/httptrace net/http/httputil net/http/internal net/http/pprof net/mail net/mail net/rpc net/rpc net/rpc/jsonrpc net/smtp net/smtp net/textproto net/textproto net/url net/url os os os/exec os/signal os/user path path path/filepath(文件路径) plugin plugin(插件) reflect reflect(反射) regexp regexp(正则表达式) regexp/syntax runtime runtime(运行时) runtime/debug(调试) runtime/internal/sys runtime/pprof runtime/race(竞争) runtime/trace(执行追踪器) sort sort(排序算法) strconv strconv(转换) strings strings(字符串) sync sync(同步) sync/atomic(原子操作) syscall syscall(系统调用) testing testing(测试) testing/iotest testing/quick text text/scanner(扫描文本) text/tabwriter text/template(定义模板) text/template/parse time time(时间戳) unicode unicode unicode/utf16 unicode/utf8 unsafe unsafe
characters

  • import "index/suffixarray"

  • 概况

  • 索引

  • 示例

概述

包后缀数组使用内存后缀数组实现对数时间的子串搜索。

使用示例:

// 为某些数据创建索引index := suffixarray.New(data)// 查找字节切片soffsets1 := index.Lookup(s, -1) // 数据中出现s的所有索引的列表offsets2 := index.Lookup(s, 3)  // 最多3个索引的列表,其中s出现在数据中

索引

  • type Index

  • func New(data []byte) *Index

  • func (x *Index) Bytes() []byte

  • func (x *Index) FindAllIndex(r *regexp.Regexp, n int) (result [][]int)

  • func (x *Index) Lookup(s []byte, n int) (result []int)

  • func (x *Index) Read(r io.Reader) error

  • func (x *Index) Write(w io.Writer) error

示例

Index.Lookup

包文件

qsufsort.go suffixarray.go

type Index

Index 为快速子串搜索实现后缀数组。

type Index struct {        // 包含已过滤或未导出的字段}

func New

func New(data []byte) *Index

New 为数据创建一个新的索引。对于N = len(data),索引创建时间为 O(N*log(N))。

func (*Index) Bytes

func (x *Index) Bytes() []byte

Bytes 返回索引创建的数据。它不能被修改。

func (*Index) FindAllIndex

func (x *Index) FindAllIndex(r *regexp.Regexp, n int) (result [][]int)

FindAllIndex 返回正则表达式r的非重叠匹配的排序列表,其中匹配是指定 x.Bytes()的匹配切片的一对索引。如果 n <0,则所有匹配按照连续顺序返回。否则,最多返回 n 个匹配,并且可能不连续。如果没有匹配,或者如果 n == 0,结果为零。

func (*Index) Lookup

func (x *Index) Lookup(s []byte, n int) (result []int)

Lookup 返回索引数据中至多有 n 个索引的未排序列表,其中字节串 s 出现。如果 n <0,则返回所有发生的事件。如果 s 为空,s 未找到或 n == 0,则结果为 nil 。查找时间为 O(log(N)*len(s) + len(result))其中 N 是索引数据的大小。

示例

package mainimport ("fmt""index/suffixarray")func main() {
	index := suffixarray.New([]byte("banana"))
	offsets := index.Lookup([]byte("ana"), -1)for _, off := range offsets {
		fmt.Println(off)}}

func (*Index) Read

func (x *Index) Read(r io.Reader) error

Read 读取从 r 到 x 的索引;x 不能为零。

func (*Index) Write

func (x *Index) Write(w io.Writer) error

Write 将索引 x 写入 w 。

Previous article: Next article: