An extremely fast implementation of Aho Corasick algorithm based on Double Array Trie.
Siste Utgivelse på okt. 07, 2016汉语言处理包
Siste Utgivelse på nullA Lucene tokenizer plugin for both Simplified Chinese and Traditional Chinese, featured with Chinese Word Segmentation, custom dictionary etc.
Siste Utgivelse på des. 14, 2016HanLP: Han Language Processing
Siste Utgivelse på des. 27, 2020A Lucene tokenizer plugin for both Simplified Chinese and Traditional Chinese, featured with Chinese Word Segmentation, custom dictionary etc.
Siste Utgivelse på des. 14, 2016