Crates.io | awabi |
lib.rs | awabi |
version | 0.3.0 |
source | src |
created_at | 2020-03-13 12:12:41.212309 |
updated_at | 2021-12-26 01:28:34.303389 |
description | A morphological analyzer using mecab dictionary |
homepage | |
repository | https://github.com/nakagami/awabi |
max_upload_size | |
id | 218127 |
size | 55,156 |
awabi
is a morphological analyzer using mecab dictionary, written in Rust.
MeCab https://taku910.github.io/mecab/ and related dictionary is required.
$ sudo apt install mecab mecab-ipadic-utf8
$ cargo install awabi
$ brew install mecab
$ brew install mecab-ipadic
$ cargo install awabi
example
use awabi::tokenizer;
fn main() {
let tokenizer = tokenizer::Tokenizer::new(None).unwrap();
let tokens = tokenizer.tokenize("すもももももももものうち");
for token in tokens.iter() {
println!("{}\t{}", token.0, token.1);
}
}
result
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
example
use awabi::tokenizer;
fn main() {
let tokenizer = tokenizer::Tokenizer::new(None).unwrap();
let tokens_list = tokenizer.tokenize_n_best("すもももももももものうち", 3);
for tokens in tokens_list.iter() {
println!("------------------------------------------------------");
for token in tokens.iter() {
println!("{}\token{}", token.0, token.1);
}
}
}
result
------------------------------------------------------
すもも oken名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も oken助詞,係助詞,*,*,*,*,も,モ,モ
もも oken名詞,一般,*,*,*,*,もも,モモ,モモ
も oken助詞,係助詞,*,*,*,*,も,モ,モ
もも oken名詞,一般,*,*,*,*,もも,モモ,モモ
の oken助詞,連体化,*,*,*,*,の,ノ,ノ
うち oken名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
------------------------------------------------------
すもも oken名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も oken助詞,係助詞,*,*,*,*,も,モ,モ
もも oken名詞,一般,*,*,*,*,もも,モモ,モモ
もも oken名詞,一般,*,*,*,*,もも,モモ,モモ
も oken助詞,係助詞,*,*,*,*,も,モ,モ
の oken助詞,連体化,*,*,*,*,の,ノ,ノ
うち oken名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
------------------------------------------------------
すもも oken名詞,一般,*,*,*,*,すもも,スモモ,スモモ
もも oken名詞,一般,*,*,*,*,もも,モモ,モモ
も oken助詞,係助詞,*,*,*,*,も,モ,モ
もも oken名詞,一般,*,*,*,*,もも,モモ,モモ
も oken助詞,係助詞,*,*,*,*,も,モ,モ
の oken助詞,連体化,*,*,*,*,の,ノ,ノ
うち oken名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
use awabi::tokenizer;
fn main() {
let tokenizer = tokenizer::Tokenizer::new(Some("/some/where/mecabrc")).unwrap();
let tokens = tokenizer.tokenize("すもももももももものうち");
for token in tokens.iter() {
println!("{}\t{}", token.0, token.1);
}
}
$ echo 'すもももももももものうち' | awabi
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS
$ echo 'すもももももももものうち' | awabi -N 2
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS