Crates.io | jiebars |
lib.rs | jiebars |
version | 0.1.0 |
source | src |
created_at | 2022-11-07 11:22:37.989739 |
updated_at | 2022-11-07 11:22:37.989739 |
description | Jieba word segmentation rust version implementation |
homepage | https://github.com/szuwgh/jiebars |
repository | https://github.com/szuwgh/jiebars |
max_upload_size | |
id | 707186 |
size | 6,408,160 |
jieba分词rust版实现
代码示例
use jiebars::Jieba;
fn main() {
let jieba = Jieba::new().unwrap();
//全模式
let mut words = jieba.cut("我来到北京清华大学", true, false);
println!("\n【全模式】:{}\n", words.join(" / "));
//精确模式
words = jieba.cut("他来到了网易杭研大厦", false, false);
println!("【精确模式】:{}\n", words.join(" / "));
//新词识别模式
words = jieba.cut("他来到了网易杭研大厦", false, true);
println!("【新词识别模式】:{}\n", words.join(" / "));
//搜索引擎模式
words = jieba.cut_for_search("小明硕士毕业于中国科学院计算所,后在日本京都大学深造");
println!("【搜索引擎模式】:{}\n", words.join(" / "));
}
输出:
【全模式】:我 / 来 / 来到 / 到 / 北 / 北京 / 京 / 清 / 清华 / 清华大学 / 华 / 华大 / 大 / 大学 / 学
【精确模式】:他 / 来到 / 了 / 网易 / 杭 / 研 / 大厦
【新词识别模式】:他 / 来到 / 了 / 网易 / 杭研 / 大厦
【搜索引擎模式】:小明 / 硕士 / 毕业 / 于 / 中国 / 科学 / 中国科学院 / 计算 / 计算所 / 后 / 后在 / 日本 / 京都 / 日本京都大学 / 深造