| Crates.io | cro_stem |
| lib.rs | cro_stem |
| version | 0.1.4 |
| created_at | 2026-01-25 19:54:23.794877+00 |
| updated_at | 2026-01-25 19:57:38.506488+00 |
| description | A lightning-fast, zero-dependency Croatian stemming library written in Rust. |
| homepage | |
| repository | https://github.com/Ja1Denis/Cro-Stem |
| max_upload_size | |
| id | 2069415 |
| size | 444,198 |
Cro-Stem je moderna, munjevit brz Rust biblioteka za morfološku normalizaciju (stemming) hrvatskog jezika. S točnošću od >91%, idealna je zamjena za spore i teške AI modele u produkcijskim sustavima.
🏆 Novo u v0.1.3: Uveden
StemMode(Agresivni/Konzervativni mod) i postignuta točnost od 91.4% na testnom korpusu od 1000 riječi.
Aggressive: Za tražilice (Elasticsearch, Solr) - reže do korijena (knjigama -> knjig).Conservative: Za NLP analizu - čuva lemu (knjigama -> knjiga).pip install integracija.| Značajka | Cro-Stem v0.1.3 | Veliki AI Modeli (spaCy/CLASSLA) |
|---|---|---|
| Veličina | < 0.5 MB | ~800 MB+ |
| Brzina | >1M riječi/sek | ~10k riječi/sek |
| Stemming Točnost | ~91.4% | ~95-97% |
| Infrastruktura | Običan CPU / Raspberry Pi | GPU preporučljiv |
| Upotreba | Search, Indexing, High-load | Deep Semantic Analysis |
pip install cro-stem
U vašem Cargo.toml:
[dependencies]
cro_stem = "0.1.3"
use cro_stem::{CroStem, StemMode};
fn main() {
// Odaberite mod: Aggressive (za search) ili Conservative (za lingvistiku)
let stemmer = CroStem::new(StemMode::Aggressive);
let words = vec!["učiteljice", "najljepših", "crveniji"];
for w in words {
println!("{} -> {}", w, stemmer.stem(w));
}
// Izlaz (Aggressive):
// učiteljice -> učitelj
// najljepših -> ljep
// crveniji -> crven
}
import cro_stem
# Default je Agresivni mod (najbolji za pretragu)
print(cro_stem.stem("pjevajući"))
# 'pjev'
# Za buduće verzije planiramo exposeati modove i kroz Python API
words = ["kućama", "stolovima", "čovjekom"]
stems = [cro_stem.stem(w) for w in words]
print(stems)
# ['kuć', 'stol', 'čovjek']
Ovaj projekt je licenciran pod GNU Affero General Public License v3.0 (AGPL-3.0).
To znači:
CroStem u komercijalnom softveru zatvorenog koda (gdje ne želite dijeliti svoj izvorni kod), ova licenca to ne dopušta bez otvaranja vašeg koda.💡 Komercijalna licenca:
Za upotrebu u zatvorenim (proprietary) sustavima bez obveze dijeljenja koda, molimo kontaktirajte autora za kupnju Komercijalne (Enterprise) licence koja vas oslobađa AGPL obveza.
**. Detalje potražite u datoteci LICENSE.