PK ! word/PK ! word/_rels/PK ! _rels/PK ! docProps/PK ! h~[ [ [Content_Types].xml
PK !
aI I _rels/.rels
PK ! er docProps/app.xml
PK ! docProps/core.xml
1970-01-01T00:00:00Z
unknown
unknown
1970-01-01T00:00:00Z
1
PK ! 3 word/_rels/document.xml.rels
PK ! HM0 0 word/document.xml
关于Rust 语言.docx文档格式解析的调研报告这是一份Rust生成的关于Rust语言.docx文档格式解析的调研报告。背景这份调研起始于钉钉面试后的一份作业,要求读取一份docx文档并打印到屏幕。我通过检索Crates.io查找了Rust语言下docx文档格式解析的库,对当前可供使用或参考的解析库做了比较。可用的Rust库比较(till 2020-10-21 21:00)
features/cratedocx-rsdocxdotextpure rustyesyesyesstars on github572818last version in crates.io0.2.91.1.20.1.1last update in crates.io9 days ago6 months ago3 years agolast update in github9 hours ago6 months ago9 months agowasm supportyesnot clearnot cleardocx readingyesyesonly read to stringWordprocessingML parsingyesyes, partialnodocx writingyesyesnodocumentationsno doclittlenoother format parsingnonosupport docx/xlsx/odt/ods/pptxraw xml parserxml-rsstrong-xmlquick-xml这几个库目前文档都不全,docx-rs 正在快速迭代开发中,文档也会逐渐丰富,支持WASM,是目前Rust语言docx解析库的首选。如果要开发一个新的文档格式解析器,其也可以作为一个很好的参考。其他两个库的更新频率较低。另外,这三个库选择不同的XML解析库,编写解析库时建议进行性能评估。docx-rs 目前尚不支持Footer, TableContents 等一些WordprocessingML的元素,对space等属性的支持也不好,在使用中需要注意。Rust示例代码当前文档存储在我的GitHub中,克隆仓库后使用`cargo run`即可生成在当前目录下。详情访问:https://github.com/zitsen/docx-demo.rs
PK ! 8