esp_extractor

Crates.ioesp_extractor
lib.rsesp_extractor
version0.3.0
created_at2025-06-08 23:14:53.592113+00
updated_at2025-06-25 01:06:20.261748+00
descriptionA Rust library for extracting and applying translations to Bethesda ESP/ESM/ESL files
homepagehttps://github.com/Orcax-1399/esp-string-parser
repositoryhttps://github.com/Orcax-1399/esp-string-parser
max_upload_size
id1705321
size171,522
Orca'x (Orcax-1399)

documentation

README

ESP字符串提取工具 (esp_extractor)

Crates.io Documentation License: MIT OR Apache-2.0

一个用于处理Bethesda游戏引擎(ESP/ESM/ESL)文件和字符串文件的Rust库。支持字符串提取、翻译应用、字符串文件解析和文件结构调试。

📦 安装

作为库使用

将以下内容添加到你的 Cargo.toml 文件中:

[dependencies]
esp_extractor = "0.2.0"

作为命令行工具

cargo install esp_extractor --features cli

或者从源码构建:

git clone https://github.com/yourusername/esp-string-parser.git
cd esp-string-parser
cargo build --release --features cli

🎯 主要功能

ESP/ESM/ESL文件处理

  • 字符串提取和翻译应用
  • 文件结构分析和调试
  • 压缩记录支持

字符串文件解析

  • 支持 .STRINGS.ILSTRINGS.DLSTRINGS 文件
  • 自动检测文件类型和编码
  • 转换为JSON格式便于处理

详细的字符串文件使用说明请参考:STRING_FILE_USAGE.md

🚀 完整翻译工作流

第一步:提取字符串

esp_extractor -i "MyMod.esp" -o "MyMod_strings.json"

输出示例:

正在解析插件: "MyMod.esp"
扫描到 15 个组(包含子组)
扫描到 1250 个记录
提取到 324 个有效字符串
结果已写入: "MyMod_strings.json"

样例字符串:
1. [00012BB7|Skyrim.esm] WEAP FULL: "Iron Sword"
2. [00013BB9|MyMod.esp] NPC_ FULL: "神秘商人"
...

第二步:编辑翻译

直接修改JSON文件中的 original_text 字段为翻译文本:

修改前:

{
    "editor_id": "IronSword",
    "form_id": "00012BB7|Skyrim.esm",
    "original_text": "Iron Sword",
    "record_type": "WEAP",
    "subrecord_type": "FULL",
}

修改后:

{
  "editor_id": "IronSword",
  "form_id": "00012BB7|Skyrim.esm", 
  "original_text": "铁剑",
  "record_type": "WEAP",
  "subrecord_type": "FULL"
}

第三步:应用翻译

方法一:完整文件翻译

esp_extractor -i "Data/MyMod.esp" --apply-file "MyMod_CN.json" -o "Data/MyMod_CN.esp"

方法二:部分对象翻译(推荐)

esp_extractor -i "Data/MyMod.esp" --apply-jsonstr '[{"editor_id":"IronSword","form_id":"00012BB7|Skyrim.esm","original_text":"铁剑","record_type":"WEAP","subrecord_type":"FULL"}]' -o "Data/MyMod_CN.esp"

方法三:从标准输入读取翻译

cat MyMod_translations.json | esp_extractor -i "Data/MyMod.esp" --apply-partial-stdin -o "Data/MyMod_CN.esp"

方法四:自动命名输出文件(覆盖原文件)

esp_extractor -i "Data/MyMod.esp" --apply-file "MyMod_CN.json"
# 输出: MyMod.esp (覆盖原文件,会自动创建备份)

esp_extractor -i "Data/MyMod.esp" --apply-jsonstr '[...]'
# 输出: MyMod.esp (覆盖原文件,会自动创建备份)

翻译应用输出示例:

准备应用 1 个翻译条目
翻译条目 1: [00012BB7|Skyrim.esm] WEAP FULL -> "铁剑"
翻译应用完成,输出到: "MyMod_CN.esp"

⚙️ 命令行选项

通用选项

  • -i, --input <FILE>: 输入文件路径(ESP/ESM/ESL或字符串文件)(必需)
  • -o, --output <FILE>: 输出文件路径 (可选)
  • --stats: 显示文件统计信息
  • --quiet: 静默模式

ESP文件提取模式

  • --include-localized: 包含本地化字符串(显示为StringID)
  • --unfiltered: 包含所有字符串,跳过智能过滤

字符串文件解析模式

  • --parse-strings <FILE>: 明确指定解析字符串文件(也可以通过文件扩展名自动检测)

翻译应用模式

  • --apply-file <JSON_FILE>: 从JSON文件应用翻译到ESP文件
  • --apply-jsonstr <JSON_STRING>: 从JSON字符串应用指定的翻译对象
  • --apply-partial-stdin: 从标准输入读取JSON翻译对象

测试和调试模式

  • --test-rebuild: 测试模式,解析文件后直接重建(不做任何修改),用于验证解析和重建逻辑
  • --compare-files <ESP_FILE>: 对比两个ESP文件的结构差异

📋 使用示例

ESP文件字符串提取

# 提取字符串到JSON文件
esp_extractor -i "Data/MyMod.esp"

# 指定输出文件名
esp_extractor -i "Data/MyMod.esp" -o "translations.json"

字符串文件解析

# 解析字符串文件(自动检测)
esp_extractor -i "Dragonborn_english.ILSTRINGS"

# 明确指定解析字符串文件
esp_extractor --parse-strings "Dragonborn_english.ILSTRINGS" -o "dragonborn_strings.json"

# 查看字符串文件统计信息
esp_extractor -i "Dragonborn_english.ILSTRINGS" --stats

显示统计信息

esp_extractor -i "Data/Skyrim.esm" --stats

包含特殊情况

# 包含本地化字符串
esp_extractor -i "Data/MyMod.esp" --include-localized

# 包含所有字符串(不过滤)
esp_extractor -i "Data/MyMod.esp" --unfiltered

应用翻译

# 完整文件翻译
esp_extractor -i "Data/MyMod.esp" --apply-file "MyMod_CN.json" -o "Data/MyMod_CN.esp"

# JSON字符串翻译(推荐用于少量翻译)
esp_extractor -i "Data/MyMod.esp" --apply-jsonstr '[{"editor_id":"IronSword","form_id":"00012BB7|Skyrim.esm","original_text":"铁剑","record_type":"WEAP","subrecord_type":"FULL"}]' -o "Data/MyMod_CN.esp"

# 从标准输入读取翻译
cat MyMod_translations.json | esp_extractor -i "Data/MyMod.esp" --apply-partial-stdin -o "Data/MyMod_CN.esp"

# 自动命名输出文件(覆盖原文件)
esp_extractor -i "Data/MyMod.esp" --apply-file "MyMod_CN.json"
# 输出: MyMod.esp (覆盖原文件,会自动创建备份)

esp_extractor -i "Data/MyMod.esp" --apply-jsonstr '[...]'
# 输出: MyMod.esp (覆盖原文件,会自动创建备份)

测试文件重建

# 测试解析和重建逻辑(用于调试)
esp_extractor -i "Data/MyMod.esp" --test-rebuild

# 指定输出文件
esp_extractor -i "Data/MyMod.esp" --test-rebuild -o "MyMod_test.esp"

文件结构对比

# 对比两个ESP文件的结构差异
esp_extractor -i "Data/MyMod_Original.esp" --compare-files "Data/MyMod_Modified.esp"

# 静默模式对比(仅显示差异)
esp_extractor -i "Data/MyMod_Original.esp" --compare-files "Data/MyMod_Modified.esp" --quiet

📄 输出格式

程序输出 JSON 格式的字符串数组:

{
  "editor_id": "IronSword",
  "form_id": "00012BB7|Skyrim.esm", 
  "original_text": "Iron Sword",
  "record_type": "WEAP",
  "subrecord_type": "FULL"
}

字段说明

  • editor_id: 编辑器ID
  • form_id: FormID|主文件名
  • original_text: 原始文本(提取时为原文,应用翻译时修改为译文)
  • record_type: 记录类型
  • subrecord_type: 子记录类型

🔑 匹配机制

应用翻译时使用三重匹配确保精确性:

  • editor_id + form_id + record_type + " " + subrecord_type
  • 这避免了不同对象共享相同ID时的冲突

🎮 支持的记录类型

  • WEAP (武器): FULL, DESC
  • ARMO (装备): FULL, DESC
  • NPC_ (NPC): FULL, SHRT
  • BOOK (书籍): FULL, DESC, CNAM
  • QUST (任务): FULL, CNAM, NNAM
  • INFO (对话): NAM1, RNAM
  • DIAL (对话主题): FULL
  • MESG (消息): DESC, FULL, ITXT
  • 以及更多... (详见 data/string_records.json)

🔍 字符串过滤规则

自动过滤的内容:

  • 空字符串
  • 驼峰命名变量 (MyVariable)
  • 下划线命名变量 (my_variable)
  • 黑名单文本 (<p>)
  • 控制字符

支持的字符:

  • ✅ 所有Unicode可打印字符(中文、日文、韩文等)
  • ✅ 英文字符和数字
  • ✅ 标点符号和空格

💡 翻译工作流最佳实践

1. 高效翻译建议

  • 使用部分翻译:只翻译需要的条目,减少文件大小
  • 三重匹配验证:确保 editor_id + form_id + record_type + " " + subrecord_type 匹配正确
  • 自动备份:程序会自动创建 .bak 备份文件
  • 使用翻译工具(如 ChatGPT、DeepL)处理大量文本
  • 保持游戏术语的一致性

2. 部分翻译工作流

# 1. 提取所有字符串
esp_extractor -i "MyMod.esp" -o "all_strings.json"

# 2. 选择需要翻译的条目,复制到单独文件或直接使用
# 3. 修改 original_text 字段为翻译文本
# 4. 应用翻译
esp_extractor -i "MyMod.esp" --apply-jsonstr '[翻译的JSON对象]' -o "MyMod_CN.esp"

# 或者从文件应用
esp_extractor -i "MyMod.esp" --apply-file "selected_translations.json" -o "MyMod_CN.esp"

# 或者从标准输入应用(适合脚本处理)
cat selected_translations.json | esp_extractor -i "MyMod.esp" --apply-partial-stdin -o "MyMod_CN.esp"

3. 质量控制

  • 翻译完成后在游戏中测试
  • 检查特殊字符是否正确显示
  • 验证格式字符串是否保留
  • 使用备份文件快速恢复

4. 版本管理

  • 保留原始提取的JSON文件
  • 程序自动创建时间戳备份文件
  • 使用版本控制系统管理翻译文件

🛠️ 故障排除

常见问题

  1. "Invalid file format" 错误

    • 确保文件是有效的 ESP/ESM/ESL 文件
  2. "Insufficient data" 错误

    • 文件可能被截断或损坏
  3. 编码问题

    • 程序会自动尝试多种编码
  4. 翻译应用失败

    • 检查JSON文件格式
    • 确保FormID匹配

🎮 支持的游戏

  • The Elder Scrolls V: Skyrim Special Edition

📄 文件格式支持

  • ESP (Elder Scrolls Plugin)
  • ESM (Elder Scrolls Master)
  • ESL (Elder Scrolls Light)

📚 API文档

详细的API文档可以在 docs.rs 上查看。

🎮 开发

🛠️ 构建

# 构建库
cargo build

# 构建命令行工具
cargo build --features cli

# 运行测试
cargo test

# 生成文档
cargo doc --open

📁 目录结构

src/
├── lib.rs          # 库的主入口
├── main.rs         # 命令行工具入口
├── datatypes.rs    # 基础数据类型定义
├── record.rs       # 记录解析逻辑
├── group.rs        # 组解析逻辑
├── plugin.rs       # 插件主类
├── subrecord.rs    # 子记录解析
├── string_types.rs # 字符串类型定义
├── utils.rs        # 工具函数
└── debug.rs        # 调试工具
data/
└── string_records.json  # 字符串记录定义

🤝 贡献

欢迎贡献代码!请查看 CONTRIBUTING.md 了解详细信息。

📜 许可证

本项目采用 MIT 或 Apache-2.0 双重许可证。详情请查看 LICENSE-MITLICENSE-APACHE 文件。

🎉 致谢

  • Bethesda Game Studios - 创造了这些出色的游戏
  • ESP文件格式的逆向工程社区
  • Rust社区提供的优秀库和工具
Commit count: 9

cargo fmt