中国DOS联盟

-- 联合DOS 推动DOS 发展DOS --

联盟域名：www.cn-dos.net　论坛域名：www.cn-dos.net/forum
DOS，代表着自由开放与发展，我们努力起来，学习FreeDOS和Linux的自由开放与GNU精神，共同创造和发展美好的自由与GNU GPL世界吧！

游客注册登录会员网志搜索命令提示符 Bash 上传统计

中国DOS联盟论坛
现在时间是 2026-06-15 09:54

欢迎新会员 luminwei　 RSS
共 47,998 篇主题 / 350,066 篇帖子 / 今日 0 篇 / 48,211 位会员

中国DOS联盟论坛 » DOS开发编程 & 发展交流（开发室） » 二进制方式处理文件工具 STR (2020.11.16 更新) 查看 39,790　回复 70

楼主 二进制方式处理文件工具 STR (2020.11.16 更新) 发表于 2008-04-26 21:45　·　中国北京电信

19951001

高级用户

★★

流落街头

积分 570
发帖 272
注册 2005-10-17 10:51
UID 43609
性别男
来自北京

状态离线

STR
File: A File to be Processed data. //文件
Start: Offset to Process data. //文件中处理数据的起始位置（文件的开头位置为0）
Bytes: Bytes to Process. //要处理的字节数量（如果输入0，则表示从Start开始到文件末尾）
/C: Copy Bytes from File to dstFile. //从源文件向目标文件复制数据
/I: Insert Bytes to dstFile from File. //从源文件向目标文件插入数据，插入数据后目标文件增加 Bytes个字节
dstFile: A File to Write Result data. //目标文件
Address: Offset to Write Result data. //目标文件中要复制或插入数据的位置（如果目标文件不存在，该值被忽略）

STR
/D: Delete Bytes from File & Write Result to dstFile. //从源文件删除数据并结果写入目标文件

STR
/V: View File In Hex Style. //十六进制方式查看文件
/A: Show ASCII Value. //显示ASCII码
/P: Pause Echo Screen. //满屏暂停

STR :
Bytes: Must be 0. //必须为0
/F: Find String in File. //在文件中查找字符串
/Hex: Hex Style. //十六进制方式
/Asc: ASCII Style. //ASCII码方式
Value: Hex_Digital/ASCII String (40 Characters Maximum). //字符传真的值，最长40个字符（如果是十六进制串长度应为双数）
/I: Ignore Case. //忽略大小写
/A: Process All Value in File. //在文件中查找所有满足要求的字符串（默认查找1次）

STR :
Bytes: Must be 0. //必须为0
/E: Edit File. //编辑文件

STR
Bytes: Must be 0. //必须为0
/R: Relace SrcString with DstString. //字符常替换
SrcString: :. //源串，可以使用十六进制或ASCII码串
DstString: :. //目标串，可以使用十六进制或ASCII码串
/A: Process All SrcString in File. //在文件中查找所有源字符串（默认替换1次）

说明：
1 使用 /C 和 /I 命令时，如果目的文件不存在，Adress 的值将被忽略，直接执行将源文件从 Start 开始的 Bytes 个字节写入到新创建的目的文件中
2 使用 /C 和 /I 命令时，如果目的文件存在，并且不输入 Address，则Address 默认为0，也就是文件的起始位置。
3 目前处理的单个文件大小不超过 2G

例子：

str 1.exe 0x100 0x10 /d 2.bin 执行将文件1.exe 从位置256开始的16个字节删除，并将结果写入到2.bin，文件2.bin的长度将比1.exe长度小16
str 1.exe 0x100 0x10 /c 2.bin 20 执行将文件1.exe 从位置256开始的16个字节写入到2.bin的20位置,也就是文件2.bin从位置20开始的16字节被覆盖
str 1.exe 0x100 0x10 /i 2.bin 20 执行将文件1.exe 从位置256开始的16个字节插入到2.bin的20位置，结果文件2.bin的长度将增加16字节

str 1.exe 0x100 0 /v /p /a 从文件偏移位置256开始在屏幕上显示文件内容，如果Bytes输入为0，则表示从Start开始至文件末尾。

str 1.exe 0x100 0 /e /hex:11223344 将文件偏移位置256开始的4个字节修改为，0x11,0x22,0x33,0x44。
str 1.exe 0x100 0 /e /asc:1234 将文件偏移位置256开始的4个字节修改为，1234, 也就是0x31,0x32,0x33,0x34

查找替换算法使用的是 KMP 算法，不重复计数，如文件 1.txt 的内容为10个字符0：
0000000000

如执行命令： str 1.txt 0 0 /f /asc:0000 /a
则执行结果为：
Find string At:
0 0x0
4 0x4

不会是：
Find string At:
0 0x0
1 0x1
2 0x2
3 0x3
4 0x4
5 0x5
6 0x6

压缩包中包含DOS版本和Win32版本

2008.12.14 修正替换字符串功能中存在的问题

2008.12.19 修正19楼存在问题

2009.2.15 测试版本在50楼

[ Last edited by 19951001 on 2020-11-16 at 17:01 ]

[已使用 Gemini 解答]

Gemini 解答

技术背景与功能实现解析

STR 工具是一个针对 DOS 与 Win32 环境设计的命令行二进制文件处理器。在 2000 年代中后期的 DOS 技术社区中，这类工具常用于补丁制作、汉化修改、自动化脚本处理以及对二进制数据流的精确控制。

1. 核心操作模式：复制、插入与删除

该工具通过区分 /C (Copy)、/I (Insert) 和 /D (Delete) 三种模式，解决了二进制文件编辑中常见的对齐与位移问题：

覆盖模式 (/C)：对应于传统的随机读写（Random Access）操作，使用 fseek 定位后直接 fwrite，目标文件长度仅在写入位置超过原文件末尾时才会增加。

插入模式 (/I)：这在低级语言实现中较为复杂。程序需要先将目标文件从 Address 处起的后续数据向后移动 Bytes 个字节（通常在内存中缓存或通过临时文件交换），然后再写入源数据。

删除模式 (/D)：实质是文件的“裁剪”操作，将 Start 之前和 Start + Bytes 之后的数据拼接并写入新文件。

2. 文件大小限制与偏移量处理

帖子提到“处理单个文件大小不超过 2G”。这是由于工具在 32 位环境下开发，使用了符号化的 32 位整数（signed long）来表示文件指针偏移量。在 C 标准库的 fseek 和 ftell 函数中，偏移量上限为 $2^{31}-1$ 字节，即 2,147,483,647 字节（2GB）。若要处理超过 2GB 的文件，在 DOS 环境下需依赖编译器特定的 64 位 I/O 函数（如 _fseeki64）或直接调用中断/系统 API（如 DOS 的 INT 21h, AX=4200h 虽然也是 32 位，但某些扩展环境支持更大寻址）。

3. 搜索算法：KMP 与不重复计数

作者明确指出使用了 KMP (Knuth-Morris-Pratt) 算法。

算法优势：KMP 算法在处理二进制搜索时具有 $O(m+n)$ 的时间复杂度，通过预处理模式串的“失配函数”（Partial Match Table），避免了在匹配失败时回溯主串指针，这对于大文件和磁盘 I/O 密集型操作具有显著的性能优势。

非重叠匹配逻辑：示例中提到的 0000 匹配 0000000000 得到 0 和 4 的偏移位置。这符合工程实践中的“消耗性匹配”原则——一旦一个子串被匹配，搜索指针会跳转到该子串末尾之后开始下一次搜索。这与文本替换逻辑一致，防止了因重叠而导致的逻辑混淆或死循环替换。

4. 字符串输入与十六进制转换

工具支持 /Hex 和 /Asc 两种输入方式，这在 DOS 开发中是典型的需求。

十六进制处理：程序通常需要将输入的字符串（如 112233）按每两个字符一组转换为一个字节。作者提醒“十六进制串长度应为双数”，是为了确保字节对齐，防止在处理末尾孤立字符时产生歧义。

大小写忽略 (/I)：在二进制搜索中，/I 通常仅对 /Asc 模式有效。它在内部实现时，会将主串和模式串的字节统一转换为大写（或小写）后再进行比较。

5. 环境兼容性：DOS 与 Win32

提供 DOS 版本通常意味着程序采用了 DJGPP（支持 32 位保护模式的 DPMI 环境）或 Turbo C/Borland C++（16 位实模式）进行编译。考虑到 2GB 文件的处理能力，该 DOS 版本极大概率是基于 DPMI 扩展的 32 位 DOS 程序，否则在 16 位实模式下，处理超过 64KB 的内存缓冲区或 2GB 的文件定位会面临显著的段寻址限制。

6. 异常处理与边界条件

目标文件不存在：工具在 /C 或 /I 模式下若找不到 dstFile 会自动创建，此时 Address 失去偏移意义，等同于文件提取。

十六进制查看 (/V)：这是典型的 Hex Dump 实现，通常以 16 字节为一行，左侧显示十六进制码，右侧显示可打印的 ASCII 字符，不可打印字符则以点号 . 代替。

该工具是典型的 DOS 末期至 Windows 普及期过渡阶段的技术产物，强调对底层数据的直接操纵，而不依赖重型的十六进制编辑器界面，适合在批处理脚本中实现自动化部署。

附件

str.rar (18.38 KiB, 下载附件所需积分 1 点, 下载次数: 168)

strWin32.rar (20.34 KiB, 下载次数: 10)

第 2 楼发表于 2008-04-28 17:29　·　中国广东深圳电信

cchessbd

高级用户

★★

积分 525
发帖 222
注册 2006-08-28 21:07
UID 61476

状态离线

可能这个东西我用不到，但是我需要一个DOS下查找替换文件中的某个字符串的工具……

不知道 19950101兄能否帮忙写一个？

比如: XXX /rN file "12345,d" "54321,g"

查找到才替换，或替换一次就退出。
替换所有 /r N次 /rN

此文件可能会有 3~10 M

[ Last edited by cchessbd on 2008-4-28 at 05:39 PM ]

第 3 楼发表于 2008-05-07 22:52　·　中国北京电信

19951001

高级用户

★★

流落街头

积分 570
发帖 272
注册 2005-10-17 10:51
UID 43609
性别男
来自北京

状态离线

Originally posted by cchessbd at 2008-4-28 17:29:
可能这个东西我用不到，但是我需要一个DOS下查找替换文件中的某个字符串的工具……

不知道 19950101兄能否帮忙写一个？

比如: XXX /rN file "123 ...

只需要对文本文件处理吗？

第 4 楼发表于 2008-11-14 21:20　·　中国北京电信

19951001

高级用户

★★

流落街头

积分 570
发帖 272
注册 2005-10-17 10:51
UID 43609
性别男
来自北京

状态离线

2008.11.14 更新

第 5 楼发表于 2008-11-15 00:01　·　中国江苏苏州电信

本是

银牌会员

★★★

积分 2,223
发帖 789
注册 2005-01-27 00:00
UID 35703
性别男

状态离线

好工具，但.rar 解压时报错：文件"WIN"头被损坏！
请重新上传！！！

my major is english----my love is dos----my teacher is the buddha----my friends--how about U

第 6 楼发表于 2008-11-15 08:07　·　中国浙江台州温岭市电信

雨露

管理员

★★★★

DOS非常爱好者

积分 6,215
发帖 2,601
注册 2006-01-20 13:00
UID 49256

状态离线

报错后win32文件夹是空的!

第 7 楼发表于 2008-11-15 11:13　·　中国江苏苏州电信

本是

银牌会员

★★★

积分 2,223
发帖 789
注册 2005-01-27 00:00
UID 35703
性别男

状态离线

文件WIN在根目录。

my major is english----my love is dos----my teacher is the buddha----my friends--how about U

第 8 楼发表于 2008-11-15 11:42　·　中国北京电信

19951001

高级用户

★★

流落街头

积分 570
发帖 272
注册 2005-10-17 10:51
UID 43609
性别男
来自北京

状态离线

已经修复破损的压缩包

第 9 楼发表于 2008-11-24 21:25　·　中国广东东莞电信

chishingchan

银牌会员

★★★

积分 1,282
发帖 538
注册 2002-11-02 00:00
UID 129
性别男

状态离线

因需修改二进制文件，这种小软件我以前寻找过，只找到纯DOS下的FH，现在这个应该不错。

第 10 楼发表于 2008-12-13 11:07　·　中国广西河池电信

goli2008

中级用户

★★

积分 252
发帖 97
注册 2006-09-17 12:00
UID 62869
性别男

状态离线

坚决支持，！！
找了好久，请楼主将标题改改，可好，方便其他人搜索，谢谢！

第 11 楼发表于 2008-12-13 18:10　·　中国福建泉州电信

chenall

银牌会员

★★★

积分 1,276
发帖 469
注册 2002-12-23 13:00
UID 586
性别男
来自福建泉州

状态离线

好东西,收下了,谢谢!

[已使用 Gemini 解答]

Gemini 解答

在 CN-DOS.net 的技术讨论语境下，该帖子讨论的是 19951001 开发的二进制文件处理工具 STR。这类工具在 2000 年前后及 2008 年左右的 DOS/Win32 混合维护环境下具有极高的实用价值，尤其是在批量修改固件、处理引导扇区或通过批处理自动化修改二进制配置时。

以下是对该工具及其技术实现背景的补充与解释：

1. 技术背景与定位

在 DOS 时代，虽然有著名的磁盘编辑工具如 Norton Utilities 中的 DISKEDIT 或编程调试工具 DEBUG，但它们大多偏向交互式操作，不便于在批处理（.BAT）中实现自动化。STR 工具填补了这一空白，其功能类似于类 Unix 系统中的 dd、sed（针对二进制）或 hexdump 的综合体。它通过命令行参数直接控制偏移量（Offset）和字节长度，解决了在命令行环境下精确控制二进制文件内容的问题。

2. 核心功能与实现机制

二进制安全（Binary Safe）：与传统的 FIND 或 TYPE 等文本处理工具不同，STR 能够处理包含 0x00（Null 字符）和 0x1A（EOF 字符）的二进制数据。在 DOS 下，许多工具读取到 0x1A 就会停止，而 STR 使用底层文件指针定位（通常是 C 语言中的 fseek 或汇编的 INT 21h/42h），因此可以处理最大 2GB 的文件（受限于 32 位有符号偏移量限制）。

KMP 算法的应用：作者在说明中提到查找/替换功能使用了 KMP (Knuth-Morris-Pratt) 算法。这是一个经典的字符串匹配算法，其核心优势在于：当发生不匹配时，利用已匹配的部分信息，通过“部分匹配表”将模式串尽可能向右滑动，而不需要回溯源文件指针。

非重叠查找特性：正如作者举例，在 0000000000（10个0）中查找 0000（4个0），结果是位置 0 和位置 4。这是标准的 KMP 实现逻辑，即匹配成功后，从匹配序列的最后一个字符之后开始下一轮匹配，避免了重叠导致的循环逻辑复杂化。

插入与删除操作的工程实现：在文件系统中，文件通常是按簇存储的。对于 /I（插入）和 /D（删除）操作，底层的实现原理通常是：

删除：读取待删除部分之后的所有数据，将其向前移动（覆盖待删除部分），最后截断文件（使用 chsize 或 INT 21h/40h 且 CX=0）。

插入：需要创建一个临时文件或在内存缓冲区中重构数据流。对于大文件，通常先将插入点之后的内容写入临时位置，插入新数据后再拼接回来。

3. 环境与参数处理

十六进制与 ASCII 兼容：工具支持 /Hex 和 /Asc 前缀，这在当年处理非显示字符（如引导扇区标志 55 AA）时非常重要。十六进制输入要求“双数”长度（每两个字符代表一个字节），这是为了防止解析歧义。

2GB 限制：作者提到的 2GB 限制是典型的 32 位文件指针限制。在 FAT32 分区下，虽然单个文件最大支持 4GB，但如果程序内部使用了有符号 32 位整型（long）来处理 fseek 偏移量，其最大寻址范围即为 $2^{31}-1$ 字节，即 2GB。

4. 历史关联

正如 9 楼用户提到的 FH (File Hammer)，在 STR 出现之前，DOS 用户常用 FH 或 BBE (Binary Block Editor) 进行此类操作。STR 的优势在于其集成了查看（View）、查找（Find）、编辑（Edit）、替换（Replace）、复制（Copy）和插入（Insert）多种功能于一体，并同时提供了 DOS（16位）和 Win32（32位）两个版本，适应了当时从 DOS 到 Windows XP 时代的过渡需求。

对于 12 月 13 日 chenall 的回复，由于该用户是当时 DOS/Grub4Dos 社区的技术大牛，他的认可说明该工具在处理诸如 GRLDR 或磁盘镜像等底层任务时具有较好的可靠性。

QQ:366840202
http://chenall.net

第 12 楼发表于 2008-12-13 19:10　·　中国福建泉州电信

chenall

银牌会员

★★★

积分 1,276
发帖 469
注册 2002-12-23 13:00
UID 586
性别男
来自福建泉州

状态离线

可不可以再加个功能"字符转义"
比如\0 就是ASCII码00
比如
strw test.bin 0x10 0 /e /asc:test\13\0
会写入test和0X0D和0X00

QQ:366840202
http://chenall.net

第 13 楼发表于 2008-12-13 22:28　·　中国北京电信

19951001

高级用户

★★

流落街头

积分 570
发帖 272
注册 2005-10-17 10:51
UID 43609
性别男
来自北京

状态离线

Originally posted by chenall at 2008-12-13 19:10:
可不可以再加个功能"字符转义"
比如\0 就是ASCII码00
比如
strw test.bin 0x10 0 /e /asc:test\13\0
会写入test和0X0D和0X00

理论上可以实现，不过我近些日子比较忙，暂时没有时间修改

其实也可以这样实现
strw test.bin 0x10 0 /e /asc:test
strw test.bin 0x14 0 /e /hex:1300
上述两条命令可以实现你要的功能

[ Last edited by 19951001 on 2008-12-13 at 23:18 ]

第 14 楼发表于 2008-12-14 09:43　·　中国福建泉州电信

chenall

银牌会员

★★★

积分 1,276
发帖 469
注册 2002-12-23 13:00
UID 586
性别男
来自福建泉州

状态离线

嗯,上面是可以实现,只是如果放在批处理里面要计算字符长度会比较麻烦.

另一个问题,不知程序有没有返回errorleve值?
比如查找,成功返回?失败返回?

QQ:366840202
http://chenall.net

第 15 楼发表于 2008-12-14 10:14　·　中国福建泉州电信

chenall

银牌会员

★★★