中国DOS联盟

-- 联合DOS 推动DOS 发展DOS --

联盟域名:www.cn-dos.net 论坛域名:www.cn-dos.net/forum
DOS,代表着自由开放与发展,我们努力起来,学习FreeDOS和Linux的自由开放与GNU精神,共同创造和发展美好的自由与GNU GPL世界吧!

中国DOS联盟论坛
现在时间是 2026-06-13 20:38
中国DOS联盟论坛 » DOS批处理 & 脚本技术(批处理室) » sed 命令能否分割TXT文档?
楼 主 sed 命令能否分割TXT文档? 发表于 2008-07-11 17:47 ·  中国 山东 济宁 联通
初级用户
★★
积分 154
发帖 67
注册 2007-10-31 13:18
UID 101283
性别 男
状态 离线
请教各位大侠,在txt文本行数未知的情况下,
sed能否按照每6万条数据来分割TXT文档呢?
2 发表于 2008-07-13 00:44 ·  中国 湖北 武汉 武昌区 电信
版主
★★★★★
积分 11,386
发帖 4,938
注册 2006-07-23 17:10
UID 59080
状态 离线
这个你应该用split来分隔更方便。
3 发表于 2008-07-13 01:42 ·  中国 山东 济宁 联通
初级用户
★★
积分 154
发帖 67
注册 2007-10-31 13:18
UID 101283
性别 男
状态 离线
split 只能按照容量分割啊?
这样数据会被断行的
而且也达不到要取60000行的要求.
4 发表于 2008-07-13 02:18 ·  中国 湖北 武汉 武昌区 电信
版主
★★★★★
积分 11,386
发帖 4,938
注册 2006-07-23 17:10
UID 59080
状态 离线
你怎么就知道不可以呢?
split --help
5 发表于 2008-07-14 00:18 ·  中国 山东 济宁 联通
初级用户
★★
积分 154
发帖 67
注册 2007-10-31 13:18
UID 101283
性别 男
状态 离线
斑竹,几天前就查过了。只有一个按 容量划分的像 -100k 这样,还有一个按照软盘容量划分的 -a 参数,没有别的了啊?
6 发表于 2008-07-14 01:50 ·  中国 山东 济宁 联通
初级用户
★★
积分 154
发帖 67
注册 2007-10-31 13:18
UID 101283
性别 男
状态 离线
难道是自己用的split 0.92 版本太低?不支持 split -100 a.txt这种格式?

换用下面的代码了,可惜速度不是很快...45秒仅能处理1万条。

@echo off
for /f %%i in ('sed -n "$=" a.txt') do set number=%%i
:loop
set /a num+=1
set /a n=(%num%-1)*100+1
set /a m=100*%num%
sed "%n%,%m%w a_%num%.txt" a.txt
if %m% LSS %number% goto :loop

[ Last edited by youaoyi on 2008-7-14 at 01:53 AM ]
7 发表于 2008-07-14 14:11 ·  中国 湖北 武汉 联通
版主
★★★★★
积分 11,386
发帖 4,938
注册 2006-07-23 17:10
UID 59080
状态 离线
D:\lxmxn\work\Other>(echo hello,world&echo.this is the second line of the output&echo.cn-dos.net&echo\OK,let's go&echo/Thanks a lot) | split -l 2

D:\lxmxn\work\Other>dir /b x*
xaa
xab
xac

D:\lxmxn\work\Other>type x*

xaa


hello,world
this is the second line of the output

xab


cn-dos.net
OK,let's go

xac


Thanks a lot

D:\lxmxn\work\Other>split --version
split (textutils) 2.1
Written by Torbjorn Granlund and Richard M. Stallman.

Copyright (C) 2002 Free Software Foundation, Inc.
This is free software; see the source for copying conditions. There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.

D:\lxmxn\work\Other>
我用的win32版本,并非DOS版本,应该是又DOS版本的。

win32 下载地址:http://www.vkill.net/tools/split_.rar
8 发表于 2008-07-14 17:25 ·  中国 山西 电信
银牌会员
★★★
天的白色影子
积分 2,343
发帖 636
注册 2004-03-06 00:00
UID 19350
性别 男
状态 离线
是有个叫 csplit.exe 的 GNU Unix Util
可以这里下载到它的Win32移植版本
http://unxutils.sourceforge.net/

http://unxutils.sourceforge.net/UnxUtils.zip
http://unxutils.sourceforge.net/UnxUpdates.zip

里面也包含了sed/gawk/agrep/egrep/fgrep等常用与非常用的Unix命令移植版
9 发表于 2008-07-15 20:38 ·  中国 浙江 杭州 电信
中级用户
★★
拟谷盗
积分 312
发帖 108
注册 2007-01-21 11:36
UID 77238
性别 男
状态 离线
试一试 awk

gawk "{n=int((NR-1)/100)+1;{print $0>>\"a_\"n\".txt\"}}" a.txt

win32版 gawk下载地址:http://www.vkill.net/tools/gawk_3.1.5.rar

[ Last edited by ngd on 2008-7-16 at 04:42 PM ]
FLOSS
10 发表于 2008-07-15 22:48 ·  中国 浙江 杭州 电信
中级用户
★★
拟谷盗
积分 312
发帖 108
注册 2007-01-21 11:36
UID 77238
性别 男
状态 离线
不借助外部工具

忽略空行

@echo off & setlocal enabledelayedexpansion
set m=1
for /f "delims=" %%a in (a.txt) do (
if !n! GEQ 100 set n=0 & set/a m+=1
echo %%a>>a_!m!.txt
set/a n+=1
)

保留空行

@echo off & setlocal enabledelayedexpansion
set m=1
for /f "delims=" %%a in ('findstr /n .* a.txt') do (
if !n! GEQ 100 set n=0 & set/a m+=1
for /f "tokens=1* delims=:" %%i in ("%%a") do echo.%%j>>a_!m!.txt
set/a n+=1
)
本帖最近评分记录 (共 1 条) 点击查看详情
评分人分数时间
jvive +2 2008-07-18 09:35
FLOSS
论坛跳转: