标题: [已完成] 数据组合分析或组合提取
[打印本页]
作者: lxh623
时间: 2009-6-14 13:36
标题: [已完成] 数据组合分析或组合提取
数据的组合提取——批处理
总的要求:有一个文本,如下。数据以分号隔开,想以“行”为单位,进行组合分析,得出每行最可能出现的三个或四个……数据的组合。比如,1000行数据,经过分析得出最少可以用270个3数据组合(或200个4数据组合;或150个5数据组合……或x个n数据组合)表示,并且列出这些数据组合。
操作的文字表达:
1、附件除去空格(这一步自己可以实现完成),复制到新文本a。
2、提取3数据组合
2.1 每行m个数据段,组合提取3段,到文本b。m<3,提取m段。提取一次,作为一行。每行内部,数据段按字母顺序排列(方便下一步);
2.2 找出文本b中出现次数最多的组合,写入文本“3数据组合”;
2.3 找出文本a中含有该组合(不是排列)的行,并且删除该行,清空文本b;
2.4 重复2.1-2.3的步骤,直到文本a为空。
3、提取n数据组合
n=4-10,同上面“1+2”,除了“组合提取3段”改为“组合提取4-10段”、文本“3数据组合”相应修改。需要再运行7次。
A01-F; A06-A00E1; F03-C
A06-A00D; A10-E19; E05-E02B; E05-E03A
A06-A00E2; A08-R01; A09-A01A; A11-A02; A11-B05; A11-C02B; A12-W11A; H06-C04A; J01-G03B; J01-H02B
A06-A00A; A06-A00E1; A12-W12A; F03-C05
A05-H01B; A06-A00E1; A12-S05F; A12-S05G; A12-S05M; F02-C01; F03-C05
A06-A00E1; A11-C02C; A12-B01C; F01-H06; F03-E01; G02-A05
A06-A00C; A11-B02B; A11-B15B; A11-C02; A12-E06B; A12-E07A; A12-E07B; A12-R01; A12-S05G; A12-S05L; D0
A06-A00E1; A12-B05; F01-H06; G02-A05H; L01-F03A1
麻烦您了!
看来没办法,放弃!!
[
Last edited by lxh623 on 2009-6-20 at 09:32 ]
附件
1:
C4.rar (2009-6-14 13:36, 5.67 K,下载次数: 6)