发布网友 发布时间:2022-04-22 19:53
共3个回答
懂视网 时间:2022-04-19 00:06
在Linux中有很多方法逐行读取一个文件的方法,其中最常用的就是下面的脚本里的方法,而且是效率最高,使用最多的方法。为了给大家一个直观的感受,我们将通过生成一个大的文件的方式来检验各种方法的执行效率。方法1:while循环中执行效率最高,最常用的方法。
function while_read_LINE_bottm(){ While read LINE do echo $LINE done < $FILENAME }
注释:我习惯把这种方式叫做read釜底抽薪,因为这种方式在结束的时候需要执行文件,就好像是执行完的时候再把文件读进去一样。
方法2 : 重定向法;管道法: cat $FILENAME | while read LINE
Function While_read_LINE(){ cat $FILENAME | while read LINE do echo $LINE done }
注释:我只所有把这种方式叫做管道法,相比大家应该可以看出来了吧。当遇见管道的时候管道左边的命令的输出会作为管道右边命令的输入然后被输入出来。
方法3: 文件描述符法
Function while_read_line_fd(){ Exec 3<&0 Exec 0<$FILENAME While read LINE Do Echo $LINE Exec 0<&<3 }
注释: 这种方法分2步骤,第一,通过将所有内容重定向到文件描述符3来关闭文件描述符0.为此我们用了语法Exec 3<&0 。第二部将输入文件放送到文件描述符0,即标准输入。
方法4 for 循环。
function for_in_file(){ For i in `cat $FILENAME` do echo $i done }
注释:这种方式是通过for循环的方式来读取文件的内容相比大家很熟悉了,这里不多说。对各个方法进行测试,看那方法的执行效率最高。
首先我们用脚本(脚本见附件)生成一个70000行的文件,文件位置在/scripts/bigfile。然后通过下面的脚本来测试各个方法的执行效率,脚本很简单,不再解释。
#!/bin/bash FILENAME="$1" TIMEFILE="/tmp/loopfile.out" > $TIMEFILE SCRIPT=$(basename $0) function usage(){ echo -e " USAGE: $SCRIPT file " exit 1 } function while_read_bottm(){ while read LINE do echo $LINE done < $FILENAME } function while_read_line(){ cat $FILENAME | while read LINE do echo $LINE done } function while_read_line_fd(){ exec 3<&0 exec 0< $FILENAME while read LINE do echo $LINE done exec 0<&3 } function for_in_file(){ for i in `cat $FILENAME` do echo $i done } if [ $# -lt 1 ] ; then usage fi echo -e " starting file processing of each method " echo -e "method 1:" echo -e "function while_read_bottm" time while_read_bottm >> $TIMEFILE echo -e " " echo -e "method 2:" echo -e "function while_read_line " time while_read_line >> $TIMEFILE echo -e " " echo -e "method 3:" echo "function while_read_line_fd" time while_read_line_fd >>$TIMEFILE echo -e " " echo -e "method 4:" echo -e "function for_in_file" time for_in_file >> $TIMEFILE
执行脚本后: [root@localhost shell]# ./while /scripts/bigfile
脚本输出内容
method 1: function while_read_bottm real 0m5.6s user 0m3.399s sys 0m1.588s method 2: function while_read_line real 0m11.612s user 0m4.031s sys 0m4.956s method 3: function while_read_line_fd real 0m5.853s user 0m3.536s sys 0m1.469s method 4: function for_in_file real 0m5.153s user 0m3.335s sys 0m1.593s
下面我们对各个方法按照速度进行排序。
real 0m5.153s method 4 (for 循环法) real 0m5.6s method 1 (while 釜底抽薪法) real 0m5.853s method 3 (标识符法) real 0m11.612s method 2 (管道法)
由此可见在各个方法中,for语句效率最高,而在while循环中读写文件时,
while read LINE do echo $LINE done < $FILENAME
方式执行效率最高。
更多Shell逐行读取文件的4种方法相关文章请关注PHP中文网!
热心网友 时间:2022-04-18 21:14
几点问题:
1)管道符后面的命令都是要新建shell去执行的,也就是说,while循环中的内容都不是在当前shell中执行,而array是在while循环中赋值的,所以当执行完while循环返回到当前shell后,array的值丢失。
这一点必须清楚:新建shell可以继承当前shell的变量,相当于拷贝了变量的一个副本,而命令执行完退出新建shell后,新建shell中的变量也都随之湮灭。
2)awk本身就是逐行读入并处理文件的,while read line 也是这样,功能上有重叠,一般用其一即可,特殊情况除外。
3)这就一个字段而已,何必用数组array呢?当然,你要用数组也是可以的,只是我有点不理解。
4)如果$1是一个文件,不需要cat后再通过管道符传递,awk本身就可以直接处理文件
awk -F= '$1 ~ /'$args'/ {print $2}' $1 就可以,管道符能少用则少用。
修改建议:
保留awk,去除while read line,试试:
array=(`awk -F= '$1 ~ /'$args'/ {print $2}' $1`)
如果要保留你的while read line结构,那么:
while read line热心网友 时间:2022-04-18 22:32
这个是很贱的的shell编程, 但是被上面的一大堆垃圾代码弄得不知道是什么意思了。
看样子是shell外行?仔细看看回答者。