从这篇开始,是文本内容操作,区别于文本操作。
shell,perl,python,一直都是文本操作的专家语言,而我们今后学习的的将是shell的噱头--文本操作。下面提到最常见的一个:
grep
这算是文本内容的一个重量级选手,能根据某些规格在上千行的文本文件中查找所需要的数据。他能接受正则表达式和通配符。
基础实例:
1. 命令翻译包含给定match_pattern的文本行,如我在grep.txt中查找PATTERN
grep PATTERN grep.txt
or grep "PATTERN" grep.txt
2. 匹配多个文件
grep PATTERN grep.txt grep1.txt
3. 从stdin中读取
echo –e "this is a word\nnext line" | grep word
打印:this is a word
4. grep 与 正则表达式
grep –E "[a-z]+"
或者
egrep "[a-z]+"
5. 只输出匹配部分,而不是匹配的当前行
echo this is line. | greip –o –E "[a-z]+\."
输出:line
6. 打印除包含match_pattern的行之外的所有行,可使用
grep -v match_pattern file
7. 统计文本或者文件中包含匹配字符串的字数(这个面试经常会问到)
$grep -c "text" filename
但他给出的是匹配行的次数,而不是匹配的次数
统计匹配数量的话,可以用到下面的技巧
$echo –e "1 2 3 4\nhello\n5 6"| egrep -o "[0-9]" | wc –l
打印1到6 | 从stdin中读取数字,分行打印 | 统计行数
8. 打印行号
grep "text" -n filename
9. 搜2个文件,以及他们的行号,输出会打印文件名
grep "text"–n s1.txt s2.txt
10.如果你只想知道哪些文件有 单词PATTERN
grep –l PATTER s1.txt s2.txt
-L则返回的不匹配文件列表
11.可以再整个目录下查找 单词PATTERN 在那些文件里
grep PATTERN . -R -n
12 同时多个匹配查找
echo this is a line of text | grep -e "this" -e "line" -o
打印:
this
line
13 只在某些合适的文件中搜索
grep "main()" .-r --include *.{c,cpp}
只在.c 和.cpp结尾的文件中搜索 main()
14 进行搜索排除某些文件
grep "main()" . -r --exclude "README"
排除了所有文件名为"README"的文件
15 打印匹配之前或之后的3行
seq 10 | grep 5 –A 3 之前
seq 10 | grep 6 –B 3 之后
16 打印匹配前后3行,同时输出
seq 10 | grep 5 –C 3
我们来看下--help
用法: grep [选项]... PATTERN [FILE]...
在每个 FILE 或是标准输入中查找 PATTERN。 默认的 PATTERN 是一个基本正则表达式(缩写为 BRE)。 例如: grep -i 'hello world' menu.h main.c正则表达式选择与解释:
-E, --extended-regexp PATTERN 是一个可扩展的正则表达式(缩写为 ERE) -F, --fixed-strings PATTERN 是一组由断行符分隔的定长字符串。 -G, --basic-regexp PATTERN 是一个基本正则表达式(缩写为 BRE) -P, --perl-regexp PATTERN 是一个 Perl 正则表达式 -e, --regexp=PATTERN 用 PATTERN 来进行匹配操作 -f, --file=FILE 从 FILE 中取得 PATTERN -i, --ignore-case 忽略大小写 -w, --word-regexp 强制 PATTERN 仅完全匹配字词 -x, --line-regexp 强制 PATTERN 仅完全匹配一行 -z, --null-data 一个 0 字节的数据行,但不是空行
内容比较多,所以不全贴出来,全部内容在附件中。
大多数功能已经在实例中贴出,我的这个博文中,主要参考书籍《linux shell脚本攻略》
如果你觉得更是个学习时间比较充裕,不妨直接购买此书。