int regcomp(regex_t *preg, const char *regex, int cflags); |
int regexec(const regex_t *preg, const char *string, size_t nmatch, regmatch_t pmatch[], int eflags); typedef struct { regoff_t rm_so; regoff_t rm_eo; } regmatch_t; |
参数preg指向编译后的正则表达式,参数string是将要进行匹配的字符串,而参数nmatch和pmatch则用于把匹配结果返回给调用程序,最后一个参数eflags决定了匹配的细节。
在调用函数regexec()进行模式匹配的过程中,可能在字符串string中会有多处与给定的正则表达式相匹配,参数pmatch就是用来保存这些匹配位置的,而参数nmatch则告诉函数regexec()最多可以把多少个匹配结果填充到pmatch数组中。当regexec()函数成功返回时,从string+pmatch[0].rm_so到string+pmatch[0].rm_eo是第一个匹配的字符串,而从string+pmatch[1].rm_so到string+pmatch[1].rm_eo,则是第二个匹配的字符串,依此类推。
释放正则表达式
无论什么时候,当不再需要已经编译过的正则表达式时,都应该调用函数regfree()将其释放,以免产生内存泄漏。
void regfree(regex_t *preg); |
size_t regerror(int errcode, const regex_t *preg, char *errbuf, size_t errbuf_size); |
#include <stdio.h> #include <sys/types.h> #include <regex.h> /* 取子串的函数 */ static char* substr(const char*str, unsigned start, unsigned end) { unsigned n = end - start; static char stbuf[256]; strncpy(stbuf, str + start, n); stbuf[n] = 0; return stbuf; } /* 主程序 */ int main(int argc, char** argv) { char * pattern; int x, z, lno = 0, cflags = 0; char ebuf[128], lbuf[256]; regex_t reg; regmatch_t pm[10]; const size_t nmatch = 10; /* 编译正则表达式*/ pattern = argv[1]; z = regcomp(?, pattern, cflags); if (z != 0){ regerror(z, ?, ebuf, sizeof(ebuf)); fprintf(stderr, "%s: pattern '%s' ", ebuf, pattern); return 1; } /* 逐行处理输入的数据 */ while(fgets(lbuf, sizeof(lbuf), stdin)) { ++lno; if ((z = strlen(lbuf)) > 0 && lbuf[z-1] == ' ') lbuf[z - 1] = 0; |
#p#副标题#e#
/* 对每一行应用正则表达式进行匹配 */ z = regexec(?, lbuf, nmatch, pm, 0); if (z == REG_NOMATCH) continue; else if (z != 0) { regerror(z, ?, ebuf, sizeof(ebuf)); fprintf(stderr, "%s: regcom('%s') ", ebuf, lbuf); return 2; } /* 输出处理结果 */ for (x = 0; x < nmatch && pm[x].rm_so != -1; ++ x) { if (!x) printf("%04d: %s ", lno, lbuf); printf(" $%d='%s' ", x, substr(lbuf, pm[x].rm_so, pm[x].rm_eo)); } } /* 释放正则表达式 */ regfree(?); return 0; } |
# gcc regexp.c -o regexp # ./regexp 'regex[a-z]*' < regexp.c 0003: #include <regex.h> $0='regex' 0027: regex_t reg; $0='regex' 0054: z = regexec(?, lbuf, nmatch, pm, 0); $0='regexec' |
a=b=c=d=e=5; 按照赋值运算符的右接合性, 因此实际上等效于: e=5; d=e; c=d; b=c; a=b; |
#p#副标题#e#
2、注意在变量说明中给变量赋初值和赋值语句的区别。给变量赋初值是变量说明的一部分,赋初值后的变量与其后的其它同类变量之间仍必须用逗号间隔,而赋值语句则必须用分号结尾。
3、在变量说明中,不允许连续给多个变量赋初值。 如下述说明是错误的:
int a=b=c=5 |
int a=5,b=5,c=5; |
if((x=y+5)>0) z=x; |
if((x=y+5;)>0) z=x; |
void main() { int a=88,b=89; printf("%d %d ",a,b); printf("%d,%d ",a,b); printf("%c,%c ",a,b); printf("a=%d,b=%d",a,b); } a<--8,b<--89 printf("%d %d ",a,b); printf("%d,%d ",a,b); printf("%c,%c ",a,b); printf("a=%d,b=%d",a,b); |
#p#副标题#e#
本例中四次输出了a,b的值,但由于格式控制串不同,输出的结果也不相同。第四行的输出语句格式控制串中,两格式串%d 之间加了一个空格(非格式字符),所以输出的a,b值之间有一个空格。第五行的printf语句格式控制串中加入的是非格式字符逗号, 因此输出的a,b值之间加了一个逗号。第六行的格式串要求按字符型输出 a,b值。第七行中为了提示输出结果又增加了非格式字符串。
二、格式字符串
在Turbo C中格式字符串的一般形式为: [标志][输出最小宽度][.精度][长度]类型 其中方括号[]中的项为可选项。各项的意义介绍如下:
1.类型类型字符用以表示输出数据的类型,其格式符和意义下表所示:
表示输出类型的格式字符 | 格式字符意义 |
d | 以十进制形式输出带符号整数(正数不输出符号) |
o | 以八进制形式输出无符号整数(不输出前缀O) |
x | 以十六进制形式输出无符号整数(不输出前缀OX) |
u | 以十进制形式输出无符号整数 |
f | 以小数形式输出单、双精度实数 |
e | 以指数形式输出单、双精度实数 |
g | 以%f%e中较短的输出宽度输出单、双精度实数 |
c | 输出单个字符 |
s | 输出字符串 |
2、标志
标志字符为-、+、#、空格四种,其意义下表所示:
标志格式字符 | 标 志 意 义 |
- | 结果左对齐,右边填空格 |
+ | 输出符号(正号或负号)空格输出值为正时冠以空格, 为负时冠以负号 |
# | 对c,s,d,u类无影响;对o类,在输出时加前缀 |
o | 对x类,在输出时加前缀0x; 对e,g,f类当结果有小数时才给出小数点 |
void main() { int a=15; float b=138.3576278; double c=35648256.3645687; char d='p'; printf("a=%d,%5d,%o,%x ",a,a,a,a); printf("b=%f,%lf,%5.4lf,%e ",b,b,b,b); printf("c=%lf,%f,%8.4lf ",c,c,c); printf("d=%c,%8c ",d,d); } a<--15 b<--138.3576278 c<--35648256.3645687 d<--'p' main() { int a=29; float b=1243.2341; double c=24212345.24232; char c='h' printf("a=%d,%5d,%o,%x ",a,a,a,a); printf("b=%f,%lf,%5.4lf,%e ",b,b,b,b); printf("c=%lf,%f,%8.4lf ",c,c,c); printf("d=%c,%8c ",d,d); } |
本例第七行中以四种格式输出整型变量a的值,其中“%5d”要求输出宽度为5,而a值为15只有两位故补三个空格。第八行中以四种格式输出实型量b的值。其中“%f”和“%lf”格式的输出相同,说明“l”符对“f”类型无影响。
“%5.4lf”指定输出宽度为5,精度为4,由于实际长度超过5故应该按实际位数输出,小数位数超过4位部分被截去。第九行输出双精度实数,“%8.4lf”由于指定精度为4位故截去了超过4位的部分。第十行输出字符量d,其中“%bc”指定输出宽度为8故在输出字符p之前补加7个空格。
使用printf函数时还要注意一个问题,那就是输出表列中的求值顺序。不同的编译系统不一定相同,可以从左到右,也可从右到左。Turbo C是按从右到左进行的。如把例2.13改写如下述形式:
void main() { int i=8; printf("%d %d %d %d %d %d ", ++i,--i,i--,i++,-i--); } i<--8 |
#include<stdio.h> #include <stdio.h> void main(){ char a='B',b='o',c='k'; putchar(a);putchar(b);putchar(b); putchar(c);putchar(' '); putchar(a);putchar(b); putchar(' '); putchar(b);putchar(c); } |
数据输入语句
C语言的数据输入也是由函数语句完成的。本文介绍从标准输入设备—键盘上输入数据的函数scanf和getchar.
scanf函数
scanf函数称为格式输入函数,即按用户指定的格式从键盘上把数据输入到指定的变量之中。
一、scanf函数的一般形式
scanf函数是一个标准库函数,它的函数原型在头文件“stdio.h”中,与printf函数相同,C语言也允许在使用scanf函数之前不必包含stdio.h文件。scanf函数的一般形式为: scanf(“格式控制字符串”,地址表列);其中,格式控制字符串的作用与printf函数相同,但不能显示非格式字符串, 也就是不能显示提示字符串。
地址表列中给出各变量的地址。地址是由地址运算符“&”后跟变量名组成的。例如,&a,&b分别表示变量a和变量b 的地址。这个地址就是编译系统在内存中给a,b变量分配的地址。在C语言中,使用了地址这个概念,这是与其它语言不同的。
应该把变量的值和变量的地址这两个不同的概念区别开来。变量的地址是C编译系统分配的,用户不必关心具体的地址是多少。 变量的地址和变量值的关系如下: &a——>a567 a为变量名,567是变量的值,&a是变量a的地址。在赋值表达式中给变量赋值,如: a=567,在赋值号左边是变量名,不能写地址,而scanf函数在本质上也是给变量赋值,但要求写变量的地址,如&a. 这两者在形式上是不同的。&是一个取地址运算符,&a是一个表达式,其功能是求变量的地址。
void main() { int a,b,c; printf("input a,b,c "); scanf("%d%d%d",&a,&b,&c); printf("a=%d,b=%d,c=%d",a,b,c); } |
7 8 9 |
7 8 9 |
格式字符串
格式字符串的一般形式为: %[*][输入数据宽度][长度]类型 其中有方括号[]的项为任选项。各项的意义如下:
1.类型
表示输入数据的类型,其格式符和意义下表所示。
格式 | 字符意义 |
d | 输入十进制整数 |
o | 输入八进制整数 |
x | 输入十六进制整数 |
u | 输入无符号十进制整数 |
f或e | 输入实型数(用小数形式或指数形式) |
c | 输入单个字符 |
s | 输入字符串 |
scanf("%5.2f",&a); |
scanf("%d",a); |
scanf("%c%c%c",&a,&b,&c); |
输入为:
d e f
则把'd'赋予a, 'f'赋予b,'e'赋予c.只有当输入为:
def
时,才能把'd'赋于a,'e'赋予b,'f'赋予c. 如果在格式控制中加入空格作为间隔,如 scanf ("%c %c %c",&a,&b,&c);则输入时各数据之间可加空格。
void main() { char a,b; printf("input character a,b "); scanf("%c%c",&a,&b); printf("%c%c ",a,b); } scanf("'C14F14%c%c",&a,&b); printf("%c%c ",a,b); |
input character a,b MN MN void main() { char a,b; printf("input character a,b "); scanf("%c %c",&a,&b); printf(" %c%c ",a,b); } scanf("%c %c",&a,&b); |
scanf("%d,%d,%d",&a,&b,&c); |
scanf("a=%d,b=%d,c=%d",&a,&b,&c); |
void main(){ int a; printf("input a number "); scanf("%d",&a); printf("%ld",a); } |
void main() { long a; printf("input a long integer "); scanf("%ld",&a); printf("%ld",a); } |
input a long integer 1234567890 1234567890 |
当输入数据改为长整型后,输入输出数据相等。
键盘输入函数
getchar函数getchar函数的功能是从键盘上输入一个字符。其一般形式为: getchar(); 通常把输入的字符赋予一个字符变量,构成赋值语句,如:
char c; c=getchar();#include<stdio.h> void main(){ char c; printf("input a character "); c=getchar(); putchar(c); } |
void main(){ char a,b,c; printf("input character a,b,c "); scanf("%c %c %c",&a,&b,&c); printf("%d,%d,%d %c,%c,%c ",a,b,c,a-32,b-32,c-32); } |
void main() { int a; long b; float f; double d; char c; printf("%d,%d,%d,%d,%d",sizeof(a), sizeof(b),sizeof(f) ,sizeof(d),sizeof(c)); } |