今天在复习UNIX文件系统,用到那个read函数,但是无意中却掉到一个坑里了,用了一个多小时才找到问题根源,这里记录一下。
问题是这样的:我需要使用read和write函数把键盘输入的信息复制到输出。所以我写了如下程序:
#include<stdio.h> #define MAXSIZE 10 int main(void) { char c; char buf[MAXSIZE]; int n; while((n = read(0,buf,MAXSIZE)) > 0)// 海燕高尔基在苍茫的大海上狂风卷积 write(1,buf,n);//从buf中输出n个字节的信息到标准输出中return 0; }
输入”HelloWorld“检测,好像没问题。但是当我输入”海燕高尔基在苍茫的大海上狂风卷积“却发现不太对了,这是个什么操作??
HelloWorld
HelloWorld
海燕高尔基在苍茫的大海上狂风卷积
海燕高尔基海上狂风卷
为什么后面那个它中间有几个字掉队了?经过多次测试我发现,如果输入的是英文字符就没问题,而中文字符字节数只要超过了那个MAXSIZE就会出问题。我一度认为,是因为读取一次read后,内存中数据对齐导致的,所以我换了几种组合,中文加英文,但是还是有问题。于是没办法,只能去读函数的原型和定义的相关描述了。函数的原型是长下面这样的:
ssize_t read(int fd, void *buf, size_t count);
该函数每次调用成功返回读取的字节数,出错返回-1并设置errno,如果在调read之前已到达文件末尾,则这次read返回0。参数count是请求读取的字节数,读上来的数据保存在缓冲区buf中,同时文件的当前读写位置向后移。注意这个读写位置和使用C标准I/O库时的读写位置有可能不同,这个读写位置是记在内核中的,而使用C标准I/O库时的读写位置是用户空间I/O缓冲区中的位置。
为了检测我读取到的到底是多少个字节,我把程序修改如下:
#include<stdio.h> #define MAXSIZE 10 int main(void) { char c; char buf[MAXSIZE]; int n; while((n = read(0,buf,MAXSIZE)) >= 0)// 海燕高尔基在苍茫的大海上狂风卷积 { printf("%dn",n); write(1,buf,n);//从buf中输出n个字节的信息到标准输出中 putchar('n'); } return 0; }
我很疑惑的发现:每次读到的的确是MAXSIZE个字节的数据,也把这对应的数据输出了,但是在一次循环后,中间还是跳过了MAXSIZE个字节的数据没输出。
海燕高尔基在苍茫的大海上狂风卷积 10 海燕高尔基 10 海上狂风卷
到底是什么导致了这一现象呢?我怀疑是字符与字节的问题,但是说不上到底是那个函数在处理这个出问题了。所以我另外写了一个函数测试。
#include<stdio.h> int main(void) { char buf[4]; char c ; int i; for(i = 0;i < 3;++i) { read(0,buf,2); buf[2] = '