比较C语言标准I/O与*nix系统I/O的异同

简介:
linux/unix系统的I/O也就是一般所说的低级I/O——操作系统提供的基本IO服务,与os绑定,特定于*nix平台。而标准I/O是ANSI C建立的一个标准I/O模型,是一个标准函数包和stdio.h头文件中的定义,具有一定的可移植性。两者一个显著的不同点在于,标准I/O默认采用了缓冲机制,比如调用fopen函数,不仅打开一个文件,而且建立了一个缓冲区(读写模式下将建立两个缓冲区),还创建了一个包含文件和缓冲区相关数据的数据结构。低级I/O一般没有采用缓冲,需要自己创建缓冲区,不过其实在*nix系统中,都是有使用称为 内核缓冲的技术用于提高效率,读写调用是在内核缓冲区和进程缓冲区之间进行的数据复制。

1.fopen与open
标准I/O使用fopen函数打开一个文件
FILE* fp=fopen(const char* path,const char *mod)

其中path是文件名,mod用于指定文件打开的模式的字符串,比如"r","w","w+","a"等等,可以加上字母b用以指定以二进制模式打开(对于*nix系统,只有一种文件类型,因此没有区别),如果成功打开,返回一个FILE文件指针,如果失败返回NULL,这里的文件指针并不是指向实际的文件,而是一个关于文件信息的数据包,其中包括文件使用的缓冲区信息。

*nix系统使用open函数用于打开一个文件
int fd=open(char *name,int how);
与fopen类似,name表示文件名字符串,而how指定打开的模式:O_RDONLY(只读),O_WRONLY(只写),O_RDWR (可读可写),还有其他模式请man 2 open。成功返回一个正整数称为 文件描述符,这与标准I/O显著不同,失败的话返回-1,与标准I/O返回NULL也是不同的。

2.fclose与close
与打开文件相对的, 标准I/O使用fclose关闭文件,将文件指针传入即可,如果成功关闭,返回0,否则返回EOF
比如:
if (fclose(fp) != 0 )  
  printf(
" Error in closing file " );

而*nix使用close用于关闭open打开的文件,与fclose类似,只不过当错误发生时返回的是-1,而不是EOF,成功关闭同样是返回0。C语言用error code来进行错误处理的传统做法。

3.读文件,getc,fscanf,fgets和read
标准I/O中进行文件读取可以使用getc,一个字符一个字符的读取,也可以使用gets(读取标准io读入的)、fgets以字符串单位进行读取(读到遇到的第一个换行字符的后面),gets(接受一个参数,文件指针)不判断目标数组是否能够容纳读入的字符,可能导致存储溢出( 不建议使用),而fgets使用三个参数:
 char * fgets(char *s, int size, FILE *stream);
第一个参数和gets一样,用于存储输入的地址,第二个参数为整数,表示输入字符串的最大长度,最后一个参数就是文件指针,指向要读取的文件。最后是fscanf,与scanf类似,只不过增加了一个参数用于指定操作的文件,比如fscanf(fp,"%s",words)

*nix系统中使用read函数用于读取open函数打开的文件,函数原型如下:
ssize_t numread=read(int fd,void *buf,size_t qty);

其中fd就是open返回的文件描述符,buf用于存储数据的目的缓冲区,而qty指定要读取的字节数。如果成功读取,就返回读取的字节数目(小于等于qty)。

4.判断文件结尾,如果尝试读取达到文件结尾,标准IO的getc会返回特殊值EOF,而fgets碰到EOF会返回NULL,而对于*nix的read函数,情况有所不同。read读取qty指定的字节数,最终读取的数据可能没有你所要求的那么多(qty),而当读到结尾再要读的话,read函数将返回0.

5.写文件:putc,fputs,fprintf和write

与读文件相对应的,标准C语言I/O使用putc写入字符,比如:
putc(ch,fp);
第一个参数是字符,第二个是文件指针。而fputs与此类似:
fputs(buf,fp);
仅仅是第一个参数换成了字符串地址。而fprintf与printf类似,增加了一个参数用于指定写入的文件,比如:
fprintf(stdout,"Hello %s.\n","dennis");
切记fscanf和fprintf将FILE指针作为第一个参数,而putc,fputs则是作为第二个参数。

在*nix系统中提供write函数用于写入文件,原型与read类似:
ssize_t result=write(int fd,void *buf ,size_t amt);

fd是文件描述符,buf是将要写入的内存数据,amt是要写的字节数。如果写入成功返回写入的字节数,通过result与amt的比较可以判断是否写入正常,如果写入失败返回-1。write函数仅仅是将数据写入了缓冲区,何时写入磁盘由内核决定,如果要强制写入硬盘,那么在open的时候选择O_SYNC选项,或者调用fsync函数

6.随机存取:fseek()、ftell()和lseek()
标准I/O使用fseek和ftell用于文件的随机存取,先看看fseek函数原型
int fseek(FILE *stream, long offset, int whence);
第一个参数是文件指针,第二个参数是一个long类型的偏移量(offset),表示从起始点开始移动的距离。第三个参数就是用于指定起始点的模式,stdio.h指定了下列模式常量:
SEEK_SET            文件开始处
SEEK_CUR            当前位置
SEEK_END            文件结尾处
看几个调用例子:
fseek(fp,0L,SEEK_SET);  //找到文件的开始处
fseek(fp,0L,SEEK_END);  //定位到文件结尾处
fseek(fp,2L,SEEK_CUR);  //文件当前位置向前移动2个字节数

而ftell函数用于返回文件的当前位置,返回类型是一个long类型,比如下面的调用:
fseek(fp,0L,SEEK_END);//定位到结尾
long last=ftell(fp);  //返回当前位置
那么此时的last就是文件指针fp指向的文件的字节数。

与标准I/O类似,*nix系统提供了lseek来完成fseek的功能,原型如下:
off_t lseek(int fildes, off_t offset, int whence);

fildes是文件描述符,而offset也是偏移量,whence同样是指定起始点模式,唯一的不同是lseek有返回值,如果成功就返回指针变化前的位置,否则返回-1。因此可以通过下列方法模拟ftell函数来返回当前偏移量:
off_t    currpos;
currpos = lseek(fd, 0, SEEK_CUR);
whence的取值与fseek相同:SEEK_SET,SEEK_CUR,SEEK_END,但也可以用整数0,1,2相应代替。

最后,以一个例子结尾,通过c语言编写linux系统的cp指令,先看看使用标准I/O版本的:
#include < stdio.h >
#include
< stdlib.h >
void  oops( char   * , char   * );
int  main( int  ac, char   * av[])
{
  FILE 
* in, * out;
  
int  ch;

  
if (ac != 3 ){
   fprintf(stderr,
" Useage:%s source-file target-file.\n " ,av[ 0 ]);
   exit(
1 );
  }
  
if ((in = fopen(av[ 1 ], " r " )) == NULL)
   oops(
" can not open  " ,av[ 1 ]);
  
if ((out = fopen(av[ 2 ], " w " )) == NULL)
   oops(
" can not open  " ,av[ 2 ]);
  
while ((ch = getc(in)) != EOF)
    putc(ch,out);
  
if (fclose(in) != 0 || fclose(out) != 0 )
    oops(
" can not close files.\n " , "   " );
  
return   0 ;
}
void  oops( char   * s1, char *  s2)
{
  fprintf(stderr,
" Error:%s %s\n " ,s1,s2);
  exit(
1 );
}

再看一个使用unix io的版本:
#include < unistd.h >
#include
< stdio.h >
#include
< fcntl.h >

#define BUFFERSIZE 
4096
#define COPYMODE 
0644
void  oops( char   * , char   * );

int  main( int  ac, char   * av[])
{
  
int  in_fd,out_fd,n_chars;
  
char  buf[BUFFERSIZE];
  
if (ac != 3 ){
    fprintf(stderr,
" useage:%s source-file target-file.\n " ,av[ 0 ]);
    exit(
1 );
  }

  
if ((in_fd = open(av[ 1 ],O_RDONLY)) ==- 1 )
     oops(
" Can't open  " ,av[ 1 ]);
  
if ((out_fd = creat(av[ 2 ],COPYMODE)) ==- 1 )
    oops(
" Can't open  " ,av[ 2 ]);
  
while ((n_chars = read(in_fd,buf,BUFFERSIZE)) > 0 )
      
if (write(out_fd,buf,n_chars) != n_chars)
           oops(
" Write error to  " ,av[ 2 ]);
  
if (n_chars ==- 1 )
      oops(
" Read error from  " ,av[ 1 ]);
  
if (close(in_fd) ==- 1 || close(out_fd) ==- 1 )
    oops(
" Error closing files " , "" );
  
return   0 ;
}
void  oops( char   * s1, char   * s2)
{
  fprintf(stderr,
" Error:%s " ,s1);
  perror(s2);
  exit(
1 );
}


显然,在使用unix i/o的时候,你要更多地关注缓冲问题以提高效率,而stdio则不需要考虑。

文章转自庄周梦蝶  ,原文发布时间2007-08-22

目录
相关文章
|
18天前
|
C语言
C语言:内存函数(memcpy memmove memset memcmp使用)
C语言:内存函数(memcpy memmove memset memcmp使用)
|
4天前
|
存储 编译器 C语言
C语言:字符函数 & 字符串函数 & 内存函数
C语言:字符函数 & 字符串函数 & 内存函数
11 2
|
12天前
|
缓存 安全 编译器
【C 言专栏】C 语言函数的高效编程技巧
【5月更文挑战第1天】本文探讨了C语言中函数的高效编程技巧,包括函数的定义与作用(如代码复用和提高可读性)、设计原则(单一职责和接口简洁)、参数传递方式(值传递、指针传递和引用传递)、返回值管理、调用约定、嵌套与递归调用,以及函数优化技巧和常见错误避免。掌握这些技巧能提升C语言代码的质量和效率。
【C 言专栏】C 语言函数的高效编程技巧
|
15天前
|
C语言
pta浙大版《C语言程序设计(第3版)》 习题6-4 使用函数输出指定范围内的Fibonacci数 (20分)
pta浙大版《C语言程序设计(第3版)》 习题6-4 使用函数输出指定范围内的Fibonacci数 (20分)
|
15天前
|
C语言
pta 浙大版《C语言程序设计(第3版)》题目集 习题6-6 使用函数输出一个整数的逆序数 (20分)
pta 浙大版《C语言程序设计(第3版)》题目集 习题6-6 使用函数输出一个整数的逆序数 (20分)
|
15天前
|
C语言
(浙大版《C语言程序设计(第3版)》 习题6-5 使用函数验证哥德巴赫猜想 (20分)
(浙大版《C语言程序设计(第3版)》 习题6-5 使用函数验证哥德巴赫猜想 (20分)
|
17天前
|
安全 C语言
【C语言】strcpy与strncpy函数的使用和模拟实现
【C语言】strcpy与strncpy函数的使用和模拟实现
5 0
|
17天前
|
C语言
【C语言】字符分类函数与字符转换函数
【C语言】字符分类函数与字符转换函数
10 1
|
17天前
|
程序员 编译器 C语言
C语言之函数与参数
C语言之函数与参数
8 0