3. Linux下实现统计文件单词个数和出现次数

简介: 3. Linux下实现统计文件单词个数和出现次数

本文介绍的是在Linux下实现统计文件单词个数和出现次数,以及实践过程中遇到的gcc编译器不匹配问题


一、实现文件单词个数统计


#include <stdio.h>
#define IN_Word 1
#define OUT_Word 0
#define INIT OUT_Word
int splite(char c){
    if  ((c==' ') || (c=='\n') || (c=='\t') || (c == '\"') || (c == '\'') || (c == '+')|| (c == '-')|| (c == ',')
        || (c == ';'))
        return 1;
    else
        return 0; 
}
int countWord(char* fileName){
    //定义初始状态
    int status=INIT;
    int count=0;
    //以只读方式打开文本
    FILE *file=fopen(fileName,"r");
    if (file == NULL) return -1;
    char c;
    //读取文本,判断处于何种状态
    while ((c = fgetc(file)) != EOF){
        if ( splite(c)){
            status=OUT_Word;  //处于单词之外,更新状态为OUT_Word
        }
        else if (OUT_Word==status){  
            //处于单词之内,更新状态为IN_Word。记录每次状态更新的次数(OUT -> IN),也就是单词个数
            status=IN_Word;
            count++;
        }
    }
    return count;
}
int main(int argc,char*argv[]){
    if (argc<2) return -1;
    printf("word:%d\n",countWord(argv[1]));
}
// int main(){
//     printf("word:%d\n",countWord("b.txt"));
// }


执行编译执行命令

gcc -o countWord countWord.c
./countWord b.txt


二、实现文件单词出现次数统计

#include<stdio.h>
#include<string.h>
#include<stdlib.h>
typedef struct{
  char str[50]; //单词最大长度设为50
  int cnt;//单词出现次数
}Str;
void countWordNum(char* fileName){
    char tmp[50]; 
  Str words[200]; //单词数量上限 
  int num=0;//实际单词数量 
  int i,j,neww=1;//neww标志位,判断是否为新单词 
  FILE *fp = fopen(fileName, "r");
  //fscanf从文件中获取单个字符串 
  while ( fscanf(fp,"%s",tmp)!=EOF ) {
    neww=1;
    for (i=0; i<num; i++) {
      //重复的单词 
      if ( strcmp(tmp, words[i].str)==0 ) {
        neww=0;
        words[i].cnt++;
      }
    }
    if (neww){
      // 复制字符串
      for (j=0; tmp[j]!='\0'; j++) {
        words[num].str[j] = tmp[j];
      }
      //单词末尾添加结束符 
      words[num].str[j] = '\0';
      // 新单词数量+1 
      words[num++].cnt = 1;
    }
  }
    printf("一共%d个不同的单词,每个单词出现次数如下:\n",num);
  for (int i=num-1; i>=0; i--) {
    printf("%-10s %2d\n", words[i].str, words[i].cnt);
  }
  fclose(fp);
}
int main(int argc,char*argv[]){
    if (argc<2) return -1;
    countWordNum(argv[1]);
}
// int main() {
//     countWordNum("b.txt");
//  return 0;
// }


三、出现的问题

在linxu系统中,编写c语言程序我们需要使用到GCC编译器。但是当编译程序,出现如下错误

主要原因可能是因为修改软件下载源地址的时候没有考虑系统版本。选择了错误的系统版本,导致下载的gcc编译器不匹配。


解决办法如下:

1、查看系统代号

打开终端,输入下列命令:lsb_release -a,然后结果如下图

Codename的值 focal 即为系统代号。我们先暂时记录该系统代号。

2、检查源地址系统代号是否正确

在终端中输入:sudo vim /etc/apt/sources.list

在弹出的文本编辑器中,检查源地址中的系统代号是否与第一步中的代号一致。

一般出现上述错误都是这里出了问题。只要把它修改为自己的系统代号问题就可以解决了。

我这边都修改为了 xenial

3,在终端执行sudo apt-get update进行更新

4、配置完成后,卸载原来已经安装的gcc,然后重新安装就可以使用了。

sudo apt-get remove gcc

5、重新安装gcc

sudo apt-get install gcc

目录
相关文章
|
10月前
|
Linux 开发工具
7种比较Linux中文本文件的最佳工具
7种比较Linux中文本文件的最佳工具
7种比较Linux中文本文件的最佳工具
|
8月前
|
存储 数据管理 Linux
区分Linux中.tar文件与.tar.gz文件的不同。
总之,".tar"文件提供了一种方便的文件整理方式,其归档但不压缩的特点适用于快速打包和解压,而".tar.gz"文件通过额外的压缩步骤,尽管处理时间更长,但可以减小文件尺寸,更适合于需要节约存储空间或进行文件传输的场景。用户在选择时应根据具体需求,考虑两种格式各自的优劣。
1342 13
|
9月前
|
安全 Linux
Linux赋予文件000权限的恢复技巧
以上这些步骤就像是打开一扇锁住的门,步骤看似简单,但是背后却有着严格的逻辑和规则。切记,在任何时候,变更文件权限都要考虑安全性,不要无谓地放宽权限,那样可能
271 16
|
10月前
|
Linux
【Linux】 Linux文件I/O常见操作技巧
以上就是Linux文件I/O操作的一些技巧,接纳它们,让它们成为你在Linux世界中的得力伙伴,工作会变得轻松许多。不过记住,技巧的运用也需要根据实际情况灵活掌握,毕竟,最适合的才是最好的。
286 28
|
9月前
|
存储 Linux 数据处理
深入剖析Linux中一切即文件的哲学和重定向的机制
在计算机的奇妙世界中,Linux的这套哲学和机制减少了不同类型资源的处理方式,简化了抽象的概念,并蕴藏着强大的灵活性。就像变戏法一样,轻轻松松地在文件、程序与设备之间转换数据流,标准输入、输出、错误流就在指尖舞动,程序的交互和数据处理因此变得既高效又富有乐趣。
157 4
|
10月前
|
Ubuntu Linux
"unzip"命令解析:Linux下如何处理压缩文件。
总的来说,`unzip`命令是Linux系统下一款实用而方便的ZIP格式文件处理工具。本文通过简明扼要的方式,详细介绍了在各类Linux发行版上安装 `unzip`的方法,以及如何使用 `unzip`命令进行解压、查看和测试ZIP文件。希望本文章能为用户带来实际帮助,提高日常操作的效率。
2207 12
|
9月前
|
Linux
linux文件重命名命令
本指南介绍Linux文件重命名方法,包括单文件操作的`mv`命令和批量处理的`rename`命令。`mv`可简单更改文件名并保留扩展名,如`mv old_file.txt new_name.txt`;`rename`支持正则表达式,适用于复杂批量操作,如`rename &#39;s/2023/2024/&#39; *.log`。提供实用技巧如大小写转换、数字序列处理等,并提醒覆盖风险与版本差异,建议使用`-n`参数预览效果。
|
Linux
百度搜索:蓝易云【Linux中如何对文件进行压缩和解压缩?】
这些是在Linux中进行文件压缩和解压缩的常见方法。根据您的需求和具体情况,可能会使用其他压缩工具和选项。您可以通过查阅相应命令的帮助文档来获取更多详细信息。
284 1
|
NoSQL Java Linux
Linux常用命令(文件目录操作、拷贝移动、打包压缩、文本编辑、查找)
Linux常用命令(文件目录操作、拷贝移动、打包压缩、文本编辑、查找)
|
算法 Java Linux
Linux下文件增删改查定位压缩操作与权限所属用户
Linux下文件增删改查定位压缩操作与权限所属用户
199 0