3. Linux下实现统计文件单词个数和出现次数

简介: 3. Linux下实现统计文件单词个数和出现次数

本文介绍的是在Linux下实现统计文件单词个数和出现次数,以及实践过程中遇到的gcc编译器不匹配问题


一、实现文件单词个数统计


#include <stdio.h>
#define IN_Word 1
#define OUT_Word 0
#define INIT OUT_Word
int splite(char c){
    if  ((c==' ') || (c=='\n') || (c=='\t') || (c == '\"') || (c == '\'') || (c == '+')|| (c == '-')|| (c == ',')
        || (c == ';'))
        return 1;
    else
        return 0; 
}
int countWord(char* fileName){
    //定义初始状态
    int status=INIT;
    int count=0;
    //以只读方式打开文本
    FILE *file=fopen(fileName,"r");
    if (file == NULL) return -1;
    char c;
    //读取文本,判断处于何种状态
    while ((c = fgetc(file)) != EOF){
        if ( splite(c)){
            status=OUT_Word;  //处于单词之外,更新状态为OUT_Word
        }
        else if (OUT_Word==status){  
            //处于单词之内,更新状态为IN_Word。记录每次状态更新的次数(OUT -> IN),也就是单词个数
            status=IN_Word;
            count++;
        }
    }
    return count;
}
int main(int argc,char*argv[]){
    if (argc<2) return -1;
    printf("word:%d\n",countWord(argv[1]));
}
// int main(){
//     printf("word:%d\n",countWord("b.txt"));
// }


执行编译执行命令

gcc -o countWord countWord.c
./countWord b.txt


二、实现文件单词出现次数统计

#include<stdio.h>
#include<string.h>
#include<stdlib.h>
typedef struct{
  char str[50]; //单词最大长度设为50
  int cnt;//单词出现次数
}Str;
void countWordNum(char* fileName){
    char tmp[50]; 
  Str words[200]; //单词数量上限 
  int num=0;//实际单词数量 
  int i,j,neww=1;//neww标志位,判断是否为新单词 
  FILE *fp = fopen(fileName, "r");
  //fscanf从文件中获取单个字符串 
  while ( fscanf(fp,"%s",tmp)!=EOF ) {
    neww=1;
    for (i=0; i<num; i++) {
      //重复的单词 
      if ( strcmp(tmp, words[i].str)==0 ) {
        neww=0;
        words[i].cnt++;
      }
    }
    if (neww){
      // 复制字符串
      for (j=0; tmp[j]!='\0'; j++) {
        words[num].str[j] = tmp[j];
      }
      //单词末尾添加结束符 
      words[num].str[j] = '\0';
      // 新单词数量+1 
      words[num++].cnt = 1;
    }
  }
    printf("一共%d个不同的单词,每个单词出现次数如下:\n",num);
  for (int i=num-1; i>=0; i--) {
    printf("%-10s %2d\n", words[i].str, words[i].cnt);
  }
  fclose(fp);
}
int main(int argc,char*argv[]){
    if (argc<2) return -1;
    countWordNum(argv[1]);
}
// int main() {
//     countWordNum("b.txt");
//  return 0;
// }


三、出现的问题

在linxu系统中,编写c语言程序我们需要使用到GCC编译器。但是当编译程序,出现如下错误

主要原因可能是因为修改软件下载源地址的时候没有考虑系统版本。选择了错误的系统版本,导致下载的gcc编译器不匹配。


解决办法如下:

1、查看系统代号

打开终端,输入下列命令:lsb_release -a,然后结果如下图

Codename的值 focal 即为系统代号。我们先暂时记录该系统代号。

2、检查源地址系统代号是否正确

在终端中输入:sudo vim /etc/apt/sources.list

在弹出的文本编辑器中,检查源地址中的系统代号是否与第一步中的代号一致。

一般出现上述错误都是这里出了问题。只要把它修改为自己的系统代号问题就可以解决了。

我这边都修改为了 xenial

3,在终端执行sudo apt-get update进行更新

4、配置完成后,卸载原来已经安装的gcc,然后重新安装就可以使用了。

sudo apt-get remove gcc

5、重新安装gcc

sudo apt-get install gcc

目录
相关文章
|
28天前
|
Linux Shell 网络安全
Kali Linux系统Metasploit框架利用 HTA 文件进行渗透测试实验
本指南介绍如何利用 HTA 文件和 Metasploit 框架进行渗透测试。通过创建反向 shell、生成 HTA 文件、设置 HTTP 服务器和发送文件,最终实现对目标系统的控制。适用于教育目的,需合法授权。
61 9
Kali Linux系统Metasploit框架利用 HTA 文件进行渗透测试实验
|
14天前
|
Ubuntu Linux Go
golang编译成Linux可运行文件
本文介绍了如何在 Linux 上编译和运行 Golang 程序,涵盖了本地编译和交叉编译的步骤。通过这些步骤,您可以轻松地将 Golang 程序编译成适合 Linux 平台的可执行文件,并在目标服务器上运行。掌握这些技巧,可以提高开发和部署 Golang 应用的效率。
108 14
|
13天前
|
存储 NoSQL Linux
linux积累-core文件是干啥的
核心文件是Linux系统在程序崩溃时生成的重要调试文件,通过分析核心文件,开发者可以找到程序崩溃的原因并进行调试和修复。本文详细介绍了核心文件的生成、配置、查看和分析方法
43 6
|
15天前
|
存储 NoSQL Linux
linux之core文件如何查看和调试
通过设置和生成 core 文件,可以在程序崩溃时获取详细的调试信息。结合 GDB 等调试工具,可以深入分析 core 文件,找到程序崩溃的具体原因,并进行相应的修复。掌握这些调试技巧,对于提高程序的稳定性和可靠性具有重要意义。
82 6
|
2月前
|
Linux 开发工具 Perl
在Linux中,有一个文件,如何删除包含“www“字样的字符?
在Linux中,如果你想删除一个文件中包含特定字样(如“www”)的所有字符或行,你可以使用多种文本处理工具来实现。以下是一些常见的方法:
45 5
|
2月前
|
安全 Linux 数据安全/隐私保护
在 Linux 系统中,查找文件所有者是系统管理和安全审计的重要技能。
在 Linux 系统中,查找文件所有者是系统管理和安全审计的重要技能。本文介绍了使用 `ls -l` 和 `stat` 命令查找文件所有者的基本方法,以及通过文件路径、通配符和结合其他命令的高级技巧。还提供了实际案例分析和注意事项,帮助读者更好地掌握这一操作。
57 6
|
2月前
|
Linux
在 Linux 系统中,`find` 命令是一个强大的文件查找工具
在 Linux 系统中,`find` 命令是一个强大的文件查找工具。本文详细介绍了 `find` 命令的基本语法、常用选项和具体应用示例,帮助用户快速掌握如何根据文件名、类型、大小、修改时间等条件查找文件,并展示了如何结合逻辑运算符、正则表达式和排除特定目录等高级用法。
153 6
|
8月前
|
Linux
百度搜索:蓝易云【Linux中如何对文件进行压缩和解压缩?】
这些是在Linux中进行文件压缩和解压缩的常见方法。根据您的需求和具体情况,可能会使用其他压缩工具和选项。您可以通过查阅相应命令的帮助文档来获取更多详细信息。
94 1
|
8月前
|
NoSQL Java Linux
Linux常用命令(文件目录操作、拷贝移动、打包压缩、文本编辑、查找)
Linux常用命令(文件目录操作、拷贝移动、打包压缩、文本编辑、查找)
|
8月前
|
算法 Java Linux
Linux下文件增删改查定位压缩操作与权限所属用户
Linux下文件增删改查定位压缩操作与权限所属用户
80 0