Python|python实现将题目转化为字典

简介: Python|python实现将题目转化为字典

问题描述

在这里首先要提到JSON文件,JSON文件是用来存储简单的数据结构和对象的文件,可以在web应用程序中进行数据交换。而它的格式就有点类似于常用的字典结构,形如:{‘title’ :’ 关于《花间集》说法错误的是’ ,’content’ :{ ‘A’ :’ 作者是赵崇佐’, ’B’ : ‘收录当时流行歌曲歌词’ }, ‘true_choice’:”C” , ’type’:’ 单选题’  }。今天要做的就是读取word里的信息并把它们按照如上的格式进行转化。

解决方案

首先要用python来解决并处理word的文档,就需要引进docx的库来读取word里的信息,读取出信息后,可以用正则表达式对信息进行进一步的提取和处理,最后以字典的格式存储并输出。

第一步引用docx库,读取每一个题目的信息并按不同的题目存放在列表中方便下一步处理。

file = docx.Document(s)
all_paragraphs = file.paragraphs
paragraphs_text = []
for paragraph in all_paragraphs:
     paragraphs_text.append(paragraph.text)
l = []
a = 0
for i in range(len(paragraphs_text)):
    if paragraphs_text[i] == '':
        l.append(paragraphs_text[a:i])
        a = i

 

第二步用正则表达式对信息进行进一步的提取和处理,最后字典的格式存储并输出。

list = []
for questions in l:
    val = {}
    cotent = {}
    for strs in questions:
        if re.match('\d', strs):
            val['title'] = strs
        if re.match('A', strs):
            cotent['A'] = strs[2:]
        if re.match('B', strs):
            cotent['B'] = strs[2:]
        if re.match('C', strs):
            cotent['C'] = strs[2:]
        if re.match('D', strs):
            cotent['D'] = strs[2:]
        if re.match('答案:', strs):
            val['true_choice'] = strs[3:]
        if re.match('题型:', strs):
            val['type'] = strs[3:]
    if len(cotent) > 1:
        val['count'] = cotent
    list.append(val)
return list

完整代码如下:

import docx
import re
def f(s):
    file = docx.Document(s)
    all_paragraphs = file.paragraphs
    paragraphs_text = []
    for paragraph in all_paragraphs:
         paragraphs_text.append(paragraph.text)
    l = []
    a = 0
    for i in range(len(paragraphs_text)):
        if paragraphs_text[i] == '':
            l.append(paragraphs_text[a:i])
            a = i
    list = []
    for questions in l:
        val = {}
        cotent = {}
        for strs in questions:
            if re.match('\d', strs):
                val['title'] = strs
            if re.match('A', strs):
                cotent['A'] = strs[2:]
            if re.match('B', strs):
                cotent['B'] = strs[2:]
            if re.match('C', strs):
                cotent['C'] = strs[2:]
            if re.match('D', strs):
                cotent['D'] = strs[2:]
            if re.match('答案:', strs):
                val['true_choice'] =  strs[3:]
            if re.match('题型:', strs):
                val['type'] = strs[3:]
        if len(cotent) > 1:
            val['count'] = cotent
        list.append(val)
    return list

print(f("D://print2.docx"))

 

效果展示:

输出:

目录
相关文章
|
2月前
|
存储 JSON 索引
一文让你彻底搞懂 Python 字典是怎么实现的
一文让你彻底搞懂 Python 字典是怎么实现的
51 13
|
2月前
|
存储 数据安全/隐私保护 Python
Python常用数据结构——字典的应用
Python常用数据结构——字典的应用
|
2月前
|
关系型数据库 MySQL 数据库
Python MySQL查询返回字典类型数据的方法
通过使用 `mysql-connector-python`库并选择 `MySQLCursorDict`作为游标类型,您可以轻松地将MySQL查询结果以字典类型返回。这种方式提高了代码的可读性,使得数据操作更加直观和方便。上述步骤和示例代码展示了如何实现这一功能,希望对您的项目开发有所帮助。
120 4
|
2月前
|
Python
Python 字典删除下标前两个
Python 字典删除下标前两个
|
1月前
|
存储 安全 Serverless
Python学习四:流程控制语句(if-else、while、for),高级数据类型(字符串、列表、元组、字典)的操作
这篇文章主要介绍了Python中的流程控制语句(包括if-else、while、for循环)和高级数据类型(字符串、列表、元组、字典)的操作。
30 0
|
1月前
|
Java C++ Python
【面试宝典】深入Python高级:直戳痛点的题目演示(下)
【面试宝典】深入Python高级:直戳痛点的题目演示(下)
|
1月前
|
存储 自然语言处理 数据库
Python字典操作实现文章敏感词检索
Python字典操作实现文章敏感词检索
|
1月前
|
存储 JSON 数据处理
分析、总结Python使用列表、元组、字典的场景
分析、总结Python使用列表、元组、字典的场景
|
1月前
|
设计模式 Unix Python
【面试宝典】深入Python高级:直戳痛点的题目演示(上)
【面试宝典】深入Python高级:直戳痛点的题目演示(上)
|
1月前
|
存储 Java Serverless
【Python】字典
【Python】字典
27 0