如何使用Python对参数进行解析

简介: 如何使用Python对参数进行解析主要用到一个库argparse,用ArgumentParser创建参数解析对象ArgumentParser,而用add_argument()在解析对象里添加要解析的参数. 最后用parse_args()进行解析,返回参数所在的命名空间。

如何使用Python对参数进行解析

主要用到一个库argparse,用ArgumentParser创建参数解析对象ArgumentParser,而用add_argument()在解析对象里添加要解析的参数. 最后用parse_args()进行解析,返回参数所在的命名空间。如果涉及到子命令,则还需要add_subparsers

第一步:创建ArgumentParser对象。

import argparse
parser = argparse.ArgumentParser(description='covert all-sites vcf to fa')

尽管还有其他许多参数,诸如prog,usage,add_abbre等,但大部分情况只需要用到description参数,用来说明这个命令行工具的用途即可。

第二步:添加需要解析的参数

parser.add_argument('--filepath', '-f',nargs=1,required=True,help='provide a vcf file path')

这里表明,需要提供一个文件路径,且是必须。

第三步:解析命令

args = parser.parse_args()

综上,整合我已经写了的vcf转换成fa的代码,最后如下

import argparse
import re

# parse the args
parser = argparse.ArgumentParser(description='convert all-sites vcf to fa.')
parser.add_argument('--filepath','-f', nargs=1, required=True, help='a vcf file path')
args = parser.parse_args()

vcf = open(args.filepath[0])

pattern = re.compile('.*?DP=(\\d+);.*?')
current_pos = 0
min_depth = 15
seq_arr = [i for i in range(13124)]


for line in vcf.readlines():
    cols = line.split('\t')
    # get the current position
    current_chr = cols[0]
    pos = int(cols[1]) - 1
    # get the reference base and alternative base
    ref_base = cols[3]
    alt_base = cols[4]
    depth = int(re.findall(pattern = pattern, string= cols[7])[0])
    if depth > min_depth:
        if alt_base == '.':
            seq_arr[pos] = ref_base
        else:
            seq_arr[pos] = ''
    else:
        seq_arr[pos] = ''

fa = ''.join(seq_arr)
vcf.close()

with open('result.fa','wb') as f:
    f.write(fa)

代码还有继续的优化的余地。不过能用就行了。

目录
相关文章
|
4天前
|
XML 存储 数据格式
python path解析基础
python path解析基础
11 0
|
4天前
|
数据采集 Python
Python HTML解析详解
Python HTML解析详解
7 0
|
4天前
|
Java C# 开发者
Python 中的类型注解是一种用于描述变量、函数参数和返回值预期类型的机制
Python的类型注解提升代码可读性和可维护性,虽非强制,但利于静态类型检查(如Mypy)。包括:变量注解、函数参数和返回值注解,使用内置或`typing`模块的复杂类型,自定义类型注解,以及泛型模拟。类型注解可在变量声明、函数定义和注释中使用,帮助避免类型错误,提高开发效率。
16 6
|
6天前
|
机器学习/深度学习 自然语言处理 算法
Python遗传算法GA对长短期记忆LSTM深度学习模型超参数调优分析司机数据|附数据代码
Python遗传算法GA对长短期记忆LSTM深度学习模型超参数调优分析司机数据|附数据代码
|
6天前
|
JSON 安全 前端开发
解析FormData格式数据:Python实践指南
解析FormData格式数据:Python实践指南
13 1
|
12天前
|
机器学习/深度学习 算法 Python
【Python机器学习专栏】机器学习中的超参数调优技术
【4月更文挑战第30天】本文探讨了机器学习中超参数调优的重要性,介绍了网格搜索、随机搜索、贝叶斯优化和AutoML等调优方法,并提供了Python中使用`scikit-learn`进行网格搜索的示例。超参数的选择直接影响模型学习和泛化能力,而调优技术能帮助找到最佳组合,提升模型性能。随着AutoML的发展,自动化调参将成为更高效的选择。
|
12天前
|
分布式计算 DataWorks 调度
DataWorks操作报错合集之DataWorks配置参数在开发环境进行调度,参数解析不出来,收到了 "Table does not exist" 的错误,该怎么处理
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
25 0
|
13天前
|
Linux API Python
【python】如何通过python来发邮件,各种发邮件方式详细解析
【python】如何通过python来发邮件,各种发邮件方式详细解析
|
13天前
|
分布式计算 大数据 数据处理
MaxCompute操作报错合集之在开发环境中配置MaxCompute参数进行调度,但参数解析不出来,如何解决
MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。
|
13天前
|
Python
使用Python解析网页和正则表达式
使用Python解析网页涉及`requests`和`re`模块。首先导入这两个模块,然后用`requests.get()`发送HTTP请求获取URL内容。通过`.text`属性得到HTML文本。接着,利用正则表达式和`re.search()`匹配特定模式(如网页标题),并用`.group(1)`获取匹配数据。最后,对提取的信息进行处理,如打印标题。实际操作时,需根据需求调整正则表达式。
13 2

推荐镜像

更多