Python中定义字符串和修改字符串的原理

简介:

   Python是用C语言开发的,在C语言中是没有字符串的概念,只有字符和字符数组,一般用字符数组表示字符串,所以在Python中定义一个字符串时,其实就是在内存中开辟一块空间


例如:

定义一个字 符串string1=hello  --------->5个字符

字符数组['h','e','l','l','o'],其在内存中存储的位置为:['h','e','l','l','o']

而如果想要修改该字符串为hellosb,在需要在内存中重新开辟一块数据空间为:['h','e','l','l','o','s','b']

同样:如果要修改hello字符串为hello0,则在内存中开辟空间为['h','e','l','l','o','0']


另外如果字符串相加:


"hello"+'sb'+"alex"

在内存中的原理可以理解为:

首先开辟一块地址空间000001存储:"hello"

因为“hello”+'sb',所以在接下来又要开辟一块内存空间000002存储 "hello"+'sb'

因为"hello"+'sb'后面还要加上另外一个字符串"alex"

所以还要开辟一块地址空间000003存储"hello"+'sb'+"alex"

综上所述:

如果要实现三个字符串"hello"+'sb'+"alex"相加,则需要开辟三块地址空间

000001-------->"hello"

000002--------->"hello" + 'sb'

000003--------->"hello"+'sb'+"alex"


提示:以上原理对C#和JAVA同样适用


以上的前面多余的空间对于C语言是可以自动释放,C#和JAVA是高级语言,他们则是通过虚拟机的垃圾回收机制来释放前面分配的多余空间(比如:000001,000002)


小结:

Python文件解释器执行经过的阶段:

1、加载内存--->词法分析--->语法分析--->经过编译生产成字节码--->通过虚拟机解释成机器码然后交给CPU运行

2、三种编码:

ascii:只能表示256个字符,因为它只用8位来表示,即2的8次方有256中可能

Unicode:最少用16位来表示字符,即最少用两个字节来表示字符

utf8:用utf8的原因是因为有些字符在Unicode中用8位就可以来表示,而用16位来表示则显得浪费,所以用utf8,可以说utf8是Unicode的一个改进版

3、脚本参数[获取参数用sys模块的argv功能]

4、字节码:即后缀为.pyc的文件,如果导入一个文件,并执行它,那么被导入的文件会自动生成.pyc文件;另外如果被导入的文件与其生成的.pyc内容相同时,在执行的过程中.pyc的优先级要高于被导入的文件(.py),如果被导入的文件做了修改,则需要重新编译再生成.pyc文件。

5、申明变量的注意事项:

①Python中的变量只能是数字、字母、和下划线

②Python中的变量开头不能是数字

③Python的变量名不能是系统规定的关键字

6、变量赋值

  如果对变量赋值之后,然后再对变量的赋值进行,则需要在内存重新开辟段地址空间,对于C语言而言是没有字符串的,C语言表示字符串的是字符数组;为什么不能让字符串动态的变化,而要每次进行分配?Python中字符数组表示数组的时候它的内存地址是连续的,如果不是连续的,那么后面的地址就要空出来,那对于一个未知长度的变量,后面的地址要空出来的话我们是不得而知的,也是无法预知的,所以Python中变量地址都是连续的。 在解决这种问题的时候,Python的内部有缓冲池或者数字池或者叫做字符串池的概念,Python它有一块空间它会自己经过计算,把你经常使用的数字它会放到这个区域里面,我们在来使用这种频繁被使用的字符串的时候就可以避免在内存中一次一次的开辟空间。

对于小数字的缓冲空间:-5~257

对于大数字的缓冲空间8~1000



      本文转自027ryan  51CTO博客,原文链接:http://blog.51cto.com/ucode/1710706,如需转载请自行联系原作者


相关文章
|
18天前
|
机器学习/深度学习 算法 Python
机器学习特征筛选:向后淘汰法原理与Python实现
向后淘汰法(Backward Elimination)是机器学习中一种重要的特征选择技术,通过系统性地移除对模型贡献较小的特征,以提高模型性能和可解释性。该方法从完整特征集出发,逐步剔除不重要的特征,最终保留最具影响力的变量子集。其优势包括提升模型简洁性和性能,减少过拟合,降低计算复杂度。然而,该方法在高维特征空间中计算成本较高,且可能陷入局部最优解。适用于线性回归、逻辑回归等统计学习模型。
72 7
|
4月前
|
机器学习/深度学习 Python
堆叠集成策略的原理、实现方法及Python应用。堆叠通过多层模型组合,先用不同基础模型生成预测,再用元学习器整合这些预测,提升模型性能
本文深入探讨了堆叠集成策略的原理、实现方法及Python应用。堆叠通过多层模型组合,先用不同基础模型生成预测,再用元学习器整合这些预测,提升模型性能。文章详细介绍了堆叠的实现步骤,包括数据准备、基础模型训练、新训练集构建及元学习器训练,并讨论了其优缺点。
237 3
|
4月前
|
机器学习/深度学习 算法 数据挖掘
线性回归模型的原理、实现及应用,特别是在 Python 中的实践
本文深入探讨了线性回归模型的原理、实现及应用,特别是在 Python 中的实践。线性回归假设因变量与自变量间存在线性关系,通过建立线性方程预测未知数据。文章介绍了模型的基本原理、实现步骤、Python 常用库(如 Scikit-learn 和 Statsmodels)、参数解释、优缺点及扩展应用,强调了其在数据分析中的重要性和局限性。
188 3
|
24天前
|
索引 Python
python字符串类型及操作
本文主要讲解字符串类型的表示、操作符、处理函数、处理方法及格式化。内容涵盖字符串的定义、表示方法(单双引号、三引号)、索引与切片、特殊字符转义、常见操作符(如+、*、in等)、处理函数(如len()、str()、chr()等)、处理方法(如.lower()、.split()等)以及格式化方式(如.format())。通过实例代码详细介绍了字符串的各种用法和技巧,帮助读者全面掌握字符串操作。
python字符串类型及操作
|
2月前
|
存储 缓存 Java
Python高性能编程:五种核心优化技术的原理与Python代码
Python在高性能应用场景中常因执行速度不及C、C++等编译型语言而受质疑,但通过合理利用标准库的优化特性,如`__slots__`机制、列表推导式、`@lru_cache`装饰器和生成器等,可以显著提升代码效率。本文详细介绍了这些实用的性能优化技术,帮助开发者在不牺牲代码质量的前提下提高程序性能。实验数据表明,这些优化方法能在内存使用和计算效率方面带来显著改进,适用于大规模数据处理、递归计算等场景。
90 5
Python高性能编程:五种核心优化技术的原理与Python代码
|
3月前
|
算法 数据处理 Python
高精度保形滤波器Savitzky-Golay的数学原理、Python实现与工程应用
Savitzky-Golay滤波器是一种基于局部多项式回归的数字滤波器,广泛应用于信号处理领域。它通过线性最小二乘法拟合低阶多项式到滑动窗口中的数据点,在降噪的同时保持信号的关键特征,如峰值和谷值。本文介绍了该滤波器的原理、实现及应用,展示了其在Python中的具体实现,并分析了不同参数对滤波效果的影响。适合需要保持信号特征的应用场景。
239 11
高精度保形滤波器Savitzky-Golay的数学原理、Python实现与工程应用
|
4月前
|
Python
在 Python 中,如何将日期时间类型转换为字符串?
在 Python 中,如何将日期时间类型转换为字符串?
178 64
|
4月前
|
Python
在 Python 中,如何将字符串中的日期格式转换为日期时间类型?
在 Python 中,如何将字符串中的日期格式转换为日期时间类型?
174 62
|
2月前
|
安全 数据挖掘 编译器
【01】优雅草央央逆向技术篇之逆向接口协议篇-如何用python逆向接口协议?python逆向接口协议的原理和步骤-优雅草央千澈
【01】优雅草央央逆向技术篇之逆向接口协议篇-如何用python逆向接口协议?python逆向接口协议的原理和步骤-优雅草央千澈
90 6
|
2月前
|
存储 人工智能 Python
[oeasy]python061_如何接收输入_input函数_字符串_str_容器_ 输入输出
本文介绍了Python中如何使用`input()`函数接收用户输入。`input()`函数可以从标准输入流获取字符串,并将其赋值给变量。通过键盘输入的值可以实时赋予变量,实现动态输入。为了更好地理解其用法,文中通过实例演示了如何接收用户输入并存储在变量中,还介绍了`input()`函数的参数`prompt`,用于提供输入提示信息。最后总结了`input()`函数的核心功能及其应用场景。更多内容可参考蓝桥、GitHub和Gitee上的相关教程。
36 0