华为、阿里巴巴、字节跳动 100+ Python 面试问题总结(二)(2)

本文涉及的产品
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介: 华为、阿里巴巴、字节跳动 100+ Python 面试问题总结(二)(2)

27.什么是序列化和反序列化?


在 Python 中,序列化(Pickling)和反序列化(Unpickling)是用于将对象转换为字节流以便存储或传输,并从字节流中还原对象的过程。

  1. Pickling:Pickling 是将 Python 对象转换为可存储或传输的字节流的过程。通过使用 pickle 模块,可以将对象序列化为字节流,并保存到文件或传输给其他进程。这对于持久化数据、缓存对象或在分布式系统中进行进程间通信都非常有用。pickle 模块可以处理几乎所有的 Python 对象,包括自定义类实例。
  2. Unpickling:Unpickling 是将字节流还原为原始对象的过程。通过使用 pickle 模块,可以从保存的文件或接收的字节流中提取出序列化的对象,并重新构建成原来的对象。这使得我们能够轻松地恢复先前序列化的对象,并继续使用它们。

需要注意的是,pickle 模块只能在 Python 之间共享并解析。如果需要与其他编程语言交互,则可能需要使用不同的序列化方案,如 JSON 或 MessagePack。

import pickle
# 定义一个对象
data = {'name': 'Alice', 'age': 25, 'city': 'New York'}
# Pickling,将对象转换为字节流
pickled_data = pickle.dumps(data)
# 将字节流保存到文件中
with open('data.pickle', 'wb') as file:
    file.write(pickled_data)
# Unpickling,将字节流还原为对象
with open('data.pickle', 'rb') as file:
    unpickled_data = pickle.load(file)
print(unpickled_data)  # 输出: {'name': 'Alice', 'age': 25, 'city': 'New York'}

通过 Pickling 和 Unpickling,我们可以在 Python 中方便地将对象序列化和反序列化,以实现数据持久化或进程间通信。


28. 什么是 Python 中的生成器?


在Python中,生成器(Generator)是一种特殊的迭代器。它以一种惰性的方式生成(yield)序列化的值,而不是一次性生成并保存整个序列。

生成器的创建通常使用函数和 yield 关键字来实现。当函数中包含 yield 语句时,该函数就成为一个生成器函数。每次调用生成器函数时,它会返回一个生成器对象,而不是执行函数体内的代码。

与普通函数不同的是,生成器函数可以通过 yield 语句多次产生值。每次遇到 yield 语句时,生成器会暂停执行,并将产生的值返回给调用者。下次调用生成器时,它会从上次暂停的位置恢复执行,并继续进行下一次的迭代。

这种按需生成值的方式使得生成器非常适合处理大量数据或无限序列,因为它们可以在需要时逐个生成值,而不会占用过多的内存。

以下是一个简单的示例,展示了如何创建和使用生成器:

def number_generator(n):
    for i in range(n):
        yield i
# 创建生成器对象
generator = number_generator(5)
# 使用生成器迭代产生值
for value in generator:
    print(value)
# 输出:
# 0
# 1
# 2
# 3
# 4

在上述示例中,number_generator 是一个生成器函数,它通过使用 yield 语句产生序列化的值。通过调用生成器函数并将结果赋值给变量 generator,我们创建了一个生成器对象。然后,我们可以通过迭代生成器对象来逐个获取生成器产生的值。

生成器提供了一种方便且高效的方式来处理大型数据集或需要延迟计算的序列。通过使用生成器,我们可以以更节省内存的方式进行迭代和处理数据。


29. 什么是 Python 中的 PYTHONPATH?


PYTHONPATH 是一个环境变量,用于告诉 Python 解释器在哪里查找模块文件。

当导入模块时,Python 解释器会按照一定的规则搜索模块所在的位置。其中之一就是通过 PYTHONPATH 环境变量来指定搜索路径。PYTHONPATH 是一个包含目录路径的字符串,

当我们导入模块时,Python 解释器会按照以下顺序搜索模块的位置:

  1. 内置模块:首先搜索内置的模块,例如 mathsys 等。
  2. 当前工作目录:如果模块与当前脚本文件(或交互式会话)在同一目录下,那么 Python 会优先从当前工作目录进行搜索。
  3. PYTHONPATH 路径:Python 会按照 PYTHONPATH 环境变量中声明的路径顺序逐个搜索。
  4. 标准库路径:如果模块仍然未找到,则 Python 会搜索标准库的安装路径。
  5. 错误:如果在以上步骤都找不到模块,则会抛出 ModuleNotFoundError 异常。

可以通过以下方式查看当前系统中设置的 PYTHONPATH 值:

  1. 在终端或命令提示符中执行 echo %PYTHONPATH%(Windows)
  2. 在终端中执行 echo $PYTHONPATH(Linux和Mac)

使用 PYTHONPATH 来指定额外的模块搜索路径,以便 Python 解释器能够找到所需的模块文件。这在组织大型项目、自定义模块库或调试代码时非常有用。


30. help() 和 dir() 函数有什么用?


Python 中的 help() 函数用于显示模块、类、函数、关键字等的文档。如果未向 help() 函数传递任何参数,则会在控制台上启动交互式帮助程序。

dir() 函数尝试返回调用它的对象的属性和方法的有效列表。它对不同对象的行为不同,因为它旨在生成最相关的数据,而不是完整的信息。

  • 对于模块/库对象,它返回该模块中包含的所有属性的列表。
  • 对于类对象,它返回所有有效属性和基属性的列表。
  • 如果未传递任何参数,它将返回当前范围内的属性列表。


31. .py 和 .pyc 文件有什么区别?


  1. .py 文件:.py 文件是 Python 源代码文件的扩展名。这是我们编写 Python 程序的文件类型。Python 解释器可以直接运行 .py 文件,并执行其中的代码。当我们修改 .py 文件时,需要重新运行整个文件。
  2. .pyc 文件:.pyc 文件是 Python 字节编译文件的扩展名。当 Python 解释器运行一个 .py 文件时,它会将该文件转换为字节码(即 .pyc 文件),以提高程序的执行效率。.pyc 文件包含已经编译的字节码,这意味着 Python 解释器不需要重新编译源代码,而是直接加载并执行 .pyc 文件。.pyc 文件是平台特定的,因此它们在不同的操作系统上可能不可互用。

Python 解释器在运行 .py 文件时,会自动检查是否存在对应的 .pyc 文件,并根据需要自动生成或更新 .pyc 文件。


32. Python 是如何解释代码的?


Python 是一种解释型语言,它的执行过程可以简单分为两个步骤:解析(Parsing)和解释(Interpreting)。

  1. 解析(Parsing):
    在解析阶段,Python 解释器会对源代码进行语法解析。它会逐行读取源代码,并将其转换成一种称为"抽象语法树"(Abstract Syntax Tree,AST)的数据结构。抽象语法树表示了代码的结构和语义,使得解释器能够理解源代码的含义和逻辑关系。
  2. 解释(Interpreting):
    在解释阶段,Python 解释器会按照抽象语法树的结构和定义的语义规则来执行源代码。它会逐条解释执行代码,并计算表达式、处理语句、调用函数等操作。解释器会逐行执行代码,将代码转化为机器可执行的指令序列,并在运行时动态地执行这些指令。

Python 解释器有多个实现,其中最常用的是 CPython,它是官方的 Python 解释器。CPython 使用一种称为"解释执行"的方式来运行 Python 代码。也就是说,它将源代码逐行解析并立即执行,而不需要事先将整个程序编译成二进制文件。

相比之下,编译型语言(如 C++、Java)在程序运行前需要将源代码编译成机器语言的可执行文件,然后直接在计算机上运行这个二进制文件。而解释型语言(如 Python)则是逐行解释和执行源代码,将其转换为机器可执行的指令序列,并在运行时动态地执行这些指令。


33. 在 Python 中,参数是如何通过值或引用传递的?


在 Python 中,参数的传递方式有:

  • 按值传递:传递实际对象的副本。更改对象副本的值不会更改原始对象的值。
  • 按引用传递:传递对实际对象的引用。更改新对象的值将更改原始对象的值。

如果参数是可变对象(例如列表、字典等),那么在函数内部对该参数进行的修改会影响到原始对象,因为它们引用的是同一个对象。这种情况下,参数的传递类似于通过引用传递。例如:

def change_list(lst):
    lst.append(4)
my_list = [1, 2, 3]
change_list(my_list)
print(my_list)  # 输出 [1, 2, 3, 4]

在上面的例子中,我们定义了一个函数 change_list,它接受一个列表作为参数,并在列表末尾添加了一个元素。当我们调用 change_lis t函数并传入 my_list 时,函数内部对列表的修改会直接影响到原始的 my_list,因为它们引用的是同一个列表对象。

然而,如果参数是不可变对象(例如数字、字符串等),那么在函数内部对该参数进行的修改不会影响到原始对象,因为不可变对象是无法被修改的。这种情况下,参数的传递类似于通过值传递。例如:

def increment(num):
    num += 1
my_num = 10
increment(my_num)
print(my_num)  # 输出 10

在上面的例子中,我们定义了一个函数 increment,它接受一个数字作为参数,并将该数字加 1。当我们调用 increment 函数并传入 my_num 时,函数内部对数字的修改不会影响到原始的 my_num,因为数字是不可变对象。

总结起来,Python 中的参数传递方式可以简单理解为:对于可变对象,是通过引用传递;对于不可变对象,是通过值传递。


34. 什么是 Python 中的迭代器?


在 Python 中,迭代器(Iterator)是一个用于遍历可迭代对象的对象。可迭代对象(Iterable)包括但不限于列表、元组、字典、集合和字符串等。

通过使用迭代器,我们可以逐个访问可迭代对象中的元素,而无需提前获取整个可迭代对象的内容。这对于处理大型数据集或者懒加载数据非常有用,因为它可以节省内存空间,并且能够提高程序的效率。

在 Python 中,迭代器对象必须实现两个方法:

  • __iter__():返回迭代器对象本身。
  • __next__():返回可迭代对象中的下一个元素,如果没有更多的元素,则抛出 StopIteration 异常。

以下是一个使用迭代器遍历列表的示例:

my_list = [1, 2, 3, 4, 5]
my_iter = iter(my_list)  # 创建迭代器对象
print(next(my_iter))  # 输出 1
print(next(my_iter))  # 输出 2
print(next(my_iter))  # 输出 3

在上面的示例中,我们首先使用 iter() 函数创建了一个迭代器对象 my_iter,该迭代器对象可以逐个访问列表 my_list 中的元素。然后,我们使用 next() 函数来获取迭代器中的下一个元素,并依次输出。

需要注意的是,当迭代器遍历完可迭代对象中的所有元素后,再调用 next() 函数将会触发 StopIteration 异常。因此,在使用迭代器时,通常使用循环来迭代整个可迭代对象,而不是手动调用 next() 函数。

下面是一个使用迭代器遍历字符串的示例:

my_string = "Hello"
my_iter = iter(my_string)  # 创建迭代器对象
for char in my_iter:
    print(char)  # 逐个输出字符串中的字符


35. 如何在 Python 中删除文件?


使用命令 os.remove() 或者 os.unlink(),示例代码如下:

import os
file_path = "/path/to/file.txt"
if os.path.exists(file_path):
    os.remove(file_path)
    print("文件删除成功")
else:
    print("文件不存在")
import os
file_path = "/path/to/file.txt"
if os.path.exists(file_path):
    os.unlink(file_path)
    print("文件删除成功")
else:
    print("文件不存在")

无论是使用 os.remove() 还是 os.unlink(),都需要确保当前用户对要删除的文件具有足够的权限,并且文件没有被其他程序占用。否则,在执行删除操作时可能会抛出 PermissionError 或 FileNotFoundError 异常。


36. 什么是 Python 中的 split() 和 join() 函数?


  • split() 函数用于将一个字符串分割成子字符串,并返回一个包含分割后子字符串的列表
  • join() 函数则用于将一个可迭代对象中的字符串元素连接起来,返回一个新的字符串。

这两个函数在处理字符串时非常有用。

text = "apple,banana,orange"
fruits = text.split(",")  # 使用逗号作为分隔符分割字符串
print(fruits)  # 输出 ['apple', 'banana', 'orange']
fruits = ['apple', 'banana', 'orange']
text = ",".join(fruits)  # 使用逗号连接字符串元素
print(text)  # 输出 'apple,banana,orange'


37. 什么是 *args 和 **kwargs?


在Python中,*args**kwargs 是用于函数定义时的特殊参数形式。

  • *args
  • *args 表示一个非关键字可变长度参数(Variable Length Arguments),可以接收任意数量的位置参数。
  • 在函数定义时,使用 *args 可以将传入函数的多个位置参数打包成一个元组(tuple)。
  • 例如:
def my_function(*args):
  for arg in args:
      print(arg)
my_function('apple', 'banana', 'orange')
''' 
输出结果:
apple
banana
orange
'''
  • 在调用函数时,可以传递任意数量的位置参数,它们会被打包成一个元组,并在函数内部作为 args 参数的值。
  • **kwargs
  • **kwargs 表示一个关键字可变长度参数(Keyword Variable Length Arguments),可以接收任意数量的关键字参数。
  • 在函数定义时,使用 **kwargs 可以将传入函数的多个关键字参数打包成一个字典(dictionary)。
  • 例如:
def my_function(**kwargs):
    for key, value in kwargs.items():
      print(key, value)
my_function(name='John', age=25, city='New York')
'''
输出结果:
name John
age 25
city New York
'''
  • 在调用函数时,可以传递任意数量的关键字参数,它们会被打包成一个字典,并在函数内部作为 kwargs 参数的值。

需要注意的是,args 和 kwargs 只是常用的约定俗成的命名,并不是固定的关键字。可以选择其他的名称,但通常保持一致性以增加可读性。

  • 同时使用 *args**kwargs 时,args 会接收位置参数,kwargs 会接收关键字参数。例如:
def my_function(*args, **kwargs):
  print(args)   # 输出一个元组
  print(kwargs)  # 输出一个字典
my_function('apple', 'banana', name='John', age=25)
'''
输出结果:
('apple', 'banana')
{'name': 'John', 'age': 25}
'''

总结起来,*args 用于接收任意数量的位置参数并打包成元组,而 **kwargs 用于接收任意数量的关键字参数并打包成字典。这两个特殊的参数形式在函数定义时非常有用,使得函数能够接收和处理动态数量的参数。

38. 什么是负索引,为什么使用负索引?

  • 负索引指的是从序列(如字符串、列表、元组等)末尾开始计算的索引值。负索引从 -1 开始,依次向前递减。
  • 通过负索引可以方便地访问和处理序列的末尾元素,并且可以与正索引混合使用。使用负索引可以简化代码逻辑,并提供更灵活的数据访问方式。

Python 面试的高阶问题:华为、阿里巴巴、字节跳动 100+ Python 面试问题总结(三)


相关文章
|
3月前
|
机器学习/深度学习 算法 Java
机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)
机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)
|
3月前
|
Java C++ Python
【面试宝典】深入Python高级:直戳痛点的题目演示(下)
【面试宝典】深入Python高级:直戳痛点的题目演示(下)
|
3月前
|
设计模式 Unix Python
【面试宝典】深入Python高级:直戳痛点的题目演示(上)
【面试宝典】深入Python高级:直戳痛点的题目演示(上)
|
6月前
|
数据采集 机器学习/深度学习 数据可视化
了解数据科学面试中的Python数据分析重点,包括Pandas(DataFrame)、NumPy(ndarray)和Matplotlib(图表绘制)。
【7月更文挑战第5天】了解数据科学面试中的Python数据分析重点,包括Pandas(DataFrame)、NumPy(ndarray)和Matplotlib(图表绘制)。数据预处理涉及缺失值(dropna(), fillna())和异常值处理。使用describe()进行统计分析,通过Matplotlib和Seaborn绘图。回归和分类分析用到Scikit-learn,如LinearRegression和RandomForestClassifier。
113 3
|
6月前
|
Python
155. 最小栈 力扣 python 空间换时间 o(1) 腾讯面试题
155. 最小栈 力扣 python 空间换时间 o(1) 腾讯面试题
|
6月前
|
存储 算法 索引
1124. 表现良好的最长时间段 (python) 前缀和 分类讨论 最大长度 力扣 面试题
1124. 表现良好的最长时间段 (python) 前缀和 分类讨论 最大长度 力扣 面试题
|
6月前
|
算法 Java Linux
python中的面试常考知识点
python中的面试常考知识点
|
5月前
|
存储 Java
【IO面试题 四】、介绍一下Java的序列化与反序列化
Java的序列化与反序列化允许对象通过实现Serializable接口转换成字节序列并存储或传输,之后可以通过ObjectInputStream和ObjectOutputStream的方法将这些字节序列恢复成对象。
|
2月前
|
存储 缓存 算法
面试官:单核 CPU 支持 Java 多线程吗?为什么?被问懵了!
本文介绍了多线程环境下的几个关键概念,包括时间片、超线程、上下文切换及其影响因素,以及线程调度的两种方式——抢占式调度和协同式调度。文章还讨论了减少上下文切换次数以提高多线程程序效率的方法,如无锁并发编程、使用CAS算法等,并提出了合理的线程数量配置策略,以平衡CPU利用率和线程切换开销。
面试官:单核 CPU 支持 Java 多线程吗?为什么?被问懵了!
|
2月前
|
存储 算法 Java
大厂面试高频:什么是自旋锁?Java 实现自旋锁的原理?
本文详解自旋锁的概念、优缺点、使用场景及Java实现。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
大厂面试高频:什么是自旋锁?Java 实现自旋锁的原理?