《Python极客项目编程 》——第一部分 热身运动 第1章 解析iTunes播放列表 1.1 iTunes播放列表文件剖析

简介: 本节书摘来自异步社区《Python极客项目编程 》一书中的第1章,第1.1节,作者 [美] Mahesh Venkitachalam,王海鹏 译,更多章节内容可以访问云栖社区“异步社区”公众号查看。 第一部分 热身运动 “在初学者的头脑中有很多可能性, 在专家的头脑中,可能性很少。

本节书摘来自异步社区《Python极客项目编程 》一书中的第1章,第1.1节,作者 [美] Mahesh Venkitachalam,王海鹏 译,更多章节内容可以访问云栖社区“异步社区”公众号查看。

第一部分 热身运动


“在初学者的头脑中有很多可能性,


在专家的头脑中,可能性很少。”


——铃木俊隆


65bfdd193ff231e3cc4c2a13307408057af671e2

第1章 解析iTunes播放列表

我们的Python探险始于一个简单的项目,该项目在iTunes播放列表文件中查找重复的乐曲音轨,并绘制各种统计数据,如音轨长度和评分。你可以从查看iTunes播放列表格式开始,然后学习如何用Python提取这些文件的信息。为了绘制这些数据,要用到matplotlib库。

在这个项目中,我们将学习以下主题:

XML和属性列表(p-list)文件;

Python列表和字典;

使用Python的set对象;

使用numpy数组;

直方图和散点图;

用matplotlib库绘制简单的图;

创建和保存数据文件。

1.1 iTunes播放列表文件剖析

iTunes资料库中的信息可以导出为播放列表文件(在iTunes中选择File►Library►Export Playlist)。播放列表文件以可扩展标记语言(XML)写成,这是一种基于文本的语言,旨在分层表示基于文本的信息。它包括一些用户定义的标签所构成的树状集合,标签形如,每个标签可以有一些属性和子标签,其中包含附加的信息。

如果在文本编辑器中打开一个播放列表文件,你会看到类似这样的简化版本:

  <?xml version="1.0" encoding="UTF-8"?>
1 <!DOCTYPE plist PUBLIC "-//Apple Computer//DTD PLIST 1.0//EN" "http://www
  apple.com/DTDs/PropertyList-1.0.dtd">
2 <plist version="1.0">
3 <dict>
 4<key>Major Version</key><integer>1</integer>
      <key>Minor Version</key><integer>1</integer>
      --snip--
   5 <key>Tracks</key>
      <dict>
          <key>2438</key>
          <dict>
          <key>Track ID</key><integer>2438</integer>
          <key>Name</key><string>Yesterday</string>
          <key>Artist</key><string>The Beatles</string>
          <key>Composer</key><string>Lennon [John], McCartney [Paul]</string>
          <key>Album</key><string>Help!</string>
      </dict>
      --snip--
  </dict>
 6   <key>Playlists</key>
      <array>
          <dict>
              <key>Name</key><string>Now</string>
              <key>Playlist ID</key><integer>21348</integer>
              --snip--
              <array>
                <dict>
                    <key>Track ID</key><integer>6382</integer>
                </dict>
                --snip--
            </array>
        </dict>
      </array>
  </dict>
  </plist>

属性列表(P-list)文件将对象表示为字典, 和 标签与这种方式有关。字典是把键和值关联起来的数据结构,让查找值变得容易。属性列表文件使用字典的字典,其中和键关联的值往往自身又是另一个词典(甚至一个字典列表)。

标签确定文件为XML文件。在这个开始标签之后,文档类型定义(DTD)定义了XML文档的结构。如你所见,苹果在该标签中的统一资源定位符(URL)中定义了这种结构1。

在2行,文件声明了顶层标签,其唯一子元素是字典3 。该字典包含了各种键,在4行,包括Major Version、Minor Version,等等,但我们的兴趣在5行的Tracks键。注意,该键对应的值也是一个字典,它将整数的音轨ID映射到另一个字典,其中包含Name、Artist等元素。音乐收藏中的每个音轨都有唯一的音轨ID键。

播放列表顺序在6行由Playlists定义,它是顶层字典的一个子节点。

相关文章
|
5月前
|
存储 JavaScript Java
(Python基础)新时代语言!一起学习Python吧!(四):dict字典和set类型;切片类型、列表生成式;map和reduce迭代器;filter过滤函数、sorted排序函数;lambda函数
dict字典 Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,具有极快的查找速度。 我们可以通过声明JS对象一样的方式声明dict
347 1
|
5月前
|
开发者 Python
Python列表推导式:优雅与效率的完美结合
Python列表推导式:优雅与效率的完美结合
491 116
|
5月前
|
大数据 开发者 Python
Python列表推导式:简洁与高效的艺术
Python列表推导式:简洁与高效的艺术
433 109
|
5月前
|
Python
Python列表推导式:简洁与高效的艺术
Python列表推导式:简洁与高效的艺术
503 119
|
5月前
|
Python
Python编程:运算符详解
本文全面详解Python各类运算符,涵盖算术、比较、逻辑、赋值、位、身份、成员运算符及优先级规则,结合实例代码与运行结果,助你深入掌握Python运算符的使用方法与应用场景。
369 3
|
5月前
|
数据处理 Python
Python编程:类型转换与输入输出
本教程介绍Python中输入输出与类型转换的基础知识,涵盖input()和print()的使用,int()、float()等类型转换方法,并通过综合示例演示数据处理、错误处理及格式化输出,助你掌握核心编程技能。
599 3
|
5月前
|
Python
Python列表推导式:简洁与高效的艺术
Python列表推导式:简洁与高效的艺术
|
5月前
|
并行计算 安全 计算机视觉
Python多进程编程:用multiprocessing突破GIL限制
Python中GIL限制多线程性能,尤其在CPU密集型任务中。`multiprocessing`模块通过创建独立进程,绕过GIL,实现真正的并行计算。它支持进程池、队列、管道、共享内存和同步机制,适用于科学计算、图像处理等场景。相比多线程,多进程更适合利用多核优势,虽有较高内存开销,但能显著提升性能。合理使用进程池与通信机制,可最大化效率。
409 3
|
5月前
|
索引 Python
Python 列表切片赋值教程:掌握 “移花接木” 式列表修改技巧
本文通过生动的“嫁接”比喻,讲解Python列表切片赋值操作。切片可修改原列表内容,实现头部、尾部或中间元素替换,支持不等长赋值,灵活实现列表结构更新。
239 1
|
5月前
|
Java 调度 数据库
Python threading模块:多线程编程的实战指南
本文深入讲解Python多线程编程,涵盖threading模块的核心用法:线程创建、生命周期、同步机制(锁、信号量、条件变量)、线程通信(队列)、守护线程与线程池应用。结合实战案例,如多线程下载器,帮助开发者提升程序并发性能,适用于I/O密集型任务处理。
485 0

推荐镜像

更多