python实战|1000位小姐姐照制作照片墙,刷新你三观的颜值!

简介: python实战|1000位小姐姐照制作照片墙,刷新你三观的颜值!

今天给大家介绍python如何虎牙小姐姐并制作心形照片墙,

有兴趣的小伙伴们一起来看看吧!

点击进去

卧槽,这颜值.....

i了i了

需求分析

我们的目标有5个,分别是小姐姐的

房间名称、封面照片、昵称、头像、直播间当前人数

网页分析

浏览器快捷键F12打开开发者模式,可以观察到当前页面120个小姐姐信息都在右边列表里面。

但是大家可以看看我标红处,这是一个非标准格式的json数据集,

所以要想获取到小姐姐的信息

先得获取到标准的数据集

发送请求

    url = f'https://www.huya.com/cache.php?m=LiveList&do=getLiveListByPage&gameId=2168&tagAll=0&callback=getLiveListJsonpCallback&page={page}'
 
    headers = {
        'cookie': '__yamid_tt1=0.17768755672559844; __yamid_new=C9662ED452B00001997340851CC8140B; game_did=j7Os0i0Txedw1cLUtP0vmKnalM1x65kO3rE; SoundValue=0.50; alphaValue=0.80; guid=0a42cb71a121c360e701bcfbbdfb20c9; udb_guiddata=b45f59af594a4e83cde65858; udb_anouid=1461170529732; isInLiveRoom=true; Hm_lvt_51700b6c722f5cf39906a596ea41f=1623400798,1624888823,1624928362; udb_passdata=3; __yasmid=0.17768755672559844; _yasids=__rootsid%3DC96BDFA246600001458617807F641C12; Hm_lpvt_51700b6c722f5bb4cf39906a596ea41f=1624928418; huya_web_rep_cnt=137',
        'referer': 'https://www.huya.com/g/2168',
        'user-agent': str(UserAgent().random)
        }
    try:
        resp = requests.get(url, headers = headers)
        print(resp.text)

去除非必要信息,构造标准json数据集

    text = resp.text[25:-1]            # 去除text格式前后无效字符
    json_text = json.loads(text)       # 转为标准json格式数据集
    print(json_text)

接下来我们就可以获取小姐姐信息啦

      room_name = item['roomName']        # 房间名称
      cover_link = item['screenshot']     # 封面照片
      nick = item['nick']                 # 昵称
      prof_phot = item['avatar180']       # 头像
      view_num = item['totalCount']       # 直播间当前人数
      
      print(room_name, cover_link, nick, prof_phot, view_num)

多页数据获取

小姐姐们直播大多集中在晚上,所以晚上爬取的数据有成千个,白天也就几百个,

不管你想获取多少,一个for循环就搞定啦

   # 获取10页虎牙小姐姐
   for page in range(1, 10+1)
   url = f'https://www.huya.com/cache.php?m=LiveList&do=getLiveListByPage&gameId=2168&tagAll=0&callback=getLiveListJsonpCallback&page={page}'

存入Excel

这里我们使用的是openpyxl来存储在Excel中

  # 创建
  ws = op.Workbook()
  wb = ws.create_sheet(index=0)
 
  wb.cell(row=1, column=1, value='房间名称')
  wb.cell(row=1, column=2, value='封面照片')
  wb.cell(row=1, column=3, value='昵称')
  wb.cell(row=1, column=4, value='头像')
  wb.cell(row=1, column=5, value='直播间当前人数')
  
  # ----------------------------------------
  
  # 存储
  wb.cell(row=count, column=1, value=room_name)
  wb.cell(row=count, column=2, value=cover_link)
  wb.cell(row=count, column=3, value=nick)
  wb.cell(row=count, column=4, value=prof_phot)
  wb.cell(row=count, column=5, value=view_num)
 
  ws.save('虎牙小姐姐.xlsx')

下载图片

重点来了,我要下载小姐姐美照了

    for num, (pic_img, pic_name) in enumerate(save_pic):
      r = requests.get(pic_img)
      pic = r.content
      try:
          with open('./pictures/{}.jpg'.format(pic_name), 'wb') as fin:
              print(f'正在爬取第{count}张图片')
              fin.write(pic)
              print('{}.jpg----下载成功'.format(pic_name))
      except:
          print('下载失败!')

然后就是这样

图片可视化

这么多好看的小姐姐我要给他们将摆它们成一个心形,这样才能表达我满满的爱意

# 设置心性图片矩阵
    HEART = [[0, 0, 1, 1, 0, 0, 0, 0, 1, 1, 0, 0],
             [0, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 0],
             [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
             [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
             [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
             [0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0],
             [0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0],
             [0, 0, 0, 1, 1, 1, 1, 1, 1, 0, 0, 0],
             [0, 0, 0, 0, 1, 1, 1, 1, 0, 0, 0, 0],
             [0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0]]
 
    # 定义相关参数
    SIZE = 100  # 每张图片的尺寸,越大越清晰
    N = 1  # 每个点位上放置1*1张图片
 
    # 计算相关参数
    width = np.shape(HEART)[1] * N * SIZE  # 照片墙宽度
    height = np.shape(HEART)[0] * N * SIZE  # 照片墙高度
    n_img = np.sum(HEART) * (N ** 2)  # 照片墙需要的照片数
    filenames = random.sample(os.listdir(save_path), n_img)  # 随机选取n_img张照片
    filenames = [save_path + f for f in filenames]
 
    print('宝宝开始集合!')
    # 绘制爱心墙
    img_bg = Image.new('RGB', (width, height))  # 设置照片墙背景
    i = 0
    for y in range(np.shape(HEART)[0]):
        for x in range(np.shape(HEART)[1]):
            if HEART[y][x] == 1:  # 如果需要填充
                pos_x = x * N * SIZE  # 填充起始X坐标位置
                pos_y = y * N * SIZE  # 填充起始Y坐标位置
                for yy in range(N):
                    for xx in range(N):
                        img = Image.open(filenames[i])
                        img = img.resize((SIZE, SIZE), Image.ANTIALIAS)
                        img_bg.paste(img, (pos_x + xx * SIZE, pos_y + yy * SIZE))
                        i += 1
    # 保存图片
    img_bg.save('love.jpg')
    print('宝宝集合完毕!')


相关文章
|
3天前
|
存储 人工智能 数据挖掘
Python编程入门:从基础到实战
【9月更文挑战第10天】本文将引导你进入Python编程的世界,从基本语法到实际项目应用,逐步深入。我们将通过简单的例子和代码片段,帮助你理解并掌握Python编程的精髓。无论你是编程新手还是有一定经验的开发者,都能在这篇文章中找到有价值的信息。让我们一起开始Python编程之旅吧!
|
4天前
|
数据采集 开发者 Python
探索Python中的异步编程:从基础到实战
【9月更文挑战第9天】本文将带你进入Python异步编程的世界,从理解其核心概念开始,逐步深入到实际应用。我们将一起构建一个小型的异步Web爬虫,通过实践学习如何在不阻塞主线程的情况下并发处理任务,优化程序性能。文章不仅包含理论知识,还提供代码示例,让读者能够动手实践,深刻理解异步编程的力量。
26 12
|
1天前
|
数据采集 网络协议 API
HTTP协议大揭秘!Python requests库实战,让网络请求变得简单高效
【9月更文挑战第13天】在数字化时代,互联网成为信息传输的核心平台,HTTP协议作为基石,定义了客户端与服务器间的数据传输规则。直接处理HTTP请求复杂繁琐,但Python的`requests`库提供了一个简洁强大的接口,简化了这一过程。HTTP协议采用请求与响应模式,无状态且结构化设计,使其能灵活处理各种数据交换。
25 8
|
2天前
|
存储 安全 数据安全/隐私保护
安全升级!Python AES加密实战,为你的代码加上一层神秘保护罩
【9月更文挑战第12天】在软件开发中,数据安全至关重要。本文将深入探讨如何使用Python中的AES加密技术保护代码免受非法访问和篡改。AES(高级加密标准)因其高效性和灵活性,已成为全球最广泛使用的对称加密算法之一。通过实战演练,我们将展示如何利用pycryptodome库实现AES加密,包括生成密钥、初始化向量(IV)、加密和解密文本数据等步骤。此外,还将介绍密钥管理和IV随机性等安全注意事项。通过本文的学习,你将掌握使用AES加密保护敏感数据的方法,为代码增添坚实的安全屏障。
18 8
|
1天前
|
监控 安全 Java
文件操作不再难!Python系统编程实战,带你轻松驾驭文件系统与I/O
【9月更文挑战第13天】在Python系统编程中,文件操作与I/O管理至关重要。本文通过五个实战案例分享最佳实践:高效遍历文件系统、优雅处理文件读写、利用缓冲机制优化性能、并行处理文件加速任务以及异常处理确保程序稳健。使用pathlib、上下文管理器及concurrent.futures等工具,助你轻松掌握Python文件系统与I/O操作,提升编程效率和项目质量。 示例代码展示了如何使用pathlib遍历目录、with语句安全读写文件、控制缓冲区大小、并行处理多个文件以及捕获异常保证程序稳定运行。通过这些技巧,你将能够在实际项目中更加高效地管理和操作文件。
13 6
|
2天前
|
大数据 数据挖掘 数据处理
Python数据流转的秘密武器:文件系统操作与高效I/O管理实战
【9月更文挑战第12天】在大数据时代,Python凭借其丰富的库和简洁的语法,成为数据处理的首选工具。本文通过实战案例,介绍如何利用Python的`pathlib`模块遍历复杂文件系统,以及通过高效I/O管理(如使用`with`语句和多线程)提升文本文件处理性能。通过这些技巧,你可以轻松从大量分散的文本文件中提取关键信息并整合成新的数据集,从而更好地支持数据分析工作。掌握这些技术,将助你在数据处理领域游刃有余。
12 4
|
4天前
|
安全 数据安全/隐私保护 Python
Python系统编程实战:文件系统操作与I/O管理,让你的代码更优雅
【9月更文挑战第10天】Python不仅在数据分析和Web开发中表现出色,在系统编程领域也展现出独特魅力。本文将带你深入探讨Python中的文件系统操作与I/O管理,涵盖os、shutil和pathlib等模块的基础使用方法,并通过示例代码展示如何优雅地实现这些功能。通过掌握缓冲、异步I/O等高级特性,你将能够编写更高效、安全且易于维护的Python代码。示例包括使用pathlib遍历目录、设置缓冲区提升文件写入性能以及使用aiofiles实现异步文件操作。掌握这些技能,让你在Python系统编程中更加得心应手。
11 2
|
7天前
|
数据采集 机器学习/深度学习 存储
Python编程入门:从基础到实战
【9月更文挑战第6天】本文将引导你走进Python的世界,从零基础开始,逐步掌握Python的基础语法和常用库。我们将通过实例讲解,让你在轻松愉快的氛围中学习Python编程。最后,我们还将分享一些实用的技巧和资源,帮助你在学习过程中不断进步。让我们一起开启Python编程之旅吧!
26 4
|
7天前
|
机器学习/深度学习 算法 Python
决策树下的智慧果实:Python机器学习实战,轻松摘取数据洞察的果实
【9月更文挑战第7天】当我们身处数据海洋,如何提炼出有价值的洞察?决策树作为一种直观且强大的机器学习算法,宛如智慧之树,引领我们在繁复的数据中找到答案。通过Python的scikit-learn库,我们可以轻松实现决策树模型,对数据进行分类或回归分析。本教程将带领大家从零开始,通过实际案例掌握决策树的原理与应用,探索数据中的秘密。
19 1
|
8天前
|
测试技术 Apache 数据库
从慢如蜗牛到飞一般的感觉!Python性能测试实战,JMeter&Locust助你加速🏃‍♂️
【9月更文挑战第6天】你的Python应用是否曾因响应缓慢而让用户望而却步?借助JMeter与Locust,这一切将迎刃而解。JMeter作为Apache基金会的明星项目,以其强大的跨平台和多协议支持能力,成为性能测试领域的魔法师;而Locust则以Python的简洁与高效,让性能测试更加灵活。通过实战演练,你可以利用这两款工具轻松识别并解决性能瓶颈,优化数据库查询、网络配置等,最终使应用变得敏捷高效,轻松应对高并发挑战。
11 1