通过图片搜索引擎自动下载图片

本文涉及的产品
图像搜索,7款服务类型 1个月
简介: 通过图片搜索引擎自动下载图片
# coding=utf8
import os
import time
import requests
import json
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
from selenium.common.exceptions import WebDriverException
from bs4 import BeautifulSoup
def download_images(keyword, num_images):
    url = f"https://www.bing.com/images/search?q={keyword}"
    driver = webdriver.Chrome()  # or webdriver.Chrome(), depending on your browser
    driver.get(url)
    wait = WebDriverWait(driver, 10)
    wait.until(EC.presence_of_element_located((By.TAG_NAME, 'body')))
    # Scroll down several times to load more images
    for _ in range(10):
        try:
            time.sleep(2)  # wait for 2 seconds
            driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
            time.sleep(1)  # pause between scrolls
        except WebDriverException:
            continue
    html = driver.page_source
    soup = BeautifulSoup(html, "html.parser")
    img_tags = soup.find_all("a", {"class": "iusc"})
    os.makedirs(keyword, exist_ok=True)
    count = 0
    for i, img in enumerate(img_tags):
        try:
            img_info = json.loads(img["m"])
            img_url = img_info["murl"]
            response = requests.get(img_url, stream=True)
            if response.status_code == 200:
                with open(f"{keyword}/{keyword}_{i}.jpg", "wb") as out_file:
                    out_file.write(response.content)
                count += 1
                if count >= num_images:
                    break
        except:
            pass
    driver.quit()
download_images("关键词", 20)
目录
相关文章
|
搜索推荐 TensorFlow 算法框架/工具
基于tensorflow和flask的本地图片库web图片搜索引擎
基于tensorflow和flask的本地图片库web图片搜索引擎
144 0
基于tensorflow和flask的本地图片库web图片搜索引擎
|
4月前
|
搜索推荐 API 对象存储
|
4月前
|
分布式计算 搜索推荐 API
|
机器学习/深度学习 存储 算法
阿里云国际站:拍立淘-以图搜图中的图像搜索算法是怎么样的?
@luotuoemo飞机@TG 阿里云国际站:拍立淘-以图搜图中的图像搜索算法是怎么样的?图像搜索在现代搜索系统中扮演了重要角色,尤其在电子商务网站如阿里巴巴等,它更是一个必不可少的功能。拍立淘是阿里云国际站的一个以图搜图功能,它使用了复杂的图像搜索算法进行图片匹配和识别。以下是对该算法的简单描述。
|
机器学习/深度学习 人工智能 开发者
关于阿里云的图像搜索的创建和使用
关于阿里云的图像搜索的创建和使用
关于阿里云的图像搜索的创建和使用
|
存储 前端开发 Serverless
阿里云视觉智能平台提供了人脸识别和图像搜索的API接口
阿里云视觉智能平台提供了人脸识别和图像搜索的API接口
1670 0
|
SQL 搜索推荐 TensorFlow
【最佳实践】阿里云 Elasticsearch 向量检索4步搭建“以图搜图”搜索引擎
“图片搜索”是作为导购类网站,比较常见的一种功能,其实现的方式也有多种。但如何做到快速、精准、简单等特性,本文给你答案。
11587 1
【最佳实践】阿里云 Elasticsearch 向量检索4步搭建“以图搜图”搜索引擎
|
算法
阿里云图像搜索技术创新-工业五金图片搜索
阿里云图像搜索产品3月17日正式发布工业五金搜索模型,通过大规模算法模型训练,可在海量五金图片素材中快速定位到图片中五金件的同款或相似款商品原图,识别过程中可有效避免图片方位变化、光照变化、背景场景变化等情况对搜索结果的影响。以此帮助工业五金电商商城、仓库等快速找到同款、相似款。通过输入工业五金类图片,可以在海量商品库中找到同款、相似款配件,并返回对应的配件信息,提升五金类产品购物效率,帮忙更多工业五金制造和零售等企业轻松上云。
513 57
阿里云图像搜索技术创新-工业五金图片搜索
|
人工智能
阿里云产品体系分为6大分类——人工智能——分为10种模块——图像搜索
阿里云产品体系分为6大分类——人工智能——分为10种模块——图像搜索自制脑图
179 0