python爬虫post访问案例-有道翻译

2022-04-19 248

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： python爬虫post访问案例-有道翻译

post请求会携带一些form表单数据，这个需要复制过来以字典形式写入。
表单数据在网页上点击F12后，在Fetch/XHR一栏中的Payload中获取。
以搜索“你好”为例，此时的表单数据如下：
i: 你好
from: AUTO
to: AUTO
smartresult: dict
client: fanyideskweb
salt: 16417380413821
sign: 6545acd2d928b39eb5bead9349a2d4ff
lts: 1641738041382
bv: fdac15c78f51b91dabd0a15d9a1b10f5
doctype: json
version: 2.1
keyfrom: fanyi.web
action: FY_BY_REALTlME

对于这些数据，写到代码中还需要一定的操作。
因为是放在字典中，所以都要加上字符串。可以使用正则替换快速完成：ctrl + r ，(.*): (.*) “$1”:"$2"
再就是我们实际翻译不只翻译你好这一个词，所以把“你好”换成变量名key。
修改好后的形式见代码中。

使用urllib库访问

import urllib.request
import urllib.parse
import json

# 要进行输入内容
key = input("请输入内容：")
data = {
    
    "i": key,
    "from": "AUTO",
    "to": "AUTO",
    "smartresult": "dict",
    "client": "fanyideskweb",
    "salt": "16374132986488",
    "sign": "dfd139af546a8cd63de0676f446ca2ee",
    "lts": "1637413298648",
    "bv": "03a6a27012b22bc3c7ecc76381772182",
    "doctype": "json",
    "version": "2.1",
    "keyfrom": "fanyi.web",
    "action": "FY_BY_REALTlME",
}
# 字节流，如果输入中文，需要处理的
data = urllib.parse.urlencode(data)  # 转为十六进制形式
data = bytes(data, encoding='utf8')  # 转为字节流
headers = {
    
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36'
    }
# 目标url发请求
# {"errorCode":50} ，把_o
url = 'https://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'
# 构建请求对象
req = urllib.request.Request(url, data=data, headers=headers)
# 发请求，获取响应对象
res = urllib.request.urlopen(req)
# print(res.getcode())  # 得到响应码，200表示请求成功
html = res.read().decode('utf-8')
# print(type(html))  # <class 'str'>，得到的是json数据
# json数据转字典
dic = json.loads(html)
result = dic["translateResult"]  # [[{'src': '你好', 'tgt': 'hello'}]]
print(result[0][0]['tgt'])

结果如图所示：
在这里插入图片描述

使用requests库访问

import requests
import json

# 请输入要翻译的内容
key = input("请输入：")

# 携带的数据
data = {
    
    "i": key,
    "from": "AUTO",
    "to": "AUTO",
    "smartresult": "dict",
    "client": "fanyideskweb",
    "salt": "16374132986488",
    "sign": "dfd139af546a8cd63de0676f446ca2ee",
    "lts": "1637413298648",
    "bv": "03a6a27012b22bc3c7ecc76381772182",
    "doctype": "json",
    "version": " 2.1",
    "keyfrom": "fanyi.web",
    "action": "FY_BY_REALTlME",
}
url = 'https://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'
headers ={
    
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36'
}
# 构建请求对象
req = requests.post(url, data=data, headers=headers)
print(req.text)

dic = json.loads(req.text)
result = dic["translateResult"]  # [[{'src': '你好', 'tgt': 'hello'}]]
print(result[0][0]['tgt'])

结果如图所示：
在这里插入图片描述

可以看出，代码相对简洁。

python爬虫post访问案例-有道翻译

使用urllib库访问

使用requests库访问

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

python爬虫post访问案例-有道翻译

使用urllib库访问

使用requests库访问

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像