迎战2022 - Python中文翻译《环球时报》整篇文章实战演示,调用有道翻译API接口进行英文转中文翻译实例训练

简介: 迎战2022 - Python中文翻译《环球时报》整篇文章实战演示,调用有道翻译API接口进行英文转中文翻译实例训练

第一章:翻译效果展示

① 翻译文章示例一【得益于中国援助的数字电视,喀麦隆农村社区享受着非洲国家杯】

文章:得益于中国援助的数字电视,喀麦隆农村社区享受着非洲国家杯


158236fd3533402784efdda103b44871.png

33ac4abe298c4131a5774599985c4635.png


翻译后的效果:


103a80cf6ba143bb98cad60b4e39176e.png

② 翻译文章示例二【有关中国传统文化的节目深受年轻观众的欢迎】

文章:有关中国传统文化的节目深受年轻观众的欢迎

33fe09c3de674357a01c8b83808377a7.png


image.png

翻译后的效果:

image.png

第二章:实现

① 文章结构分析

我们可以看到文章标题在 class 属性为 "article_title"div 元素里。

image.png


正文内容在 class"article_right"div 元素里。


f72d1f130ba840e3a27936173225c427.png

② 文章内容爬取

利用 BeautifulSoup 库对内容进行爬取。

bs4 模块通过 pip install bs4 即可进行安装。

注:文章内注释的翻译部分的代码就是后面要用到的翻译接口。

from urllib.request import urlopen
from bs4 import BeautifulSoup
def article_structure(article_url):
    """
     小蓝枣, 2022.1.24
    【作用】
     对传入网站的文章内容进行爬取
    【参数】
     article_url : 需要进行翻译的外文网址
    【返回】
    """
    url = urlopen(article_url)
    soup = BeautifulSoup(url, 'html.parser')   # parser 解析
    # 读取文章标题
    alert_header = soup.find('div', class_="article_title")
    print("【文章标题】:")
    print(alert_header.string)
    # print("[英文翻译]")
    # print(english_translator(alert_header.string))
    # 读取文章正文
    alert_body = soup.find('div', class_="article_right").contents
    print("\n【文章正文】:")
    for i in alert_body:
        # String类型的,并且不包含空格和回车
        if("String" in str(type(i)) and i[0] != " " and i[0] != "\n"):
            print("---------")
            print(i)
            # print("[英文翻译]")
            # print(english_translator(i))
            print()
article_structure("https://www.globaltimes.cn/page/202201/1246696.shtml")

部分代码解析:

文章正文的部分是没有元素包裹的纯文本,用 "String" in str(type(i)) 就可以筛选出来,还有空格内容和回车内容再过滤一下就好了。

这是爬取后的文章:

079f37fa9d774c83b0be3fd5d7304831.png

③ 有道翻译接口

翻译接口如下,json 参数里面的 from,设置为英文用的是 en

实现过程,还有有道 api 的配置过程可以看这篇文章:

有道翻译 API 接口的服务开通与使用 Python 进行接口调用实例演示,有道智云·AI 开放平台

import requests
import time
import hashlib
import uuid
def english_translator(translate_text):
    """
     小蓝枣, 2022.1.24
    【作用】
     将传入的英文内容翻译为中文
    【参数】
     translate_text : 需要进行翻译的中文
    【返回】
     翻译后的中文
    """
    youdao_url = 'https://openapi.youdao.com/api'   # 有道api地址
    input_text = ""   # 翻译文本生成sign前进行的处理
    # 当文本长度小于等于20时,取文本
    if(len(translate_text) <= 20):
        input_text = translate_text
    # 当文本长度大于20时,进行特殊处理
    elif(len(translate_text) > 20):
        input_text = translate_text[:10] + str(len(translate_text)) + translate_text[-10:]
    app_id = "xxx"   # 应用id
    app_key = "xxx"   # 应用密钥
    time_curtime = int(time.time())   # 秒级时间戳获取
    uu_id = uuid.uuid4()   # 随机生成的uuid数,为了每次都生成一个不重复的数。
    sign = hashlib.sha256((app_id + input_text + str(uu_id) + str(time_curtime) + app_key).encode('utf-8')).hexdigest()   # sign生成
    data = {
        'q':translate_text,
        'from':"en",
        'to':"zh-CHS",
        'appKey':app_id,
        'salt':uu_id,
        'sign':sign,
        'signType':"v3",
        'curtime':time_curtime,
    }
    r = requests.get(youdao_url, params = data).json()   # 获取返回的json()内容
    return r["translation"][0]   # 获取翻译内容

喜欢的点个赞❤吧!


目录
相关文章
|
3天前
|
API 数据库 数据安全/隐私保护
Flask框架在Python面试中的应用与实战
【4月更文挑战第18天】Django REST framework (DRF) 是用于构建Web API的强力工具,尤其适合Django应用。本文深入讨论DRF面试常见问题,包括视图、序列化、路由、权限控制、分页过滤排序及错误处理。同时,强调了易错点如序列化器验证、权限认证配置、API版本管理、性能优化和响应格式统一,并提供实战代码示例。了解这些知识点有助于在Python面试中展现优秀的Web服务开发能力。
20 1
|
2天前
|
Java API Android开发
[NDK/JNI系列04] JNI接口方法表、基础API与异常API
[NDK/JNI系列04] JNI接口方法表、基础API与异常API
9 0
|
3天前
|
SQL 中间件 API
Flask框架在Python面试中的应用与实战
【4月更文挑战第18天】**Flask是Python的轻量级Web框架,以其简洁API和强大扩展性受欢迎。本文深入探讨了面试中关于Flask的常见问题,包括路由、Jinja2模板、数据库操作、中间件和错误处理。同时,提到了易错点,如路由冲突、模板安全、SQL注入,以及请求上下文管理。通过实例代码展示了如何创建和管理数据库、使用表单以及处理请求。掌握这些知识将有助于在面试中展现Flask技能。**
11 1
Flask框架在Python面试中的应用与实战
|
4天前
|
SQL 关系型数据库 MySQL
Python与MySQL数据库交互:面试实战
【4月更文挑战第16天】本文介绍了Python与MySQL交互的面试重点,包括使用`mysql-connector-python`或`pymysql`连接数据库、执行SQL查询、异常处理、防止SQL注入、事务管理和ORM框架。易错点包括忘记关闭连接、忽视异常处理、硬编码SQL、忽略事务及过度依赖低效查询。通过理解这些问题和提供策略,可提升面试表现。
25 6
|
5天前
|
XML JSON API
快速淘宝商品详情页面API接口传输 php
PI(Application Programming Interface,应用程序接口)是一组预定义的函数、协议和工具,用于构建软件应用程序之间的交互。它允许不同的软件系统和应用通过统一的接口进行数据交换和通信
|
8天前
|
API 调度 开发者
深入理解Python异步编程:从Asyncio到实战应用
在现代软件开发中,异步编程技术已成为提升应用性能和响应速度的关键策略。本文将通过实例讲解Python中的异步编程核心库Asyncio的基本概念、关键功能以及其在Web开发中的应用。我们不仅将理论与实践结合,还将展示如何通过实际代码示例解决常见的并发问题,帮助开发者更有效地利用Python进行异步编程。
|
9天前
|
人工智能 API 开发者
免费使用Kimi的API接口,kimi-free-api真香
今年AI应用兴起,各类智能体涌现,但API免费额度有限。为解决这一问题,GitHub上的[kimi-free-api](https://github.com/LLM-Red-Team/kimi-free-api)项目提供了方便,支持高速流式输出、多轮对话等,与ChatGPT接口兼容。此外,还有其他大模型的免费API转换项目,如跃问StepChat、阿里通义Qwen等。该项目可帮助用户免费体验,通过Docker-compose轻松部署。只需获取refresh_token,即可开始使用。这个开源项目促进了AI学习和开发,为探索AI潜力提供了新途径。
214 2
|
10天前
|
SQL API 数据库
Python中的SQLAlchemy框架:深度解析与实战应用
【4月更文挑战第13天】在Python的众多ORM(对象关系映射)框架中,SQLAlchemy以其功能强大、灵活性和易扩展性脱颖而出,成为许多开发者首选的数据库操作工具。本文将深入探讨SQLAlchemy的核心概念、功能特点以及实战应用,帮助读者更好地理解和使用这一框架。
|
14天前
|
JSON 监控 API
在API接口对接中关键示例问题(1)
在API接口对接中,有几个关键的问题需要注意,以确保接口的稳定性、安全性和易用性。以下是这些问题及部分示例代码的简要概述
|
14天前
|
JavaScript 前端开发 Docker
全栈开发实战:结合Python、Vue和Docker进行部署
【4月更文挑战第10天】本文介绍了如何使用Python、Vue.js和Docker进行全栈开发和部署。Python搭配Flask创建后端API,Vue.js构建前端界面,Docker负责应用的容器化部署。通过编写Dockerfile,将Python应用构建成Docker镜像并运行,前端部分使用Vue CLI创建项目并与后端交互。最后,通过Nginx和另一个Dockerfile部署前端应用。这种组合提升了开发效率,保证了应用的可维护性和扩展性,适合不同规模的企业使用。