详解如何使用 Python 操作 Telegram(电报)机器人(一)

简介: 详解如何使用 Python 操作 Telegram(电报)机器人(一)


楔子



Telegram(电报)相信大家都知道,关于它的介绍和注册方式这里就跳过了,我假设你已经注册好了。本篇文章来聊一聊 Telegram 提供的机器人,以及如何用 Python 为机器人实现各种各样的功能。


创建机器人



首先我们使用浏览器打开 https://web.telegram.org,然后用手机上的 APP 扫码登录。

登录之后搜索 BotFather,机器人需要通过 BotFather 来创建,当然 BotFather 本身也是一个机器人,但它同时管理着其它的机器人。

我们点击 BotFather,下面将通过和它聊天的方式来创建机器人,过程如下。

  • 1)在页面中输入命令 /newbot 并回车,相当于给 BotFather 发指令,表示要创建机器人。注:命令要以 / 开头。
  • 2)BotFather 收到之后会将机器人创建好,并提示我们给机器人起一个名字,这里我起名为:古明地觉
  • 3)回车之后,BotFather 会继续让我们给机器人起一个用户名,这个用户名会作为机器人的唯一标识,用于定位和查找。这里我起名为 Satori_Koishi_bot,注:用户名必须以 Bot 或 bot 结尾。

下面来实际演示一下。

ad849662f97973ea9ff82ed018abc912.png

我们点击 t.me/Satori_Koishi_bot,看看结果如何。

9432f49d3248f314b853d69097347253.png

点击 t.me/Satori_Koishi_bot 之后,再点击屏幕中的 start(相当于发送了一条 /start 指令),就可以和机器人聊天了。因为我们还没有编写代码,来为机器人添加相应的功能,所以目前不会有任何事情发生。

然后我们给自定义的机器人添加一些描述信息,显然这依赖于 BotFather。向其发送 /mybots 指令,会返回我们创建的所有的机器人,当然这里目前只有一个。

fec924809943dc3657fcba65c437132c.png

我们点击它,看看结果:

52d6e22c656fb4e773ffe70006682f5c.png

里面提供了很多的选项,这里我们再点击 Edit Bot,来编辑机器人的相关信息。

32f5a7abe9ebd754615920f50c0ea865.png

不难发现,我们除了给当前机器人一个名字之外,其它的信息就没有了,所以 Telegram 提供了一系列按钮,供我们进行编辑。比如我们点击 Edit Botpic,编辑头像。

6b038d179948166e5d8b3634d38b85c3.png

然后机器人的头像会发生改变,当然这些都属于锦上添花的东西,最重要的是 Edit Commands,它是机器人能够产生行为的核心,否则当前的机器人就是个绣花枕头,中看不中用。

下面我们点击 Edit Commands,添加一个 /help 命令。

ce436022a2759dcbaef8d5e48bb25115.png

添加格式为命令 - 描述,可同时添加多个。

ad870561986aa671e0b39b3ed4e8dd37.png

目前机器人便支持了 /help 命令,另外如果点击 Edit Command 之后再输入 /empty,那么也可以将机器人现有的命令清空掉。

虽然 /help 命令有了,但发送这个命令之后,机器人不会有任何的反应,因为我们还没有给命令绑定相应的处理函数,下面就来看看如何绑定。当然啦,机器人不光要对命令做出反应,就算是普通的文本、表情、图片等消息,也应该做出反应。至于命令本质上就是一个纯文本,只不过它应该以 / 开头。



接收消息并处理



我们可以使用 Python 连接 Telegram 机器人,为它绑定处理函数,首先需要安装一个第三方库。

安装:pip3 install "python-telegram-bot[all]"

然后获取机器人的 Token,这个 Token 怎么获取呢?

2a4ecf5c758287486b4bd90e5d2ce16f.png

像 BotFather 发送 /mybots 命令,点击指定机器人的 API Token 即可获取。

80a540dae8ef565f9a195fe4868b3784.png

有了这个 Token 之后,就可以和机器人建立连接了。

import asyncio
import telegram
from telegram.request import HTTPXRequest
# 代理,由于不方便展示,因此我定义在了一个单独的文件中
# 这里的 PROXY 是一个字符串,类似于 "http://username:password@ip:port"
from proxy import PROXY
BOT_API_TOKEN = "6485526535:AAEvGr9EDqtc4QPehkgohH6gczOTO5RIYRE"
async def main():
    # 传递机器人的 Token,内部会自动和它建立连接
    bot = telegram.Bot(
        BOT_API_TOKEN,
        # 指定代理
        request=HTTPXRequest(proxy=PROXY),
        get_updates_request=HTTPXRequest(proxy=PROXY),
    )
    async with bot:
        # 测试连接是否成功,如果成功,会返回机器人的信息
        print(await bot.get_me())
asyncio.run(main())
"""
User(api_kwargs={'has_main_web_app': False}, 
     can_connect_to_business=False, 
     can_join_groups=True, 
     can_read_all_group_messages=False, 
     first_name='古明地觉', 
     id=6485526535, 
     is_bot=True, 
     supports_inline_queries=False, 
     username='Satori_Koishi_bot')
"""

返回值包含了机器人的具体信息,还是比较简单的,只需指定一个 Token 即可访问。当然啦,由于网络的原因还需要使用代理。

然后通过该模块还可以给机器人发消息,但这显然不是我们的重点,因为消息肯定是通过 APP 或者浏览器发送的。我们要做的是,定义机器人的回复逻辑,当用户给它发消息时,它应该做些什么事情。

先来一个简单的案例,当用户输入 /start 命令时,回复一段文本。

from telegram import Update
from telegram.ext import ApplicationBuilder, ContextTypes, CommandHandler
from proxy import PROXY
BOT_API_TOKEN = "6485526535:AAEvGr9EDqtc4QPehkgohH6gczOTO5RIYRE"
# 定义一个处理函数
# update 封装了用户发送的消息数据
# context 则封装了 Bot 对象和一些会话数据
# 这两个对象非常重要,后面还会详细说
async def start(update: Update, context: ContextTypes.DEFAULT_TYPE):
    # context.bot 便是机器人,可以调用它的 send_message 方法回复消息
    await context.bot.send_message(
        # 关于 chat_id 稍后解释
        chat_id=update.message.chat.id,
        # 回复的文本内容
        text="欢迎来到地灵殿"
    )
# 构建一个应用
application = ApplicationBuilder().token(BOT_API_TOKEN).proxy(PROXY).build()
# 创建一个 CommandHandler 实例,当用户输入 /start 的时候,执行 start 函数
start_handler = CommandHandler("start", start)
# 将 start_handler 加到应用当中
application.add_handler(start_handler)
# 开启无限循环,监听事件
application.run_polling()

我们来测试一下:

13c8b587ff092fada76583330535d9d3.png

显然结果是成功的,不过目前这个机器人只能处理 /start 命令,如果希望它支持更多的命令,那么就定义多个 CommandHandler 即可。但是问题来了,如果我们希望这个机器人能处理普通文本的话,该怎么办呢?

from telegram import Update
from telegram.ext import (
    ApplicationBuilder, ContextTypes,
    MessageHandler, filters
)
from proxy import PROXY
BOT_API_TOKEN = "6485526535:AAEvGr9EDqtc4QPehkgohH6gczOTO5RIYRE"
async def reply(update: Update, context: ContextTypes.DEFAULT_TYPE):
    await context.bot.send_message(
        chat_id=update.message.chat.id,
        # 通过 update.message.text 可以拿到用户发送的消息
        text=f"古明地觉已收到,你发的内容是:{update.message.text}"
    )
application = ApplicationBuilder().token(BOT_API_TOKEN).proxy(PROXY).build()
# 前面使用了 CommandHandler,它专门用来处理命令,第一个参数应该是字符串
# 比如第一个参数是 "start",那么就给机器人增加了一个回复 /start 命令的功能
# 而 MessageHandler 可以用于回复所有类型的消息,比如文本、表情、图片、视频等等
# 具体能回复哪些,通过第一个参数指定。这里表示只要用户发送了文本消息,就执行 reply 函数
reply_handler = MessageHandler(filters.TEXT, reply)
application.add_handler(reply_handler)
application.run_polling()

测试一下:

cae8cb1b3c5db5e7526b68231c918fd5.png

结果没有问题,并且 /start 命令也被当成普通的文本处理了,因为命令本质上就是一个文本。然后代码中的 filters,它里面除了有表示文本类型的 TEXT,还有很多其它类型。

# 命令
filters.COMMAND
# 普通文本(包括 emoji)
filters.TEXT
# Telegram 贴纸包中的贴纸
filters.Sticker.ALL
# 图片文件
filters.PHOTO
# 音频文件
filters.AUDIO
# 视频文件
filters.VIDEO
# 文档(例如 PDF、DOCX 等等)
filters.Document.ALL
# 语音(使用 Telegram 录制的语音)
filters.VOICE
# 地理位置
filters.LOCATION
# 联系人
filters.CONTACT
# 动画,通常是 GIF
filters.ANIMATION
# 通过 Telegram 的视频笔记功能录制的视频
filters.VIDEO_NOTE
# 如果希望同时支持多种类型,那么可以使用 | 进行连接
# 比如同时支持 "文本" 和 "图片"
filters.TEXT | filters.PHOTO
# 当然也可以取反,~filters.TEXT 表示除了文本以外的类型
~filters.TEXT
# | 和 ~ 都出现了,显然还剩下 &,而 & 也是支持的 
# 我们知道命令本质上就是一个以 / 开头的文本
# 如果我们希望只处理普通文本,不处理命令,该怎么办呢?
# 很简单,像下面这样指定即可,此时以 / 开头的文本(命令)会被忽略掉
filters.TEXT & ~filters.COMMAND
# 除了以上这些,filters 还支持其它类型,有兴趣可以看一下
# 当然 filters 还提供了一个 ALL,表示所有类型
filters.ALL

然后注意一下里面的 filters.Sticker 和 filters.Document,这两个类型比较特殊,它们内部还可以细分,这里我们就不细分了,直接 .ALL 即可。

我们来测试一下,看看这些类型消息都长什么样子。

from telegram import Update
from telegram.ext import (
    ApplicationBuilder, ContextTypes,
    MessageHandler, filters
)
from proxy import PROXY
BOT_API_TOKEN = "6485526535:AAEvGr9EDqtc4QPehkgohH6gczOTO5RIYRE"
async def get_message_type(update: Update, context: ContextTypes.DEFAULT_TYPE):
    # 获取消息
    message = update.message
    # 获取消息类型
    if message.text:
        if message.text[0] == "/":
            message_type = "filters.COMMAND"
        else:
            message_type = "filters.TEXT"
    elif message.sticker:
        message_type = "filters.Sticker"
    elif message.photo:
        message_type = "filters.PHOTO"
    elif message.audio:
        message_type = "filters.AUDIO"
    elif message.video:
        message_type = "filters.VIDEO"
    elif message.document:
        message_type = "filters.Document"
    elif message.voice:
        message_type = "filters.VOICE"
    elif message.location:
        message_type = "filters.LOCATION"
    elif message.contact:
        message_type = "filters.CONTACT"
    elif message.animation:
        message_type = "filters.ANIMATION"
    elif message.video_note:
        message_type = "filters.VIDEO_NOTE"
    else:
        message_type = "filters.<OTHER TYPE>"
    await context.bot.send_message(
        chat_id=update.message.chat.id,
        text=f"你发送的消息的类型是 {message_type}"
    )
application = ApplicationBuilder().token(BOT_API_TOKEN).proxy(PROXY).build()
reply_handler = MessageHandler(filters.ALL, get_message_type)
application.add_handler(reply_handler)
application.run_polling()

我们发几条消息,让机器人告诉我们消息的类型。

980a4f5fdd634b94d83afe76496aa7f2.png

至于其它类型,感兴趣可以测试一下。


update 和 context



处理函数里面有两个参数,分别是 update 和 context。它们非常重要,我们来打印一下,看看长什么样子。

async def reply(update: Update, context: ContextTypes.DEFAULT_TYPE):
    pprint(update.to_dict())
    await context.bot.send_message(chat_id=update.message.chat.id,
                                   text="不想说话")
application = ApplicationBuilder().token(BOT_API_TOKEN).proxy(PROXY).build()
reply_handler = MessageHandler(filters.ALL, reply)
application.add_handler(reply_handler)
application.run_polling()

下面发送一条文本消息。

3a1fda172267903b9f7119e5ead1441a.png

然后查看 update.to_dict() 的输出是什么,为了方便理解,我将字段顺序调整了一下。

{
    'message': {
        # 是否创建了频道,因为是私聊,所以为 False
        'channel_chat_created': False,
        # 聊天照片是否已被删除,私聊一般也为 False
        'delete_chat_photo': False,
        # 是否创建了群组,因为是私聊,所以为 False
        'group_chat_created': False,
        # 是否创建了超级群组,因为是私聊,所以为 False
        'supergroup_chat_created': False,
        # "发送者" 发送的消息
        # 因为发送的是文本,所以这里是 text 字段
        'text': '这是一条文本消息',
        # 消息发送的时间
        'date': 1722623118,
        # 消息的 ID
        'message_id': 84,
        # 消息发送者的信息
        'from': {
            'first_name': '小云',
            'id': 6353481551,
            'is_bot': False,
            'language_code': 'zh-hans',
            'last_name': '同学'
        },
        # chat 表示会话环境,机器人要通过 chat 判断消息应该回复给谁
        # 因为目前是和机器人私聊,所以机器人的回复对象就是消息的发送者
        # 因此里面的 first_name、last_name、id 和消息发送者是一致的
        # 但如果是群聊,那么里面的 id 字段则表示群组的 id
        # 此外还会包含一个 title 字段,表示群组的名称
        'chat': {
            'first_name': '小云',
            'last_name': '同学',
            # 不管 chat 的类型是什么,里面一定会包含 id 字段
            # 这个 id 可能是用户的 id,也可能是群组的 id
            # 总之有了这个 id,机器人就知道要将消息回复给谁
            # 所以代码中的 send_message 方法至少要包含两个参数
            # 分别是 chat_id(发送给谁)和 text(发送的内容)
            'id': 6353481551,
            # chat 的类型,定义在 filters.ChatType 中
            # ChatType.PRIVATE:私人对话
            # ChatType.GROUP:普通群组聊天
            # ChatType.SUPERGROUP:超级群组聊天
            # ChatType.GROUPS:普通群组聊天或超级群组聊天
            # ChatType.CHANNEL:频道,用于向订阅者广播消息
            'type': '<ChatType.PRIVATE>'
        },
    },
    # 每发送一条消息,会话都在更新,所以 update_id 表示更新的唯一标识符
    # 用于跟踪更新,以确保消息处理没有丢失或重复
    'update_id': 296857735
}

以上就是 update.to_dict() 的输出结果,当用户向 bot 发送消息时,Telegram 服务器会将这些数据以 JSON 的形式发送给当前的应用程序,以便 bot 可以处理和响应这些消息。当然啦,我们这里使用的库会将数据封装成 Update 对象,因此获取数据时,可以有以下两种获取方式。

chat_id = update.to_dict()["message"]["chat"]["id"]
chat_id = update.message.chat.id

以上是当用户发送文本消息时,Telegram 发送的数据,我们再试一下其它的,比如上传一个文档。

{
    'message': {
        'channel_chat_created': False,
        'delete_chat_photo': False,
        'group_chat_created': False,
        'supergroup_chat_created': False,
        'chat': {'first_name': '小云',
                 'id': 6353481551,
                 'last_name': '同学',
                 'type': '<ChatType.PRIVATE>'},
        'date': 1722628661,
        # 因为发送的是文档,所以这里是 document 字段
        'document': {'file_id': 'BQACAgUAAxkBAANgZq06NVL6......',
                     'file_name': 'OpenAI.pdf',
                     'file_size': 2279632,
                     'file_unique_id': 'AgADLw8AAn36cFU',
                     'mime_type': 'application/pdf',
                     'thumb': {
                         'file_id': 'AAMCBQADGQEAA2BmrTo1Uv......',
                         'file_size': 22533,
                         'file_unique_id': 'AQADLw8AAn36cFVy',
                         'height': 320,
                         'width': 243},
                     'thumbnail': {
                         'file_id': 'AAMCBQADGQEAA2BmrTo1U......',
                         'file_size': 22533,
                         'file_unique_id': 'AQADLw8AAn36cFVy',
                         'height': 320,
                         'width': 243}},
        'from': {'first_name': '小云',
                 'id': 6353481551,
                 'is_bot': False,
                 'language_code': 'zh-hans',
                 'last_name': '同学'},
        'message_id': 96,
    },
    'update_id': 296857741
}

至于其它的类型也是类似的,可以自己试一下,比如上传一段视频,看看打印的输出是什么。

不过还有一个问题,就是当用户上传音频、视频、文档等,bot 如何获取它们呢?显然要依赖里面的 file_id。

async def download(update: Update, context: ContextTypes.DEFAULT_TYPE):
    document = update.message.document
    file_id = document.file_id  # 文件 id
    file_size = document.file_size  # 文件大小
    file_name = document.file_name  # 文件名
    # 用户上传的文件会保存在 Telegram 服务器,我们可以基于文件 id 获取
    file_obj = await context.bot.get_file(file_id)
    # file_obj.file_path 便是文件的地址,直接下载即可
    with open(file_name, "wb") as f:
        resp = httpx.get(file_obj.file_path, proxy=PROXY)
        f.write(resp.content)
    await context.bot.send_message(
        chat_id=update.message.chat.id,
        text=f"{file_name} 下载完毕,大小 {file_size} 字节"
    )
application = ApplicationBuilder().token(BOT_API_TOKEN).proxy(PROXY).build()
download_handler = MessageHandler(filters.Document.ALL, download)
application.add_handler(download_handler)
application.run_polling()

我们上传几个文件试试。

ef44a8af5a724b9d596a401d12ece046.png

结果没有问题,用户上传的文件也下载到了本地。



回复富文本消息



目前机器人回复的都是普通的纯文本,但也可以回复富文本消息。

async def rich_msg(update: Update, context: ContextTypes.DEFAULT_TYPE):
    message = update.message
    if message.text == "baidu":
        text = '<a href="https://www.baidu.com">点击进入百度页面</a>'
    elif message.text == "zhihu":
        text = '<a href="https://www.zhihu.com">点击进入知乎页面</a>'
    elif message.text == "bilibili":
        text = '<a href="https://www.bilibili.com">点击进入 B 站页面</a>'
    else:
        text = 'Unsupported Website'
    await context.bot.send_message(
        chat_id=update.message.chat.id,
        text=text,
        # 按照 HTML 进行解析
        parse_mode="HTML"
    )

测试一下:

7265a4b43b1fad13073f3e282affd52a.png

结果没有问题,另外我们看到 a 标签自带预览功能,如果不希望预览,那么也可以禁用掉。

d2ff622960c7895499f24114d458a5ed.png

disable_web_page_preview 参数指定为 False,即可禁用 a 标签的预览功能。另外发送的消息除了可以按照 HTML 格式解析,还可以按照 Markdown 格式解析,将 parse_mode 参数指定为 "Markdown" 或者 "MarkdownV2" 即可。



回复其它类型的消息



目前机器人回复的都是文本,那么能不能回复音频、视频、图片呢?显然是可以的,并且它们还可以和文本一起返回。

# 发送图片
await context.bot.send_photo(
    chat_id=update.message.chat.id,
    # 可以是路径、句柄、bytes 对象
    # 已经上传到 Telegram 服务器的文件会有一个 file_id
    # 指定 file_id 也是可以的
    photo="path/to/image.jpg",
)
# 发送音频
await context.bot.send_audio(
    chat_id=update.message.chat.id,
    # 可以是 路径、句柄、bytes 对象、file_id
    audio="path/to/audio.mp3"
)
# 发送视频
await context.bot.send_video(
    chat_id=update.message.chat.id,
    # 可以是 路径、句柄、bytes 对象、file_id
    video="path/to/video.mp4"
)
# 发送文档
await context.bot.send_document(
    chat_id=update.message.chat.id,
    # 可以是 路径、句柄、bytes 对象、file_id
    document="path/to/document.pdf"
)
# 发送语音
await context.bot.send_voice(
    chat_id=update.message.chat.id,
    # 可以是 路径、句柄、bytes 对象、file_id
    voice=r"path/to/voice.ogg",
)
# 发送位置
await context.bot.send_location(
    chat_id=update.message.chat.id,
    latitude=40.4750280, longitude=116.2676535
)
# 发送联系人
from telegram import Contact
contact = Contact(
    phone_number='+8618510286802',
    first_name='芙兰朵露',
    # 以下两个参数也可以不指定
    last_name='斯卡雷特',
    user_id=5783657687
)
await context.bot.send_contact(
    chat_id=update.message.chat.id,
    contact=contact
)
# 发送贴纸
await context.bot.send_sticker(
    chat_id=update.message.chat.id,
    # 可以是 路径、句柄、bytes 对象、file_id
    sticker="CAACAgIAAxkBAAO5Zq5kRNKkIGZpH......"
)
# 发送 GIF
await context.bot.send_animation(
    chat_id=update.message.chat.id,
    # 可以是 路径、句柄、bytes 对象、file_id
    animation="CgACAgIAAxkBAAPBZq5lekVT95I......"
)

除了以上这些,还可以发送其它类型的消息,不过不常用,有兴趣的话可以自己看一下,这些方法都以 send_ 开头。然后我们来发几条消息,测试一下。

60351aeb59c07bdf5aa30f8e6086a022.png

结果没有问题。



接下篇:https://developer.aliyun.com/article/1617542


相关文章
|
3月前
|
机器人 数据库 Python
详解如何使用 Python 操作 Telegram(电报)机器人(二)
详解如何使用 Python 操作 Telegram(电报)机器人(二)
238 2
|
3月前
|
人工智能 自然语言处理 机器人
用Python构建你的第一个聊天机器人
【10月更文挑战第7天】在这篇文章中,我们将一起探索如何利用Python编程语言和AI技术,一步步打造一个基础的聊天机器人。无论你是编程新手还是有一定经验的开发者,都能通过这个指南获得启发,并实现一个简单的对话系统。文章将引导你理解聊天机器人的工作原理,教你如何收集和处理用户输入,以及如何设计机器人的响应逻辑。通过动手实践,你不仅能够学习到编程技能,还能深入理解人工智能在语言处理方面的应用。
153 0
|
5月前
|
机器学习/深度学习 算法 机器人
使用Python实现深度学习模型:智能灾害响应与救援机器人
使用Python实现深度学习模型:智能灾害响应与救援机器人
93 16
|
5月前
|
机器学习/深度学习 人工智能 算法
用Python实现简单的聊天机器人
【8月更文挑战第31天】 本文将介绍如何使用Python语言和AIML库来实现一个简单的聊天机器人。我们将从基本的安装和配置开始,然后逐步深入到聊天机器人的实现过程。最后,我们将展示如何训练我们的机器人以使其更加智能。无论你是编程新手还是有经验的开发者,都可以从本文中获得实用的知识。
|
5月前
|
监控 机器人 Java
【python】调用钉钉机器人发起通知
【python】调用钉钉机器人发起通知
|
6月前
|
机器人
Telegram统计机器人源码/TG记账群发机器源码人/TG自动记账全开源版本
Telegram统计机器人源码/TG记账群发机器源码人/TG自动记账全开源版本
319 0
|
7月前
|
机器人 API 开发者
Python基于Mirai开发的QQ机器人保姆式教程(亲测可用)
Python基于Mirai开发的QQ机器人保姆式教程(亲测可用)
|
2月前
|
人工智能 自然语言处理 算法
具身智能高校实训解决方案 ----从AI大模型+机器人到通用具身智能
在具身智能的发展历程中,AI 大模型的出现成为了关键的推动力量。高校作为培养未来科技人才的摇篮,需要紧跟这一前沿趋势,开展具身智能实训课程。通过将 AI 大模型与具备 3D 视觉的机器人相结合,为学生搭建一个实践平台。
243 64
|
28天前
|
机器学习/深度学习 人工智能 算法
人工智能与机器人的结合:智能化世界的未来
人工智能与机器人的结合:智能化世界的未来
190 32
|
11天前
|
数据采集 监控 数据可视化
优锘科技携手逐际动力,共创数字孪生与具身智能机器人新未来
近日,优锘科技与逐际动力正式宣布达成战略合作,双方将在业务和技术领域展开深度协作,共同探索数字孪生与具身智能机器人的融合应用。这一合作无疑将为智能科技领域注入全新动力,推动行业智能化转型迈向更高水平。