PokéLLMon 源码解析（六）（3）-阿里云开发者社区

PokéLLMon 源码解析（六）（3）

2024-04-16 84

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： PokéLLMon 源码解析（六）

PokéLLMon 源码解析（六）（2）https://developer.aliyun.com/article/1483743

`.\PokeLLMon\vs_bot.py`

# 导入必要的库
import asyncio
import time
from tqdm import tqdm
import numpy as np
from poke_env import AccountConfiguration, ShowdownServerConfiguration
import os
import pickle as pkl
import argparse
# 从 poke_env.player 模块中导入 LLMPlayer 和 SimpleHeuristicsPlayer 类
from poke_env.player import LLMPlayer, SimpleHeuristicsPlayer
# 创建命令行参数解析器
parser = argparse.ArgumentParser()
# 添加命令行参数
parser.add_argument("--backend", type=str, default="gpt-4-0125-preview", choices=["gpt-3.5-turbo-0125", "gpt-4-1106-preview", "gpt-4-0125-preview"])
parser.add_argument("--temperature", type=float, default=0.8)
parser.add_argument("--prompt_algo", default="io", choices=["io", "sc", "cot", "tot"])
parser.add_argument("--log_dir", type=str, default="./battle_log/pokellmon_vs_bot")
# 解析命令行参数
args = parser.parse_args()
# 异步函数，主要逻辑在其中实现
async def main():
    # 创建 SimpleHeuristicsPlayer 对象
    heuristic_player = SimpleHeuristicsPlayer(battle_format="gen8randombattle")
    # 确保日志目录存在
    os.makedirs(args.log_dir, exist_ok=True)
    
    # 创建 LLMPlayer 对象
    llm_player = LLMPlayer(battle_format="gen8randombattle",
                           api_key="Your_openai_api_key",
                           backend=args.backend,
                           temperature=args.temperature,
                           prompt_algo=args.prompt_algo,
                           log_dir=args.log_dir,
                           account_configuration=AccountConfiguration("Your_account", "Your_password"),
                           save_replays=args.log_dir
                           )
    # 禁用动态最大化功能
    heuristic_player._dynamax_disable = True
    llm_player._dynamax_disable = True
    # 进行五场对战
    for i in tqdm(range(5)):
        # 随机选择对手
        x = np.random.randint(0, 100)
        if x > 50:
            # 与 LLMPlayer 对战
            await heuristic_player.battle_against(llm_player, n_battles=1)
        else:
            # 与 SimpleHeuristicsPlayer 对战
            await llm_player.battle_against(heuristic_player, n_battles=1)
        # 保存对战记录
        for battle_id, battle in llm_player.battles.items():
            with open(f"{args.log_dir}/{battle_id}.pkl", "wb") as f:
                pkl.dump(battle, f)
if __name__ == "__main__":
    # 获取当前事件循环并运行直到完成 main() 函数的执行
    asyncio.get_event_loop().run_until_complete(main())

`.\PokeLLMon\vs_ladder_player.py`

# 导入必要的库
import asyncio
from poke_env import AccountConfiguration, ShowdownServerConfiguration
from poke_env.player import LLMPlayer
import pickle as pkl
from tqdm import tqdm
import argparse
import os
# 创建命令行参数解析器
parser = argparse.ArgumentParser()
parser.add_argument("--backend", type=str, default="gpt-4-0125-preview", choices=["gpt-3.5-turbo-0125", "gpt-4-1106-preview", "gpt-4-0125-preview"])
parser.add_argument("--temperature", type=float, default=0.8)
parser.add_argument("--prompt_algo", default="io", choices=["io", "sc", "cot", "tot"])
parser.add_argument("--log_dir", type=str, default="./battle_log/pokellmon_vs_ladder_player")
args = parser.parse_args()
# 异步函数，用于执行主要逻辑
async def main():
    # 确保日志目录存在
    os.makedirs(args.log_dir, exist_ok=True)
    
    # 创建 LLMPlayer 实例
    llm_player = LLMPlayer(battle_format="gen8randombattle",
                           api_key="Your_openai_api_key",
                           backend=args.backend,
                           temperature=args.temperature,
                           prompt_algo=args.prompt_algo,
                           log_dir=args.log_dir,
                           account_configuration=AccountConfiguration("Your_account", "Your_password"),
                           server_configuration=ShowdownServerConfiguration,
                           save_replays=args.log_dir
                           )
    # 在 ladder 上进行 5 场比赛
    for i in tqdm(range(1)):
        try:
            # 在 ladder 上进行比赛
            await llm_player.ladder(1)
            # 保存每场比赛的数据
            for battle_id, battle in llm_player.battles.items():
                with open(f"{args.log_dir}/{battle_id}.pkl", "wb") as f:
                    pkl.dump(battle, f)
        except:
            continue
# 如果作为独立脚本运行，则执行主函数
if __name__ == "__main__":
    asyncio.get_event_loop().run_until_complete(main())

PokéLLMon 源码解析（六）（4）https://developer.aliyun.com/article/1483748

PokéLLMon 源码解析（六）（3）

`.\PokeLLMon\vs_bot.py`

`.\PokeLLMon\vs_ladder_player.py`

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

PokéLLMon 源码解析（六）（3）

.\PokeLLMon\vs_bot.py

.\PokeLLMon\vs_ladder_player.py

热门文章

最新文章

相关课程

相关电子书

推荐镜像

`.\PokeLLMon\vs_bot.py`

`.\PokeLLMon\vs_ladder_player.py`