开发者社区> 问答> 正文

在python 3中使用win32api / com模块时,有没有办法解决unicode问题?

我正在浏览收件箱中的电子邮件并检查特定的单词集。它适用于大多数电子邮件,但其中一些不解析。我查看了破碎的电子邮件。

print (msg.Body.encode('utf8'))
我的问题消息都以b'开头。像这样

b'xe6xa0xbcxe6xb5xb4xe3xb9xacxe6xa0xbcxe6x85xa5xe3xb9xa4xe0xa8x8dxe6xb4xbcxe7x91xa5xe2x81xa1xe7x91x
我认为这是强制python将字体读取为字节,但我不确定。在b之后的任何一种方式,无论我尝试什么编码,我都不会得到任何东西,除了垃圾文本。

我以前尝试过其他编码方法以及解码,但我只是得到了大量的属性错误。

import win32api
import win32com.client
import datetime
import os
import time

outlook = win32com.client.Dispatch("Outlook.Application").GetNamespace("MAPI")
dater = datetime.date.today() - datetime.timedelta(days = 1)
dater = str(dater.strftime("%m-%d-%Y"))
print (dater)
#for folders in outlook.folders:
# print(folders)

Receipt = outlook.folders[8]

print(Receipt)

Ritems = Receipt.folders["Inbox"]

Rmessage = Ritems.items

for msg in Rmessage:

if (msg.Class == 46 and msg.CreationTime.strftime("%m-%d-%Y") == dater):
    print (msg.CreationTime)
    print (msg.Subject)
    print (msg.Body.encode('utf8'))

    print ('..............................')

最终的结果是在控制台中打印出消息,或者至少让Python有一种方式来阅读它,这样我就可以找到我正在寻找的文本。

展开
收起
一码平川MACHEL 2019-01-22 16:51:28 3110 0
1 条回答
写回答
取消 提交回答
  • 问题中发布的字节文字是有效的UTF-8。前两个字符是来自CJK统一表意文字块U + 683C和U + 6D74,U + 4E00 - U + 9FFF。

    由于您不知道源代码编码,因此无法完全确定它,但很可能电子邮件正文只是以UTF-8编码的汉字符(确定Python中文本的编码)。如果您无法正确查看UTF-8字符,则应检查终端或显示字符集。

    也就是说,你应该正确地获得角色表示的基础知识。随机编码或解码几乎无法解决任何问题。我建议你先阅读Spolsky对Unicode 的介绍,然后在Python中使用Unicode 转移到Batchelder。

    2019-07-17 23:26:20
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
From Python Scikit-Learn to Sc 立即下载
Data Pre-Processing in Python: 立即下载
双剑合璧-Python和大数据计算平台的结合 立即下载