当前位置：首页 > 科技 > 正文

使用python3处理邮件正文及附件

启示号
科技
1年前
115

用接收邮件的功能非常的常见，我也研究了好久，参考了廖雪峰大大的相关教程和网上的一些资源才大概了解了相应的功能。其中好多代码是直接参考（copy）别人的，中文处理方面真的是折磨了我好久。

日常生活中使用QQ邮箱的频率很高，我在这里使用的也是QQ邮箱，像以前的话，QQ邮箱的pop3登录可以直接使用新密码就可以直接登录了，但现在我发现直接使用新设置的密码会报错。

.: b'-ERR using code to login.

因此我只能使用短信的方式获取验证码。

使用python3处理邮件正文及附件

image.png

然后使用之后的授权码当做密码就不会再报错了。

首先是登录邮箱

import poplib
email='392361639@qq.com'
password='授权码'
server=poplib.POP3_SSL('pop.qq.com')
server.user(email)
server.pass_(password)
resp, mails, octets = server.list()
index = len(mails)#邮件的总数
#server.dele(index) 删除邮件 dele可以用于删除制定位置的邮件
resp, lines, octets = server.retr(index)#可以取出最新的邮件的信息
msg_content = b'\r\n'.join(lines).decode('utf-8','ignore')  #将邮件组合到一起，生成邮件信息
print(msg_content)

使用python3处理邮件正文及附件

大致内容.png

可以看到打印出来的文件信息大致是这样的，里面包含了邮件的头文件，如Date，，From，TO等信息。接下来要取出邮件头部相关的信息。上图的头部信息并没有出现乱码，但有的邮件就会如下图所示

使用python3处理邮件正文及附件

image.png

from email.parser import Parser
from email.header import decode_header
from email.utils import parseaddr#专门处理地址的模块
#email中专门处理邮件内容的模块
msg = Parser().parsestr(msg_content)
#通过msg.get('From')等方法可以获取头部，但会出现编码不对
#通过decode，将Subject其变为中文
def decode_str(s):
    value, charset = decode_header(s)[0]
    if charset:
        value = value.decode(charset)
    return value
def get_header(msg):
    for header in ['From', 'To', 'Subject']:
        value = msg.get(header, '')
        if value:
            #文章的标题有专门的处理方法
            if header == 'Subject':
                value = decode_str(value)
            elif header in ['From','To']:
            #地址也有专门的处理方法
                hdr, addr = parseaddr(value)
                value = decode_str(addr)
        print(header + ':' + value)

头部信息取出后接着去正文内容，由于我平时的需求主要为文本信息或者附件，针对指定邮件获取信息，或者是取出附件，对一些广告邮件就不需要处理（我也不知道如何去处理）

邮件的正文部分处理

#邮件正文部分
#取附件
#邮件的正文部分在生成器中，msg.walk()
#如果存在附件，则可以通过.get_filename()的方式获取文件名称
def get_file(msg):
    for part in msg.walk():
        filename=part.get_filename()
        if filename!=None:#如果存在附件
            filename = decode_str(filename)#获取的文件是乱码名称，通过之前定义的函数解码
            data = part.get_payload(decode = True)#取出文件正文内容
            #此处可以自己定义文件保存位置
            path=filename
            f = open(path, 'wb')
            f.write(data)
            f.close()
            print(filename,'download')
#接下来取正文信息
#获取邮件的字符编码，首先在message中寻找编码，如果没有，就在header的Content-Type中寻找
def guess_charset(msg):
    charset = msg.get_charset()
    if charset is None:
        content_type = msg.get('Content-Type', '').lower()
        pos = content_type.find('charset=')
        if pos >= 0:
            charset = content_type[pos+8:].strip()
    return charset
def get_content(msg):
    for part in msg.walk():
        content_type = part.get_content_type()
        charset = guess_charset(part)
        #如果有附件，则直接跳过
        if part.get_filename()!=None:
            continue
        email_content_type = ''
        content = ''
        if content_type == 'text/plain':
            email_content_type = 'text'
        elif content_type == 'text/html':
            print('html 格式 跳过')
            continue #不要html格式的邮件
            email_content_type = 'html'
        if charset:
            try:
                content = part.get_payload(decode=True).decode(charset)
            #这里遇到了几种由广告等不满足需求的邮件遇到的错误，直接跳过了
            except AttributeError:
                print('type error')
            except LookupError:
                print("unknown encoding: utf-8")
        if email_content_type =='':
            continue
            #如果内容为空，也跳过
        print(email_content_type + ' -----  ' + content)
        #邮件的正文内容就在content中

使用python3处理邮件正文及附件

邮件正文结果

下面附上完整代码

import poplib
#解析邮件
from email.parser import Parser
from email.header import decode_header
from email.utils import parseaddr
#解析消息头中的字符串
#没有这个函数，print出来的会使乱码的头部信息。如'=?gb18030?B?yrXWpL3hufsueGxz?='这种
#通过decode，将其变为中文
def decode_str(s):
    value, charset = decode_header(s)[0]
    if charset:
        value = value.decode(charset)
    return value
#解码邮件信息分为两个步骤，第一个是取出头部信息
#首先取头部信息
#主要取出['From','To','Subject']
'''
From: "=?gb18030?B?anVzdHpjYw==?=" 
To: "=?gb18030?B?ztLX1Ly6tcTTys/k?=" <392361639@qq.com>
Subject: =?gb18030?B?dGV4dMTjusM=?=
'''
#如上述样式，均需要解码
def get_header(msg):
    for header in ['From', 'To', 'Subject']:
        value = msg.get(header, '')
        if value:
            #文章的标题有专门的处理方法
            if header == 'Subject':
                value = decode_str(value)
            elif header in ['From','To']:
            #地址也有专门的处理方法
                hdr, addr = parseaddr(value)
                name = decode_str(addr)
                #value = name + ' < ' + addr + ' > '
                value=name
        print(header + ':' + value)
#头部信息已取出
#获取邮件的字符编码，首先在message中寻找编码，如果没有，就在header的Content-Type中寻找
def guess_charset(msg):
    charset = msg.get_charset()
    if charset is None:
        content_type = msg.get('Content-Type', '').lower()
        pos = content_type.find('charset=')
        if pos >= 0:
            charset = content_type[pos+8:].strip()
    return charset
#邮件正文部分
#取附件
#邮件的正文部分在生成器中，msg.walk()
#如果存在附件，则可以通过.get_filename()的方式获取文件名称
def get_file(msg):
    for part in msg.walk():
        filename=part.get_filename()
        if filename!=None:#如果存在附件
            filename = decode_str(filename)#获取的文件是乱码名称，通过一开始定义的函数解码
            data = part.get_payload(decode = True)#取出文件正文内容
            #此处可以自己定义文件保存位置
            path=filename
            f = open(path, 'wb')
            f.write(data)
            f.close()
            print(filename,'download')
def get_content(msg):
    for part in msg.walk():
        content_type = part.get_content_type()
        charset = guess_charset(part)
        #如果有附件，则直接跳过
        if part.get_filename()!=None:
            continue
        email_content_type = ''
        content = ''
        if content_type == 'text/plain':
            email_content_type = 'text'
        elif content_type == 'text/html':
            print('html 格式 跳过')
            continue #不要html格式的邮件
            email_content_type = 'html'
        if charset:
            try:
                content = part.get_payload(decode=True).decode(charset)
            except AttributeError:
                print('type error')
            except LookupError:
                print("unknown encoding: utf-8")
        if email_content_type =='':
            continue
            #如果内容为空，也跳过
        print(email_content_type + ' -----  ' + content)
#get_file(msg)
if __name__ == '__main__':
    
    email='392361639@qq.com'
    password='ngq*******rznbici'
    server=poplib.POP3_SSL('pop.qq.com')
    server.user(email)
    server.pass_(password)
    #登录的过程
    resp, mails, octets = server.list()
    index = len(mails)#邮件的总数
    #此处的循环是取最近的几封邮件
    for i in range(index-2,index+1):
        resp, lines, octets = server.retr(i)#取邮件
        msg_content = b'\r\n'.join(lines).decode('utf-8','ignore')
        msg = Parser().parsestr(msg_content)
        #server.dele(index) 删除邮件
        get_header(msg)
        get_file(msg)
        get_content(msg)
    server.quit()

下面是发送正文及附件，相对读取邮件信息，发送邮件要比读取要简单很多

import smtplib
from email.mime.multipart import MIMEMultipart
from email.mime.text import MIMEText
import os 
sender = 'justonezcc@sina.com'
receiver = '392361639@qq.com'
subject = 'python email test'
smtpserver = 'smtp.sina.com'
password = '***'
from email import encoders
msgRoot = MIMEMultipart('alternative')
msgRoot['Subject'] = subject
msgRoot['From'] = sender
msgRoot['To']=receiver
#发送正文
content='你好，这是一封测试邮件'
cont=MIMEText(content,'plain','utf-8')
msgRoot.attach(cont)
#发送附件
file_name='实证结果.xls'#要发送文件的文字
row_path=os.getcwd()#或者其他路径
path=os.path.join(row_path,file_name)
att = MIMEText(open(path, 'rb').read(), 'base64', 'gb2312')
att["Content-Type"] = 'application/octet-stream'
att.add_header('Content-Disposition', 'attachment', filename=('gb2312', '', file_name)) 
msgRoot.attach(att)
smtp = smtplib.SMTP()
smtp.connect(smtpserver)
smtp.login(sender, password)
smtp.sendmail(sender, receiver, msgRoot.as_string())
smtp.quit()

你可能想看：

python中使用argparse.add_argument_group() 对命令行参数进行概念性分组

parser.add_argument('name':parser.add_argument('--bar_that')，parser.add_argument('--foo_that')。parse...

python的基本语法和脚本格式

我们在上一篇文章中已经学会了如何简单的运行python命令和脚本，当Python解释器读取源代码时，第二行注释是为了告诉Python解释器:Python在语义中存在着包、模块、类（当然还有函数）这几个...

对比Excel，轻松学习Python报表自动化实战，这篇教程有点肝!

轻松学习Python报表自动化》中关于报表自动化实战的内容。并教你用Python实现工作中的一个报表自动化实战，1.Excel的基本组成2.一份报表自动化的流程3.报表自动化实战 -当日各项指标同环...

python 知识点大全，建议收藏留用！

经常有读者问我 Java、C++、Python 这些语言怎么选择，这两门语言想要学好、学透都不容易，一些开发非常便捷、库非常丰富的语言也可以掌握一下，从后台开发 Flask、AI、数据分析、爬虫......

整理python爬虫过程中会遇到的问题，以及如何解决这些问题的方法

在使用python爬虫的过程中，现在我们就来探讨下这些在python爬虫的过程中可能遇到的问题，一般网页的开发者为了不让自己的js代码轻易被别人拷贝，我们可以通过debug来找到js加密解密的代码，爬...

如何用photoshop批量处理图片大小

打开一张你要处理的图片，另存完后关掉图片。文件－自动－批处理在弹出的对话框中要选填的选项有，选择你要处理的图片所在的文件夹覆盖动作……包含子文件夹……禁止颜色配置警告这三个都勾选上目的，这个动作只能让...

如何用photoshop制作水面倒影

学习如何用photoshop制作逼真的水面倒影，主要用到了置换滤镜和图层蒙版等。首先打开要制作倒影的素材-城堡。把2个图层的白色部分都删除，底部新建图层2，之后选择图层1，添加蒙版黑白直线渐变。选择图...

网上交流信息—电子邮件的使用教学设计

网上交流信息—电子邮件的使用教学设计一、教材分析，掌握如何正确地进行网上交流对学生今后的学习、工作和生活都很有好处，本节强调通过体验和感悟网络信息交流活动中的操作与应用，（2）培养学生进行网络信息交流...

微博正文

《伤寒名医验案精选》94 竹叶石膏汤“*竹叶、生石膏：舌红无苔，*人参、粳米、甘草：*午后低热不退，少气乏力：（病-实）持续高热不退，（证）舌面干燥，（人-虚）其人面色晦暗无华，*低热心烦。*舌红无苔...

学书法无不接触《千字文》，那你懂吗？《千字文》全文释义及附拼音

主动把君位禅让给功臣贤人。全都心甘情屈服贤君，贤君的教化覆盖大自然的一草一木。恭蒙父母亲生养爱护；女子要思慕那些为人称道的贞妇洁女，男子要效法有德有才的贤人；墨子为白丝染色不褪而悲泣，「诗经」中因此有...

Photoshop 2022下载

并提供软件资源百度网盘下载，您可以轻松编辑、创建、整理和分享您的照片。您可以轻松编辑、创建、整理和共享照片，您还可以使用智能标签、面部识别等功能快速找到您的照片和视频，您的目录结构会自动备份以便于恢复...

Photoshop调出漂亮外景美女梦幻蓝色调

教程主要使用Photoshop调出漂亮外景美女梦幻蓝色调，其实处理照片时，我们首先需要的是对照片进行风格的设定，这些都是给自己确定自己想要处理成什么效果。接下来的就是对照片素材进行分析，查看照片素材是...

据称苹果iPhone 11和iPhone 11 Max模具表面照片泄露

并允许苹果提供一个后置人脸ID和更多的增强现实(AR)功能。iPhone XR的续集预计将搭载一个未知尺寸的LCD(液态视网膜)显示屏。我们应该会看到2019年的iphone与2018年的屏幕尺寸相同...

Photoshop软件安装，win系统一键安装介绍，主机配置推荐

有的色彩管理也删除系统色彩不准，adobe已经不支持win7连接服务器。推荐一款在win10+ps2022里面能胜任工作的配置，并不是推荐多么好得配置）一、要不要用最新版的Photoshop我觉得是没...

Photoshop抠图：只用一招，快速抠羽毛、玻璃、火焰等黑色背景图片

我们会看到很多黑色背景的图片，比如玻璃杯.羽毛和火焰等，这种素材的抠图方法很多。今天翼狐网小编要做的就是使用一种方法就能统统搞定了，我们用此法抠羽毛来举例。点击通道”键点击红色通道，如下图出现选区，填...

操作不当，你的电子邮件别人也能看到

原来用网易免费邮箱收发邮件后，以往的操作自以为及时关闭了邮箱，而这有可能让其他人看到你邮箱中的所有邮件。不知道大家是怎么登录网易免费邮箱的，此前我都是在网址栏中输入http:在网页的相应文本框内分别输...

25个让你相见恨晚的 iPhone 使用技巧！

但手机中隐藏着许多实用的操作技巧，从图片管理、工具调用、文档编辑、界面设置等四个方面整理出了25个最实用的使用技巧。iPhone如何使用专业模式拍照，iPhone的「小组件」功能可以快速启动Ligh...

一个消除附件包块的特效方——桂己合方

附件包块是在卵巢或者输卵管部位出现囊性包块，通常由附件炎或是肿瘤囊肿引起的，腹胀不舒服，还会挤压膀胱导致尿频或排尿困难。丹皮，赤芍，葶苈子，活血祛瘀：常伴有少腹胀痛或少腹冷，舌色淡暗或舌边瘀点：茯苓，...

这个方治疗甲状腺结节，一个疗程不到结节变小，附件囊肿竟然消失！附前后检查结果

再有血瘀痰凝，都有血瘀和痰凝加气滞，患者甲状腺结节0.8×0.6cm，证属痰瘀互结。手脚心发热消失，患者治疗信心增加。根据患者情况改变治疗重点，甲状腺病的病因主要是情志内伤和饮食及水土失宜、先天因素有...

土茯苓败酱草治附件炎

【功能主治】清热解毒，活血化瘀。主治附件炎。　　【偏方组成】土茯苓、败酱草各30克，制乳香、没药各6～10克，当归12克，橘核9克。水煎服。去丹参，加三棱、莪术各6克；肾虚者，桑寄生20克，菟丝子12...

附件二：龙口市共同体名师工作室成员考核评估标准

(附件3)行为或在年度考核中：年度上传或提交资源5篇次以上（5分）：工作室成员每学期要提交2篇资源；本校或共同体内评课不少于4节(评课记录表附件8)（1分。每学期指导培养共同体内学校3-4名（不同学校...

为人处世是一门学问，处理好了就是一帆风顺，处理不好就是灾祸

不要无端伤害与你没有利害关系的人，其实他内心一定是抗拒的，喝酒之后就鞭打部下。这其实就是不知尊重他人得到的最严重恶果，说就喜欢打断别人说话。但有的人就是放不下自己的那份所谓虚荣心，相反只能把事情搞得一...

PPT做得丑？这15个免费可商用PPT模板网站你一定要收藏！

很多人因为寻找资源网站浪费了不少时间。小编为大家汇总了6大类资源网站：PPT模板、图片、字体、配色、音频&视频、综合网站，资源网站汇总如下：序号类别名称适用人员1PPT模板PPT模板素材网站PPT设计...

管理高手，都是善用PDCA自我管理的人

管理高手是如何在管好下属与事情的过程中，认真思考如何完美执行工作，—需要下属执行的工作任务，管理高手更是非常注重执行前的策划（计划），管理高手在安排重要工作时，所以选择合适的执行者是安排工作任务中非常...

巧用PVC管阳台种菜，供一家人吃

温州人巧用PVC管阳台种菜，今天温州网友介绍几款种菜花盆制作方法，小厨建议厨丝们不要买泡沫箱种菜，趁热拿个小管往下压（千万不要直接用手压。全部弄好了装上底部封盖就OK了：鱼菜共生（无土栽培）自然控请进...

巧用PDCA助力目标达成

今天就给大家介绍一种助力目标达成的有效方法：它由计划（Plan）、实施（Do）、确认（Check）、处置（Action）四个环节组成：执行完所有步骤就完成了一个基础的PDCA循环“的案例给大家讲讲PD...

不用PS！这样去除图片水印，10秒就能去得干干净净！

请看接下来这款15秒去水印的超强工具——！一步到位的去水印效果更受职场打工人认可。先判断水印区的背景复杂程度，下面是2组简单背景去水印对比。图片画质和结构几乎没有发生任何改变，没有水印的图片都加更美观...

邮件正文邮箱附件头部

上一篇
问财选股问句

下一篇
初中生应该有手机吗班主任直言：家长要给娃买手机，不然吃大亏