【问题标题】:Gmail API Python - Retrieve Email BodyGmail API Python - 检索电子邮件正文
【发布时间】:2017-03-07 05:26:12
【问题描述】:

在我的 Python 代码中,我想获取我的 Gmail 电子邮件的正文。我希望它适用于任何电子邮件,不受格式(纯文本、Mime 等)和文本编码的影响。

据我所知,唯一的方法是编写一个能够处理任何场景的解码器。在开始之前,我有几个问题:

1- 我对此是否正确,或者是否有更简单的方法,从 API 或 Python 模块获取任何类型的电子邮件的正文? (我是 Python 和 Gmail API 的新手)

2- 有没有人写过这样的解码器,我可以导入到我的代码中?

谢谢你, 埃里克

【问题讨论】:

标签: python python-2.7 gmail-api


【解决方案1】:

是一个简单快速的沙盒案例,你必须重构一些部分

import re
import sys
import imaplib
import getpass
import email
import datetime
import string
import get_mail_search
from sys import stdout

M = imaplib.IMAP4_SSL('imap.gmail.com')
class Get_mail(object):
    """docstring for Get_mail"""
    def __init__(self, *args):
        super(Get_mail, self).__init__()
        c=1
        self.login(c)
        self.toast_msg()

        raw_input()
    def toast_msg(self, *args):
        """docstring for Get_mail"""
        M = self.mailbox()
        stdout.write("\n{}\n".format(get_mail_search.search_help_info))
        serach_input = raw_input()
        rv, data = M.search(None, serach_input)
        if rv != 'OK':
            print "No messages found!"
        id_ls = data[0].split()
        rev_id_ls = [i for i in reversed(id_ls)]
        if rev_id_ls:
            for o in rev_id_ls:
                try:
                    msg_content = self.process_mailbox(M, o)
                    _date_ = msg_content[0]
                    _from_ = msg_content[1]
                    _to_   = msg_content[2]
                    _subject_ = msg_content[3]
                    _msg_   = msg_content[4]
                    stdout.write("$$$$$$$$$$$\nDate: {}\nFrom: {}\nTo: {}\nSubject: {}\nMSG: {}\n".format(_date_,_from_,_to_,_subject_,_msg_))
                except Exception, e:
                    pass
        else:
            stdout.write("No {} Mail Found!".format(serach_input))
            raw_input()
            self.toast_msg()

    def login(self, try_c, *args):
        """docstring for Get_mail"""
        try:
            stdout.write("\nMail:\n")
            mail = raw_input()
            if mail:
                M.login(str(mail), getpass.getpass())
            else:
                sys.exit(1)
        except imaplib.IMAP4.error:
            if try_c<=3:
                stdout.write("Versuch: {}/3\n".format(try_c))
                stdout.write("Die eingegebene E-Mail-Adresse und das Passwort stimmen nicht uberein. Nochmal versuchen")
                try_c+=1
                self.login(try_c)
            else:
                sys.exit(1)
    def mailbox(self, *args):
        """docstring for Get_mail"""
        rv, mailboxes = M.list()
        if rv == 'OK':
            for menu in mailboxes:
                print('{}'.format(menu))
            rv, data = M.select("inbox")
            if rv == 'OK':
                return M
    def eval_decode(self, header, *args):
        """docstring for Get_mail"""
        return email.Header.decode_header(header)[0]

    def process_mailbox(self, M, num, *args):
        """docstring for Get_mail"""
        rv, header = M.fetch(num, '(RFC822)')
        if rv != 'OK':
            print "ERROR getting message", num
        header_msg = email.message_from_string(header[0][1])
        if header_msg.is_multipart():
            body=[payload.get_payload(decode=True) for payload in header_msg.get_payload()]
        else:
            body=payload.get_payload(decode=True)
        from_decode = self.eval_decode(header_msg['From'])
        subject_decode = self.eval_decode(header_msg['Subject'])
        date_decode = self.eval_decode(header_msg['Date'])
        to_decode = self.eval_decode(header_msg['To'])
        return (date_decode[0], from_decode[0], to_decode[0], subject_decode[0], str(body[0]))
def run():
    try:
        Get_mail()
    except KeyboardInterrupt:
        M.close()
        M.logout()
        sys.exit(1)
run()

【讨论】:

  • 我将在接下来的几天内继续努力,并在此处发布我的结果。我不使用 IMAP 访问我的电子邮件,但您的 process_mailbox 功能似乎是我的问题的解决方案。
  • 非常感谢!
猜你喜欢
  • 1970-01-01
  • 2020-02-05
  • 2014-08-17
  • 1970-01-01
  • 2018-07-28
  • 2012-12-11
  • 2017-11-01
  • 2018-11-10
  • 2011-07-19
相关资源
最近更新 更多