手把手教你使用Python網(wǎng)絡(luò)爬蟲實(shí)現(xiàn)郵件定時(shí)發(fā)送(附源碼)
大家好,我是Python進(jìn)階者。
前言
前幾天【馮誠】大佬在群里分享了一個(gè)抓取讀書目錄并實(shí)現(xiàn)郵件定時(shí)發(fā)送的代碼,感覺還是蠻不錯(cuò)的,這里分享給大家學(xué)習(xí)。
一、思路
思路倒是不難,構(gòu)造一個(gè)爬蟲任務(wù),抓取某書網(wǎng)站上的目錄,之后將獲取的內(nèi)容返回,然后利用Python實(shí)現(xiàn)郵件發(fā)送的功能,剩下的就是定時(shí)任務(wù)構(gòu)建了,下面一起來看看具體的實(shí)現(xiàn)過程。
二、具體實(shí)現(xiàn)
這里直接丟大佬的代碼了,如下所示:
- # -*- coding: utf-8 -*-
- import requests, bs4
- import smtplib
- import schedule
- import time
- from bs4 import BeautifulSoup
- from email.mime.text import MIMEText
- from email.header import Header
- # account = '{0}'.format('發(fā)件人qq郵箱')
- # password = '{0}'.format('qq郵箱授權(quán)碼')
- # receiver = '{0}'.format('收件人163郵箱或者qq郵箱')
- account = '{0}'.format('2352180977@qq.com')
- password = '{0}'.format('awmowqginzdijg')
- receiver = '{0}'.format('2352180977@qq.com')
- # 爬蟲任務(wù),獲取sobooks網(wǎng)站上的書名和作者,其中頁面的話,可以根據(jù)自己需求進(jìn)行修改
- def recipe_spider():
- list_all = ''
- num = 0
- for a in range(1, 3):
- n = '{0}{1}'.format('https://sobooks.cc/page/', a)
- res = requests.get(n)
- res.encoding = res.apparent_encoding
- bs = BeautifulSoup(res.text, 'html.parser')
- # print(bs)
- books = bs.find_all('h3')
- authors = bs.find_all('p')
- for i in range(len(books)):
- num = num+1
- book = books[i].text.strip()
- author = authors[i+1].text.strip()
- #list_books.append([book,author])
- # list_books.append(list_book)
- n = '''
- 書名%s: %s,作者: %s
- ''' % (num, book, author)
- list_all = list_all + n
- return list_all
- # 將獲取到的內(nèi)容發(fā)送郵件
- def send_email(list_all):
- global account, password, receiver
- mailhost = 'smtp.qq.com'
- qqmail = smtplib.SMTP()
- qqmail.connect(mailhost, 25)
- qqmail.login(account, password)
- content = '親愛的,今天書單' + list_all
- print(content)
- message = MIMEText(content, 'plain', 'utf-8')
- subject = '今天看什么'
- message['Subject'] = Header(subject, 'utf-8')
- try:
- qqmail.sendmail(account, receiver, message.as_string())
- print('郵件發(fā)送成功')
- except:
- print('郵件發(fā)送失敗')
- qqmail.quit()
- def job():
- print('開始一次任務(wù)')
- list_all = recipe_spider()
- send_email(list_all)
- print('任務(wù)完成')
- if __name__ == '__main__':
- # 定時(shí)任務(wù),其中0.05是間隔的意思,以分鐘為間隔,時(shí)間默認(rèn)是整數(shù)。
- schedule.every(0.05).minutes.do(job)
- while True:
- schedule.run_pending()
- time.sleep(1)
程序運(yùn)行之后,即可實(shí)現(xiàn)郵件自動發(fā)送了。
稍等片刻,郵件便會自動給你發(fā)送過去,下圖是郵件通知。
下圖是郵件的具體內(nèi)容:
針對上述代碼,你只需要更改三個(gè)地方,其一是發(fā)件人的qq郵箱,其二是qq郵箱的授權(quán)碼,其三是收件人的郵箱,如下圖紅色框框所示。
三、常見問題
在運(yùn)行過程中小伙伴們應(yīng)該會經(jīng)常遇到這個(gè)問題,如下圖所示。
這個(gè)很可能是因?yàn)槟愕泥]箱沒有填對或者授權(quán)碼錯(cuò)誤,檢查下郵箱后綴是否添加或者檢查下授權(quán)碼是否復(fù)制完整。
有的小伙伴還不知道qq郵箱授權(quán)碼怎么獲得,這里引導(dǎo)下,首先你得打開自己的qq郵箱,然后點(diǎn)擊設(shè)置-->賬戶,如下圖所示:
拉到最下方,如下圖所示:
點(diǎn)擊生成授權(quán)碼,之后會彈出下圖界面:
手機(jī)發(fā)送“配置郵件客戶端”關(guān)鍵字,記得,是“郵件”,而不是“郵箱”,小編之前就是因?yàn)榘l(fā)錯(cuò)了字,所以導(dǎo)致沒成功,論細(xì)心的重要性!發(fā)送成功之后,就會彈出下圖:
上圖左側(cè)中的條框字母部分就是qq郵箱的授權(quán)碼了,將其復(fù)制到代碼中進(jìn)行粘貼即可。
四、總結(jié)
我是Python進(jìn)階者,這篇文章主要給大家介紹了使用Python網(wǎng)絡(luò)爬蟲并實(shí)現(xiàn)郵件自動定時(shí)發(fā)送的小項(xiàng)目。實(shí)現(xiàn)的主要思路是構(gòu)造一個(gè)爬蟲任務(wù),抓取某書網(wǎng)站上的目錄,之后將獲取的內(nèi)容返回,然后利用Python實(shí)現(xiàn)郵件發(fā)送的功能,并進(jìn)行定時(shí)任務(wù)構(gòu)建,在最后還給大家例舉了常見問題的處理方法。
小伙伴們,快快用實(shí)踐一下吧!