用Pandas庫(kù)實(shí)現(xiàn)MySQL數(shù)據(jù)庫(kù)的讀寫(xiě)
本次分享將介紹如何在Python中使用Pandas庫(kù)實(shí)現(xiàn)MySQL數(shù)據(jù)庫(kù)的讀寫(xiě)。首先我們需要了解點(diǎn)ORM方面的知識(shí)。
ORM技術(shù)
對(duì)象關(guān)系映射技術(shù),即ORM(Object-Relational Mapping)技術(shù),指的是把關(guān)系數(shù)據(jù)庫(kù)的表結(jié)構(gòu)映射到對(duì)象上,通過(guò)使用描述對(duì)象和數(shù)據(jù)庫(kù)之間映射的元數(shù)據(jù),將程序中的對(duì)象自動(dòng)持久化到關(guān)系數(shù)據(jù)庫(kù)中。
在Python中,最有名的ORM框架是SQLAlchemy。Java中典型的ORM中間件有: Hibernate, ibatis, speedframework。
SQLAlchemy
SQLAlchemy是Python編程語(yǔ)言下的一款開(kāi)源軟件。提供了SQL工具包及對(duì)象關(guān)系映射(ORM)工具,使用MIT許可證發(fā)行。
可以使用pip命令安裝SQLAlchemy模塊:
- pip install sqlalchemy
SQLAlchemy模塊提供了create_engine()函數(shù)用來(lái)初始化數(shù)據(jù)庫(kù)連接,SQLAlchemy用一個(gè)字符串表示連接信息:
'數(shù)據(jù)庫(kù)類(lèi)型+數(shù)據(jù)庫(kù)驅(qū)動(dòng)名稱(chēng)://用戶名:口令@機(jī)器地址:端口號(hào)/數(shù)據(jù)庫(kù)名'
Pandas讀寫(xiě)MySQL數(shù)據(jù)庫(kù)
我們需要以下三個(gè)庫(kù)來(lái)實(shí)現(xiàn)Pandas讀寫(xiě)MySQL數(shù)據(jù)庫(kù):
- pandas
- sqlalchemy
- pymysql
其中,pandas模塊提供了read_sql_query()函數(shù)實(shí)現(xiàn)了對(duì)數(shù)據(jù)庫(kù)的查詢(xún),to_sql()函數(shù)實(shí)現(xiàn)了對(duì)數(shù)據(jù)庫(kù)的寫(xiě)入,并不需要實(shí)現(xiàn)新建MySQL數(shù)據(jù)表。sqlalchemy模塊實(shí)現(xiàn)了與不同數(shù)據(jù)庫(kù)的連接,而pymysql模塊則使得Python能夠操作MySQL數(shù)據(jù)庫(kù)。
我們將使用MySQL數(shù)據(jù)庫(kù)中的mydb數(shù)據(jù)庫(kù)以及employee表,內(nèi)容如下:

mydb數(shù)據(jù)庫(kù)以及employee表
下面將介紹一個(gè)簡(jiǎn)單的例子來(lái)展示如何在pandas中實(shí)現(xiàn)對(duì)MySQL數(shù)據(jù)庫(kù)的讀寫(xiě):
- # -*- coding: utf-8 -*-
- # 導(dǎo)入必要模塊
- import pandas as pd
- from sqlalchemy import create_engine
- # 初始化數(shù)據(jù)庫(kù)連接,使用pymysql模塊
- # MySQL的用戶:root, 密碼:147369, 端口:3306,數(shù)據(jù)庫(kù):mydb
- engine = create_engine('mysql+pymysql://root:147369@localhost:3306/mydb')
- # 查詢(xún)語(yǔ)句,選出employee表中的所有數(shù)據(jù)
- sql = '''
- select * from employee;
- '''
- # read_sql_query的兩個(gè)參數(shù): sql語(yǔ)句, 數(shù)據(jù)庫(kù)連接
- df = pd.read_sql_query(sql, engine)
- # 輸出employee表的查詢(xún)結(jié)果
- print(df)
- # 新建pandas中的DataFrame, 只有id,num兩列
- df = pd.DataFrame({'id':[1,2,3,4],'num':[12,34,56,89]})
- # 將新建的DataFrame儲(chǔ)存為MySQL中的數(shù)據(jù)表,不儲(chǔ)存index列
- df.to_sql('mydf', engine, index= False)
- print('Read from and write to Mysql table successfully!')
程序的運(yùn)行結(jié)果如下:

程序的運(yùn)行結(jié)果
在MySQL中查看mydf表格:
mydf表格
這說(shuō)明我們確實(shí)將pandas中新建的DataFrame寫(xiě)入到了MySQL中!
將CSV文件寫(xiě)入到MySQL中
以上的例子實(shí)現(xiàn)了使用Pandas庫(kù)實(shí)現(xiàn)MySQL數(shù)據(jù)庫(kù)的讀寫(xiě),我們將再介紹一個(gè)實(shí)例:將CSV文件寫(xiě)入到MySQL中,示例的mpg.CSV文件前10行如下:

mpg.CSV文件前10行
示例的Python代碼如下:
- # -*- coding: utf-8 -*-
- # 導(dǎo)入必要模塊
- import pandas as pd
- from sqlalchemy import create_engine
- # 初始化數(shù)據(jù)庫(kù)連接,使用pymysql模塊
- engine = create_engine('mysql+pymysql://root:147369@localhost:3306/mydb')
- # 讀取本地CSV文件
- df = pd.read_csv("E://mpg.csv", sep=',')
- # 將新建的DataFrame儲(chǔ)存為MySQL中的數(shù)據(jù)表,不儲(chǔ)存index列
- df.to_sql('mpg', engine, index= False)
- print("Write to MySQL successfully!")
在MySQL中查看mpg表格:

MySQL中的mpg表格
僅僅5句Python代碼就實(shí)現(xiàn)了將CSV文件寫(xiě)入到MySQL中,這無(wú)疑是簡(jiǎn)單、方便、迅速、高效的!
總結(jié)
本文主要介紹了ORM技術(shù)以及SQLAlchemy模塊,并且展示了兩個(gè)Python程序的實(shí)例,介紹了如何使用Pandas庫(kù)實(shí)現(xiàn)MySQL數(shù)據(jù)庫(kù)的讀寫(xiě)。程序本身并不難,關(guān)鍵在于多多練習(xí)。