最近正好在寻求一种python的数据库orm (object relational mapper),sqlalchemy (项目主页)这个开源项目进入了我的视线,本来想尝试着使用django的orm模块的,无奈django的模块联系比较紧密,没能单独分拆下来,一定程度上说明django自成体系的生态系统在给我们带来快速便捷的开发环境的同时牺牲了组装的灵活性。
初次学习,也没实质感觉到sqlalchemy的好处,不过看其介绍的很多大公司均采用该项目,而且其支持的数据库还是蛮丰富的,所以我觉得花点时间研究还是值得的。不过令人遗憾的是关于sqlalchemy的中文资料比较少,所以对于我们这种英语不佳的带来了一定的麻烦。
研究一个项目最好的办法就是阅读其官方提供的说明文档,当然很轻松就找到了sqlalchemy的文档 (0.7)。文档的格式和大多数项目一样,有下载安装说明,有示例,有快速上手教程。不过我还是习惯下载个pdf慢慢研究。
下面就将我近期的阅读学习做个笔记,当然这个仅供参考,里面可能有自己的一些猜测和想法,不作权威依据,不当之处还希望指出。
1. 安装sqlalchemy
安装部分不打算详细介绍,可以通过easy_install或者pip进行安装,命令如下:
代码如下:
easy_install sqlalchemy# 或者pip install sqlalchemy
当然我使用的是windows环境,所以倾向于使用setup.py安装,下载压缩包,解压,然后命令提示符下切换到该目录,再运行下面的命令:
代码如下:
python setup.py install
这里需要注意的是默认安装会编译安装c扩展,这些c扩展将直接编译为二进制本机代码然后为sqlalchemy处理数据集加速,这个是很不错的功能,遗憾的是windows下提示编译安装扩展失败,当然这不影响sqlalchemy的使用,只是作为性能上的优化,本机开发环境可以不需要这些扩展,如果不需要可以尝试下面的命令:
代码如下:
pip install –global-option=’–without-cextensions’ sqlalchemy# 或者setup.py方式python setup.py –without-cextensions install
好了,到这里安装部分我就简单介绍完了,如果对这部分感兴趣的话可以移步文档。
最后可以检验一下安装成果:
代码如下:
>>> import sqlalchemy>>> sqlalchemy.__version__ 0.7.0
2. 简单的查询
就像任何新语言都是从万能的’hello world’开始一样,先简单体验一把sqlalchemy,由于sqlalchemy是管理数据库的,所以我们需要一个数据库,自从用了python以后,一提到数据库,拿来做实验的首当其冲的就是python自带的sqlite3,这次我们连sqlite的数据库文件都不需要指定了,直接创建一份基于内存的数据库,也就是说数据文件存放在内存中,便于我们下面的测试。
我们使用create_engine创建数据库连接引擎:
代码如下:
>>> from sqlalchemy import create_engine>>> engine = create_engine(‘sqlite:///:memory:’, echo=true)
create_engine的第一个参数’sqlite:///:memory:’我们知道是建立数据库连接的,那第二个参数echo=true是做什么的呢,其实如果echo=true那么sqlalchemy将会通过python标准模块logging来输出日志,如果你在操作交互式命令控制台,一些信息将会被输出,这里我们可能会看到sqlalchemy生成的一些sql语句,这个对于我们学习和调试是很有必要的,所以在这里我们将其设置为true,否则,如果不愿意sqlalchemy这么啰嗦的话可以设置为false,这样就看不到这些信息啦。
create_engine()将会返回一个engine引擎实例(instance),其代表着sqlalchemy对于数据库的核心接口,其隐藏了各种数据库方言(dialect)的细节,实际上sqlalchemy的底层是python的dbapi。
需要注意的是此时并没有实质上与数据库建立连接,什么时候才会与数据库真正建立连接呢?这个只会在你第一次查询数据库的时候发生。呃…这个有点像lazy loading (懒惰加载,延迟加载),也就是说我们需要真正操作数据库的时候才真正建立连接。sqlalchemy很多地方用到了lazyload,以后会有机会和大家介绍的。
接下来我们来执行第一条sql语句,同时建立数据库连接:
代码如下:
>>> engine.execute(“select 1”).scalar()1
好了,当engine.execute执行时,engine终于建立起实质上数据库连接了。
engine对于数据库连接的管理采取的是数据库连接池 (pool),当连接第一次建立,sqlalchemy将会将建立的连接放入内部的连接池中以便于随后的数据操作语句执行时复用。
当然关于engine的用法并不是sqlalchemy精彩的orm部分,随后我们会介绍将engine绑定到orm,然后使用对象来操作数据库部分。