dis — Disassembler for Python bytecode,即把python代碼反匯編為字節碼指令.
使用超級簡單:
1
|
python -m dis xxx.py |
Python 代碼是先被編譯為字節碼后,再由Python虛擬機來執行字節碼, Python的字節碼是一種類似匯編指令的中間語言, 一個Python語句會對應若干字節碼指令,虛擬機一條一條執行字節碼指令, 從而完成程序執行。
Python dis 模塊支持對Python代碼進行反匯編, 生成字節碼指令。
當我在網上看到while 1比while True快的時候,我感到很困惑,為何會有這種區別呢?
于是使用dis來深入.
假設est_while.py代碼如下.
1
2
3
4
5
6
|
#coding=utf-8 while 1 : pass while True : pass |
下面是使用dis來進行剖析.
1
2
3
4
5
6
7
8
|
E:\>python -m dis test_while.py 2 0 SETUP_LOOP 3 (to 6) 3 >> 3 JUMP_ABSOLUTE 3 5 >> 6 SETUP_LOOP 10 (to 19) >> 9 LOAD_NAME 0 (True) 12 POP_JUMP_IF_FALSE 18 |
可以看到,在while 1這里(第3行),直接是JUMP_ABSOLUTE指令;
而while True這里(第5行),由LOAD_NAME和POP_JUMP_IF_FALSE指令組成.
原來True在python2中不是一個關鍵字,只是一個內置的變量,bool類型,值為1,即True+True輸出2.
而且還可以被賦值.比如賦值True = 2, 甚至可以賦值True = False.
所以while True的時候, 每次循環都要檢查True的值, 對應指令LOAD_NAME.
這就是為什么while True比while 1慢了.
不過在python3中,True變成了關鍵字了.while 1和while True的指令相同,所以沒有性能區別了.
再來看個小例子,先來一小段代碼:
1
2
3
4
5
6
|
In[ 6 ]: def test(): ... x = 1 ... if x < 3 : ... return "yes" ... else : ... return "no" |
代碼執行后會輸出:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
In[ 7 ]: import dis In[ 8 ]: dis.dis(test) 2 0 LOAD_CONST 1 ( 1 ) 3 STORE_FAST 0 (x) 3 6 LOAD_FAST 0 (x) 9 LOAD_CONST 2 ( 3 ) 12 COMPARE_OP 0 (<) 15 POP_JUMP_IF_FALSE 22 4 18 LOAD_CONST 3 ( 'yes' ) 21 RETURN_VALUE 6 >> 22 LOAD_CONST 4 ( 'no' ) 25 RETURN_VALUE 26 LOAD_CONST 0 ( None ) 29 RETURN_VALUE |
以第一條指令為例, 第一列的數字(2)表示對應源代碼的行數。第二列的數字是字節碼的索引,指令LOAD_CONST在0位置。第三列是指令本身對應的人類可讀的名字。第四列表示指令的參數。第5列則是計算后的實際參數。其中的“>>" 表示跳轉的目標, 第4列的“22” 表明了跳轉到索引為22的指令。Python代碼在編譯過程中會生成CodeObject, CodeObject是在虛擬機中的抽象表示, 在Python C源碼中表示為PyCodeObject, 而生成的.pyc 文件則是字節碼在磁盤中的表現形式。
以Python代碼為講,test.__code__.co_code 表示test函數的字節碼指令序列。
將此序列打印出來,
1
2
|
code = [ ord (i) for i in list (test.__code__.co_code)] print code |
輸出:
[100, 1, 0, 125, 0, 0, 124, 0, 0, 100, 2, 0, 107, 0, 0, 114, 22, 0, 100, 3, 0, 83, 100, 4, 0, 83, 100, 0, 0, 83]
對照dis輸出的字節碼指令, 以[100,1,0]序列為例。100表示在Python字節碼定義中的索引,在python代碼中,
可以通過dis.opname[100]查看,即為LOAD_CONST。而后的兩個字節表示指令的參數。而dis輸出的字節碼指令中,
第二列的字節碼索引則是指當前指令在co_code序列中所在的位置。
dis輸出的字節碼指令中,部分指令是沒有參數, 在co_code 中也同樣可以看到,83(RETURN_VALUE)直接接上下一條指令100(LOAD_CONST)。