逆向-Python反编译保姆级教程

咸鱼渊Yuan 2024-06-30 08:05:03 阅读 65

【出现的形式】

出现的话往往是python编写,然后编译好的exe或者elf文件,我们需要做的就是找到源码,分析逻辑,进行解密

【生成pyc文件】

使用的工具就是pyinstxtractor

pyinstxtractor-2023.08.zip

其中的py文件可以实现将exe文件或者elf文件,打包为

使用方法(以snake.elf这个题目为例)

解压,将目标放入文件

在这里打开cmd窗口 ,输入指令python pyinstxtractor.py snake

呈现如下就是成功,发现文件中多了一个_extracted文件夹,打开 ,去里面找到"目标文件名.pyc"的文件(往往与struct.pyc一并出现,都有用)

注:进行完上述操作之后,可能会遇到文件头结构需要补充修改的情况,就是讲sanke和struct两个pyc文件放入010查看sanke的文件头是否与struct相同,不同的话要把后者的内容补充上去(目前做题还没遇到过这样的情况,可能现在这个工具比较好用了)再进行下一步操作。

【生成py文件,实现反编译】

这一步实现pyc文件转化为py源码

(一)使用在线反编译网站

python反编译 - 在线工具

这个网站可以实现的版本较多,但是有使用限制

在线pyc,pyo,python,py文件反编译,目前支持python1.5到3.6版本的反编译-在线工具

这个网站使用方便但是很久没更新了

一般直接将上一步生成的pyc文件放入其中就可以生成py文件

(二)pycdc工具进行反编译

其实在线工具就是利用这个玩意进行了python的反编译,之所以我们会用到这个工具,因为做题遇到了一个使用高版本python编写的exe,使用在线工具是无法完美反编译出来的。其实使用这个pycdc的话也会报错,但是由于我们在本地使用的脚本,我们就可以修改文件中的代码,实现绕过一些报错,大致反编译出来源码进行解密(下面第三点讲到)

其次就是,到后期,在没有联网的比赛中,这个工具就显得尤为重要了,我们接下来进行pycdc的几种安装方式的教程。

Windows与Linux系统安装的大致思路相似

github上下载压缩包/文件 - cmake进行编译生成可执行文件 - 成功运行

·Linux系统(利用wsl,方便进行源码修改)

参考了上面提到的题目的题解,认识到了wsl这个伟大的功能(在windows的命令框中实现我们的linux操作)这篇文章讲的十分详尽了,本文就不再过多赘述了,直接进入我们安装pycdc的整正题

[安利] WSL Linux 子系统,真香!完整实操 - 知乎

(在linux上和下面的操作是一样的)

安装完毕wsl之后,打开cmd输入wsl切换系统

{先熟悉几个指令(萌新可以看看)}

cd

地址跳转功能,我们输入cd ~之后会跳到最干净的地址

ls

查看文件目录

我们发现就是我们的这几个目录

{正式安装}
(1)准备工作:安装gcc,cmake,bulid包

sudo apt-get update

sudo apt-get install gcc

sudo apt install cmake

sudo apt install build-essential(第一次装的时候就是因为这个包没装上,cmake一直无法编译)

(2)git拉取文件

git clone https://github.com/zrax/pycdc.git

这样一来,再输入ls之后会像我上面展示的一样出现pycdc这个文件夹,当然我们还要去编译他

(3)地址切换到pycdc,进行编译

cd pycdc

(4)编译过程

cmake .

make

sudo make install

看到安装到bin目录下的两个文件就证明我们成功了,可以正常使用了,是不是非常方便

{使用方法}

进入存放pyc文件的文件夹,打开终端进入wsl

输入命令pycdc ./rc4.pyc

顺利反编译

当然你还可以选择直接生成py文件,命令

pycdc ./rc4.pyc >> ../newrc4.py就会在上一层目录中生成这个py文件

和在窗口打开的并无差异

·Windows系统

windows的操作可能比较繁琐,cmake的安装可能需要一定功夫,这里也给大家讲讲

{前期准备}

首先就是需要的工具,vscode上的一些插件提前下载好

然后去下载一个cmake和MinGW,按照这个两篇文章来就好

CMake 安装教程_cmake下载安装教程-CSDN博客

Mingw快捷安装教程 并完美解决出现的下载错误:The file has been downloaded incorrectly-CSDN博客

{正式安装}

(1)官网下载pycdc压缩包文件

GitHub - zrax/pycdc: C++ python bytecode disassembler and decompiler

(2)解压的文件夹放入vscode中

ctrl shift P 选择生成

下一步选择gcc

最后发现出现了bulid文件夹,控制台也显示编译完成,在我们的文件夹的位置就出现了编译好的可执行文件

{使用方法}

将上面的两个exe放入我们的pyc文件夹中,在终端打开

输入命令 ./pycdc rc4.pyc

(三)应用在题目中,随意修改编译我们的脚本源码

像上面这个图片中,我们并没有生成完整的反编译源码,原因是编写题目的python版本太高,pycdc在识别的时候出现了问题于是就没有继续进行编译,导致大量的信息丢失(当然我觉得pycdc的作者也会在后续进行高版本更新,无论是在线还是本地反编译都会没有问题)

那如果确实出现了这样的错误,我们有两种解决办法

(1)使用pycdas,生成汇编代码,进行阅读

(2)查看报错,让进入源码进行适当修改,编译出新的pycdc生成不报错的反编译。

这里只讲讲第二种方法。

使用wls的话,我们打开vscode

选择右边的远程资源管理器,打开我们的pycdc文件

进入这个ASTree.cpp的文件,copy刚才反汇编的报错

Unsupported opcode: JUMP_BACKWARD在vscode中进行检索

找到了这里

fprintf(stderr, "Unsupported opcode: %s\n", Pyc::OpcodeName(opcode & 0xFF));

cleanBuild = false;

//return new ASTNodeList(defblock->nodes());

这里的return语句就是我们没找到反编译的字节之后,我就不再继续反编译return,我们注释掉这条语句,重新按照(二)中的过程进行编译,这样子我们的pycdc就是不会再return的工具了

# Source Generated with Decompyle++

# File: rc4.pyc (Python 3.11)

import time

a = input()

def swap_uchar(x, y):

return (y, x)

def rc4_ksa(key):

sbox = list(range(256))

j = 0

for i in range(256):

j = (j + sbox[i] + key[i % len(key)]) % 256

(sbox[i], sbox[j]) = swap_uchar(sbox[i], sbox[j])

return sbox

def rc4_prga(sbox, data_length):

i = 0

j = 0

key_stream = bytearray()

for k in range(data_length):

i = (i + 1) % 256

j = (j + sbox[i]) % 256

(sbox[i], sbox[j]) = swap_uchar(sbox[i], sbox[j])

t = (sbox[i] + sbox[j]) % 256

key_stream.append(sbox[t])

return key_stream

def rc4_crypt(data, key_stream):

result = bytearray()

for i in range(len(data)):

result.append(data[i] ^ key_stream[i])

return result

def tea(v, k):

delta = 0x9E3779B9

mask = 0xFFFFFFFF

rounds = 32

v1 = v[1]

v0 = v[0]

sum = delta * rounds & mask

for i in range(rounds):

v1 -= (v0 << 4) + k[2] ^ v0 + sum ^ (v0 >> 5) + k[3]

v1 &= mask

v0 -= (v1 << 4) + k[0] ^ v1 + sum ^ (v1 >> 5) + k[1]

v0 &= mask

sum -= delta

sum &= mask

return [

v0,

v1]

def main():

key = 'abcdefghijklmnopqrstuvwxyz'

key3 = [

19088743,

0x89ABCDEF,

0xFEDCBA98,

1985229328]

data = bytearray(str(a), 'utf-8')

sbox = rc4_ksa(bytearray(key, 'utf-8'))

key_stream = rc4_prga(sbox[:], len(data))

encrypted_data = rc4_crypt(data, key_stream)

b = (lambda .0: for x in .0:

format(x, '02X')None)(encrypted_data())

key_list = [

47,

138,

127,

57,

117,

188,

51,

143,

17,

22]

encrypted_values = range(0, len(b), 16)()

original_data = []

for i, encrypted_value in enumerate(encrypted_values):

encrypted_value = encrypted_value.ljust(16, '0')

key2 = (key_list[i] >> 4) + ((key_list[i] & 15) << 4)

original_data.append([

int(encrypted_value[:8], 16) ^ key2,

int(encrypted_value[8:], 16) ^ key2])

decrypted_values = original_data()

check = (lambda .0: for value in .0:

[ hex(value[0])[2:] + ' ' + hex(value[1])[2:] + ' ' ])(decrypted_values()).upper().strip()

if check == '2E895417 9EDAC23D E4A8A87A B63C2690 E6423D70 F7E9C8AD':

print('yea!')

time.sleep(10)

quit()

return None

''.join('nooooooooooooooooooooooooooooooooooooo')

time.sleep(10)

quit()

return None

if __name__ == '__main__':

main()

return None

题解就写在别的文章中了,题目附件放到这里了

RC4.zip

【总结】

通过这次的学习,深入了解了python的反编译过程,学习到了wsl这个方便的功能,也简单学习了linux上的一些操作。

参考文章:

Python 反编译:pycdc工具的使用-CSDN博客

[Linux] 使用 Decompile++ (pycdc) 反組譯 pyc 檔案 | EPH 的程式日記

[安利] WSL Linux 子系统,真香!完整实操 - 知乎



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。