몇일 전 Python Star Yao와 The Strongest King 교환 그룹에서 여러 사람들이 JS 리버스 엔지니어링 비디오 및 관련 코드에 대해 문의했습니다. 그들은 모두 고급 지식을 배우고 있는 것 같습니다. 더 이상 스크롤하지 마세요. 마침 요즘 JS 학습자료를 보다가 꽤 좋은 사례를 보게 되어 이곳에서도 공유하고 기록해 놓겠습니다.
JS 코드를 찾는 것은 글을 작성하고 설명하는 것이 꽤 어렵습니다. 여기에는 이미 만들어진 JS 코드가 직접 정리되어 있습니다. 처음에는 이 JS 암호화 코드를 찾는 것이 매우 어렵습니다. 끊임없이 포인트를 깨고 암호화 규칙을 찾고 양파를 층별로 껍질을 벗겨야 알아낼 수 있습니다. 이 글에서 사용된 JS 암호화 코드는 작은 영상 사이트에서 가져온 것입니다. 웹페이지에 제시된 암호화 기능은 아래와 같습니다.
암호화 방법은 그리 어렵지 않으며, decodeMp4.decode의 핵심 코드입니다. () 암호화 기능은 다음과 같습니다.
define("tool", function(a, b, c) { var d = a("jquery") , e = a("support") , f = a("constants") , g = a("base64") , h = "substring" , i = "split" , j = "replace" , k = "substr"; b.decodeMp4 = { getHex: function(a) { return { str: a[h](4), hex: a[h](0, 4)[i]("").reverse().join("") } }, getDec: function(a) { var b = parseInt(a, 16).toString();# 对应Python中的str(int(a, 16)) return { pre: b[h](0, 2)[i](""), tail: b[h](2)[i]("") } }, substr: function(a, b) { var c = a[h](0, b[0]) , d = a[k](b[0], b[1]); return c + a[h](b[0])[j](d, "") }, getPos: function(a, b) { return b[0] = a.length - b[0] - b[1], b }, decode: function(a) { var b = this.getHex(a) , c = this.getDec(b.hex) , d = this[k](b.str, c.pre); return g.atob(this[k](d, this.getPos(d, c.tail))) } };
decodeMp4의 decode() 함수가 호출되고, decode() 함수가 getHex(a), getDec(b.hex), g.atob(), getPos(d, c.tail)을 호출하는 것을 볼 수 있습니다. 그리고 우리가 해야 할 일은 이러한 함수를 Python 쓰기로 변환한 다음 해당 암호화 방법을 구성하고 암호화된 결과를 얻고 역효과를 완성하는 것입니다.
여기서 변수 a는 중단점을 통과하는 긴 문자열입니다. 여기서는 다음 변수를 예로 사용합니다.
a = "c0b1Ly9tdnPflQ3cQpPZpZGVvMTAubWVpdHVkYXRhLmNvbS82MWM0NDNlOGI1MmFmMTYzMi5tcDkBOyQ"
나중에 모두가 확인하기 쉽도록 나중에 사용할 기능을 미리 간략하게 정리해 보겠습니다.
각 함수를 차례로 분석해 보면 다음과 같습니다.
var h = "substring",i = "split"; getHex: function(a) { return { str: a[h](4), hex: a[h](0, 4)[i]("").reverse().join("") } },
위는 getHex() 함수에 해당하는 JS 코드입니다. , 사전의 키는 각각 str 및 hex입니다. 여기서 str의 해당 값은 a[h](4)이고, h의 정의는 하위 문자열입니다. 이 함수의 의미는 문자열이 지정된 첨자부터 시작하여 까지라는 것입니다. 여기서의 번역은 a.substring(4)입니다. 즉, 문자열 a는 아래 첨자 4에서 시작하여 a[h](0, 4)[i]("").reverse로 끝납니다. ().join("" ) 이는 이해하기가 좀 더 복잡합니다. 먼저 문자열의 값은 0에서 4까지입니다. 그런 다음 공백을 사용하는 함수 i가 호출됩니다. ("")를 분할로 사용합니다. 그런 다음 Join("")을 호출하여 문자열을 연결하면 분해 후 훨씬 간단해집니다. 다음 단계는 Python 코드를 구성하는 것입니다. 비교를 작성한 후에는 다음과 같습니다.
def getHex(a): return { "str": a[4:],# JS中的substring(4)指的是从4开始取值到字符串末尾 "hex": "".join(list(a[0:4])[::-1])# [::-1]代表的是反向取值 }
위의 JS 코드와 정확히 동일합니까?
JS 코드는 다음과 같습니다.
getDec: function(a) { var b = parseInt(a, 16).toString(); return { pre: b[h](0, 2)[i](""), tail: b[h](2)[i]("") } },
해당 관계에 따라 해당 Python 코드는 다음과 같이 작성할 수 있습니다.
def getDec(a): b = str(int(a, 16)) print(b) return { "pre": list(b[:2]), "tail": list(b[2:]) }
JS 코드는 다음과 같습니다.
substr: function(a, b) { var c = a[h](0, b[0]) , d = a[k](b[0], b[1]); return c + a[h](b[0])[j](d, "") },
해당 관계에 따라 해당 Python 코드는 다음과 같이 작성할 수 있습니다.
def substr(a, b): c = a[0: int(b[0])] print(c) d = a[int(b[0]):int(b[0])+int(b[1])] print(d) return c + a[int(b[0]):].replace(d, '')
JS 코드는 다음과 같습니다. :
getPos: function(a, b) { return b[0] = a.length - b[0] - b[1], b },
해당 관계에 따라 해당 Python 코드는 다음과 같이 작성할 수 있습니다. 해당 Python 코드는 다음과 같습니다.
def getPos(a, b): b[0] = len(a) - int(b[0]) - int(b[1]) print(b[0]) return b
JS 코드는 다음과 같습니다.
decode: function(a) { var b = this.getHex(a) , c = this.getDec(b.hex) , d = this[k](b.str, c.pre); return g.atob(this[k](d, this.getPos(d, c.tail))) }
해당 관계에 따라 해당 Python 코드는 다음과 같이 작성할 수 있습니다.
b = getHex(a) # print(b) c = getDec(b['hex']) print(c) # d = k(str(b), c.pre) d = substr(b['str'], c['pre']) # print(d) return base64.b64decode(substr(d, getPos(d, c['tail'])))
웹 크롤러를 통해 직접 요청하면 아무리 최종 암호화된 주소를 얻을 수 없습니다. 위에서 언급한 문자열 변수인 data-src만 얻을 수 있습니다. a. 위의 분석을 거쳐야 코드를 실행하면 동일한 요청 주소를 얻을 수 있습니다. 웹페이지에서 아래 그림과 같이 역방향 성공!
브라우저에 이 주소를 입력하시면 재생이 가능하며, 다운로드 요청을 하시면 영상을 다운로드 받으실 수 있습니다.
안녕하세요 여러분, 저는 Python 고급 사용자입니다. 이 글은 주로 Python 웹 크롤러의 JS 역 문제를 기반으로 사례를 설명합니다. JS로 웹페이지를 로딩하는 경우, 웹 크롤러를 통해 직접 요청하면 최종 암호화된 주소를 얻을 수 없게 됩니다. 이러한 역문제를 해결하기 위해 간단한 역방향 예제 구현 프로세스를 만들었습니다.
위 내용은 JS 리버스 코드를 Python 코드로 변환하는 방법에 대한 튜토리얼을 살펴보세요.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!