이 글에서는 파일 수, 코드 줄 수, 주석 줄 수, 빈 줄 수 등 Python을 사용하여 코드 통계 도구를 설계하는 것과 관련된 정보를 주로 소개합니다. 관심 있는 친구들은 Script House 편집자를 팔로우하여 살펴보세요
Question
파일 수, 코드 줄 수를 포함하여 프로젝트의 코드 줄 수를 계산하는 프로그램을 설계하세요. , 주석 줄 수, 빈 줄 수. 다양한 매개변수를 입력하여 다양한 언어로 프로젝트 수를 계산하여 디자인을 더욱 유연하게 만들어 보세요. 예:
# type用于指定文件类型 python counter.py --type python
출력:
files:10
code_lines:200
comments:100
blanks:20
분석
이것은 매우 간단해 보이지만 해결하기가 약간 복잡한 디자인 문제입니다. 파일의 코드 줄 수를 올바르게 계산할 수 있는 한 문제를 더 작게 만들 수 있습니다. , 디렉토리 수를 세는 것은 문제가 되지 않습니다. 그 중에서 가장 복잡한 것은 여러 줄 주석에 관한 것입니다. Python을 예로 들면, 주석 코드 줄은 다음과 같은 상황을 갖습니다.
1. 파운드 기호
# 한 줄 주석
2. 같은 줄에 여러 줄 주석 상황
"""여러 줄 주석입니다"""
'''이것도 여러 줄 주석입니다 '''
3. 여러 줄 주석 문자
"""
이 3줄은 모두 주석 문자입니다
"""
우리의 아이디어는 여러 줄 주석을 식별하기 위해 in_multi_comment에 추가 식별자가 필요하다는 것입니다. 현재 줄이 여러 줄 주석에 있는지 여부. 여러 줄 주석이 시작되면 다음 여러 줄 주석 문자에 도달하면 True로 설정됩니다. 여러 줄 주석의 시작 기호와 다음 끝 기호 사이의 코드는 주석 라인에 속해야 합니다.
지식
파일을 올바르게 읽는 방법, 파일을 읽을 때 문자열을 처리하는 일반적인 방법
간소화된 버전
단계별로 반복하고 먼저 단순화를 구현합니다. 이 버전의 프로그램 Python 코드의 단일 파일만 계산하고 여러 줄 주석은 고려하지 않습니다. 이는 Python을 처음 접하는 사람이라면 누구나 달성할 수 있는 기능입니다. 중요한 점은 각 줄을 읽은 후 먼저 Strip() 메서드를 사용하여 문자열 양쪽의 공백과 캐리지 리턴을 제거한다는 것입니다. 코드는 여러 줄 주석의 통계를 해결해야 합니다. 실제 코드 통계학자가 되십시오.
# -*- coding: utf-8 -*- """ 只能统计单行注释的py文件 """ def parse(path): comments = 0 blanks = 0 codes = 0 with open(path, encoding='utf-8') as f: for line in f.readlines(): line = line.strip() if line == "": blanks += 1 elif line.startswith("#"): comments += 1 else: codes += 1 return {"comments": comments, "blanks": blanks, "codes": codes} if __name__ == '__main__': print(parse("xxx.py"))
여러 줄 주석이 포함된 py 파일을 계산할 수 있습니다# -*- coding: utf-8 -*-
"""
이 경우 여러 줄 주석 기호가 나타나면 이것이 핵심 작업입니다. in_multi_comment 식별자를 단순히 False 또는 True로 설정하는 대신 처음으로 """를 만나면 True이고 두 번째로 " ""를 만나면 여러 줄 주석의 끝 문자입니다. 부정은 False이고, 세 번째는 시작이고, 부정은 다시 True입니다.
그럼 다른 언어에서 구문 분석 기능을 다시 작성해야 하는지 확인하려면? 잘 관찰해보면 다줄 주석의 4가지 상황은 4가지 판단 조건을 추상화할 수 있는데, 대부분의 언어에는 한 줄 주석과 다줄 주석이 있지만 그 기호가 다르기 때문이다.
""" def parse(path): in_multi_comment = False # 多行注释符标识符号 comments = 0 blanks = 0 codes = 0 with open(path, encoding="utf-8") as f: for line in f.readlines(): line = line.strip() # 多行注释中的空行当做注释处理 if line == "" and not in_multi_comment: blanks += 1 # 注释有4种 # 1. # 井号开头的单行注释 # 2. 多行注释符在同一行的情况 # 3. 多行注释符之间的行 elif line.startswith("#") or \ (line.startswith('"""') and line.endswith('"""') and len(line)) > 3 or \ (line.startswith("'''") and line.endswith("'''") and len(line) > 3) or \ (in_multi_comment and not (line.startswith('"""') or line.startswith("'''"))): comments += 1 # 4. 多行注释符的开始行和结束行 elif line.startswith('"""') or line.startswith("'''"): in_multi_comment = not in_multi_comment comments += 1 else: codes += 1 return {"comments": comments, "blanks": blanks, "codes": codes} if __name__ == '__main__': print(parse("xxx.py"))
cond1에서 cond4에 해당하는 모든 언어의 한 줄 및 여러 줄 주석 기호를 표시하려면 하나의 구성 상수만 필요합니다. 남은 작업은 여러 파일을 구문 분석하는 것인데, 이는 os.walk 메서드를 사용하여 수행할 수 있습니다.
CONF = {"py": {"start_comment": ['"""', "'''"], "end_comment": ['"""', "'''"], "single": "#"}, "java": {"start_comment": ["/*"], "end_comment": ["*/"], "single": "//"}} start_comment = CONF.get(exstansion).get("start_comment") end_comment = CONF.get(exstansion).get("end_comment") cond2 = False cond3 = False cond4 = False for index, item in enumerate(start_comment): cond2 = line.startswith(item) and line.endswith(end_comment[index]) and len(line) > len(item) if cond2: break for item in end_comment: if line.startswith(item): cond3 = True break for item in start_comment+end_comment: if line.startswith(item): cond4 = True break if line == "" and not in_multi_comment: blanks += 1 # 注释有4种 # 1. # 井号开头的单行注释 # 2. 多行注释符在同一行的情况 # 3. 多行注释符之间的行 elif line.startswith(CONF.get(exstansion).get("single")) or cond2 or \ (in_multi_comment and not cond3): comments += 1 # 4. 多行注释符分布在多行时,开始行和结束行 elif cond4: in_multi_comment = not in_multi_comment comments += 1 else: codes += 1
물론 이 프로그램을 완성하려면 명령줄 구문 분석과 지정된 매개변수를 기반으로 특정 언어만 구문 분석하는 등 아직 해야 할 일이 많습니다.
보충:
코드 줄 계산 도구의 Python 구현우리는 종종 프로젝트의 코드 줄 수를 세고 싶지만, 더 완전한 계산 기능을 원한다면 그리 간단하지 않을 수도 있습니다. 오늘은 Python을 사용하여 코드라인 통계 도구를 구현하는 방법에 대해 살펴보겠습니다.
아이디어: 먼저 모든 파일을 가져온 다음 각 파일의 코드 줄 수를 계산하고 마지막으로 줄 수를 추가합니다.
구현된 기능:
줄 수 계산. 총 줄 수를 계산합니다. 통계 파일 형식 지정을 지원하고 계산하지 않으려는 파일 형식을 제외합니다.
빈 줄 제외
/root/script/smtp.php ---- 284 /root/script/countCodeLine.py---- 33 /root /script/test/gametest.php---- 16 [root@pythontab script]# 관련 권장 사항: Python 디자인 계산기 기능 구현의 전체 예제 공유 Python 디자인 패턴 프로그래밍의 방문자 및 관찰자 패턴 예제 소개
위 내용은 Python을 사용하여 코드 통계 도구 설계의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!def counter(path):
"""
可以统计目录或者某个文件
:param path:
:return:
"""
if os.path.isdir(path):
comments, blanks, codes = 0, 0, 0
list_dirs = os.walk(path)
for root, dirs, files in list_dirs:
for f in files:
file_path = os.path.join(root, f)
stats = parse(file_path)
comments += stats.get("comments")
blanks += stats.get("blanks")
codes += stats.get("codes")
return {"comments": comments, "blanks": blanks, "codes": codes}
else:
return parse(path)
결과:
[root@pythontab 스크립트]# python countCodeLine.py
총 줄: 382만 계산됩니다 php, python 파일이 있어서 매우 편리합니다.