Python学习教程:如何用python统计代码行数
改良后的代码可以对python和C系列的代码实行行数计算,包括代码、空行和注释行,用re抓取注释,传入一个目录自动对其下的文件进行读取计算。
流程
首先判断传入参数是否为文件夹,不是则打印出提示,否则继续(无返回),获得目录后,yongos.listdir对路径下文件进行遍历,其中也包含文件夹,再次判断是否为文件夹,是的话则递归调用此函数,否则开始执行行数统计,这里用os.path.join将路径与文件名进行拼接,方便之后直接传给函数,逻辑很简单,无非是执行文件判断,判断是哪类文件,在调用对应的注释监测正则代码段进行抓取,抓取到则行数+1,空白行也是一样的原理,用strip(去除前后空格),然后行内内容为空则为空行,代码段即为总行数减去其他两类行数,最后在外层将所有文件对应的代码段累加即为total。
关键
函数内部是可以访问全局变量的,问题在于函数内部修改了变量,导致python认为它是一个局部变量。
所以,如果在函数内部访问并修改全局变量,应该使用关键字 global 来修饰变量。
- import os
- import re
- #定义规则抓取文件中的python注释
- re_obj_py = re.compile('[(#)]')
- #定义规则抓取文件中的C语言注释
- re_obj_c = re.compile('[(//)(/*)(*)(*/)]')
- #判断是否为python文件
- def is_py_file(filename):
- if os.path.splitext(filename)[1] == '.py':
- return True
- else:
- return False
- #判断是否为c文件
- def is_c_file(filename):
- if os.path.splitext(filename)[1] in ['.c', '.cc', '.h']:
- return True
- else:
- return False
- #定义几个全局变量用于计算所有文件总和(全部行数、代码行数、空行数、注释行数)
- all_lines, code_lines, space_lines, comments_lines = 0, 0, 0, 0
- #判断是否为文件夹,不是则输出提示
- def count_codelines(dirpath):
- if not os.path.isdir(dirpath):
- print('input dir: %s is not legal!' % dirpath)
- return
- # 定义几个全局变量用于计算每个文件行数(全部行数、代码行数、空行数、注释行数)
- global all_lines, code_lines, space_lines, comments_lines
- #列出当前文件夹下的文件(包含目录)
- all_files = os.listdir(dirpath)
- for file in all_files:
- #将文件(目录)名与路径拼接
- file_name = os.path.join(dirpath, file)
- if os.path.isdir(file_name):
- count_codelines(file_name)
- else:
- temp_all_lines, temp_code_lines, temp_space_lines, temp_comments_lines = 0, 0, 0, 0
- f = open(file_name)
- for line in f:
- temp_all_lines += 1
- if line.strip() == '':
- temp_space_lines += 1
- continue
- if is_py_file(file_name) and re_obj_py.match(line.strip()):
- temp_comments_lines += 1
- if is_c_file(file_name) and re_obj_c.match(line.strip()):
- temp_comments_lines += 1
- temp_code_lines = temp_all_lines - temp_space_lines - temp_comments_lines
- print('%-15s : all_lines(%s)\t code_lines(%s)\t space_lines(%s)\t comments_lines(%s)'
- % (file, temp_all_lines, temp_code_lines, temp_space_lines, temp_comments_lines))
- all_lines += temp_all_lines
- code_lines += temp_code_lines
- space_lines += temp_space_lines
- comments_lines += temp_comments_lines
- if __name__ == '__main__':
- count_codelines('test')
- print('\n**** TOTAL COUNT ****\nall_lines = %s\ncode_lines = %s\nspace_lines = %s\ncomments_lines = %s' % (all_lines, code_lines, space_lines, comments_lines))
本期的Python学习教程先跟大家分享这么多!