工作中经常需要提取apk文件的特定url地址,如是想到用python脚本进行自动处理。需要用到的python基础知识如下:os.walk()函数声明:os.walk(top,topdown=true,onerror=none)(1)参数top表示需要遍历的顶级目录的路径。(2)参数topdown的默认值是“true”表示首先返回顶级目录下的文件,然后再遍历子目录中的文件。当topdown的值为”false”时,表示先遍历子目录中的文件,然后再返回顶级目录下的文件。(3)参数onerror默认值为”none”,表示忽略文件遍历时的错误。如果不为空,则提供一个自定义函数提示错误信息后继续遍历或抛出异常中止遍历。返回值:函数返回一个元组,含有三个元素。这三个元素分别是:每次遍历的路径名、路径下子目录列表、目录下文件列表。os.walk使用实例:删除某个文件夹(当然可以通过os.listdir的递归调用删除)
代码如下:
#! /usr/bin/env python#coding=utf-8import os
def remove_dir(top_dir): if os.path.exists(top_dir)==false: print “not exists” return if os.path.isdir(top_dir)==false: print “not a dir” return for dir_path,subpaths,files in os.walk(top_dir,false): for file in files: file_path=os.path.join(dir_path,file) print “delete file:%s” %file_path os.remove(file_path) print “delete dir:%s” %dir_path os.rmdir(dir_path)
#调用remove_dir(r”c:\users\administrator\desktop\abc”)
python执行系统命令的方法 os.system(),os.popen(),commands.getstatusoutput() os.system()无法获得到输出和返回值;通过os.popen() 返回的是 file read 的对象,对其进行读取 read() 的操作可以看到执行的输出,但是得不到返回值。通过 commands.getstatusoutput() 方法就可以获得到返回值和输出 (status, output) = commands.getstatusoutput(‘cat /proc/cpuinfo’) 3. python中operator模块的contains(…) 函数contains(a, b) — same as b in a (note reversed operands). 判断b是否被a包含 基础知识介绍完了,可以上代码了:
代码如下:
import osimport operatorimport commands#from signature import *
inputdir = “./tmp”
for path, dir, files in os.walk(inputdir): for file in files: if not file.endswith(‘.apk’): #print “not apk file.” continue apkpath = os.path.join(inputdir, file) cmd = ‘./xxx -d %s’ %apkpath output = os.popen(cmd) s = set() #按行查找url for line in output: if operator.contains(line, “http://”): #print tmp start = line.index(”’http://”’) end = line.index(”'””’,start) url = line[start:end] s.add(url) cmd = ‘./yyy -t a.expense.mdk.a.tvd %s’ %apkpath #获取命令执行结果及返回值 status, output = commands.getstatusoutput(cmd)# print output if output.startswith(‘find’): print output for url in s: if url.find(‘imei’)!=-1: print ‘url is %s’ %url.strip() #print ‘=========================’ s = ”