分类: 默认

Python扫描目录&拷贝文件

刚学python没多久,需要在实际应用中体验一把python的便捷。最近做项目是在原项目基础上修改的,所以给客户上线时候只需要把改过的class文件、jsp文件和配置文件更新进去。因为昨天已经从版本控制中一个文件一个文件对比出来找出了修改过的java文件,对应找出了需要更新的class。但是今天又在这几个文件中有所修改,不想再对照版本控制找出修改的文件,所以写了以下代码帮我完成这个功能。

SOURCE_PATH1 是昨天已经挑好的文件目录。(其实该目录只是提供了要从SOURCE_PATH2中复制的文[……]

阅读全文»

浅析PHP命令注入攻击

Command Injection,即命令注入攻击,是指由于Web应用程序对用户提交的数据过滤不严格,导致黑客可以通过构造特殊命令字符串的方式,将数据提交至Web应用程序中,并利用该方式执行外部程序或系统命令实施攻击,非法获取数据或者网络资源等。

命令注入攻击最初被称为Shell命令注入攻击,是由挪威一名程序员在1997年意外发现的,他通过构造命令字符串的方式从一个网站删除网页,就像从硬盘中删除一个文件一样简单。

下面我们结合PHP语言的特性,对PHP命令注入攻击进行简要的分析和描[……]

阅读全文»

说说PHP的autoLoad

php的autoload大致可以使用两种方法:__autoload和spl方法。这两种方法又各有不同的几种使用方法。

__autoload的使用方法1:

最经常使用的就是这种方法,根据类名,找出类文件,然后require_one
function __autoload($class_name) {
$path = str_replace(‘_’, ‘/’, $class_name);
require_once $path . ‘.php’;
}

// 这里会自动加载Http/Fi[……]

阅读全文»

bin2hex函数

bin2hex — 将二进制数据(ASCII 字符)转换成十六进制表示

bin2hex函数

说明

string bin2hex ( string str )

返回 ASCII 字符串,为参数 str 的十六进制表示。转换使用字节方式,高四位字节优先。

例子 在本例中,我们将把一个字符串值从二进制转换为十六进制,再转换回去:
<?php
$str = “Hello world!”;
echo bin2hex($str);
echo pack(“H*”,bin2[……]

阅读全文»

理清 python 编码相关问题

1.源代码级别

REF: PEP 0263 — Defining Python Source Code Encodings

Python will default to ASCII as standard encoding if no other

encoding hints are given.

To define a source code encoding, a magic comment must

be pl[……]

阅读全文»

Python图片浏览器

上次我爬了n多图片,但是浏览的时候有一个问题。

图片浏览器的浏览一般都是按名称排的,而我对图片的命名是按照数字递增的。比如3总是会排在10后面,也就无法快速地浏览图片了。

所以,出于方便自己查阅图片,也出于学习,决定做一个自己的图片浏览器。

目标:浏览目录,通过滚轮不断显示同一个文件夹下的图片,并自定义排序。

步骤0:要实现图形界面,我使用wxPython。

至于如何安装和简单地使用wxpython,可以到网上检索,一大堆资料。

以下步骤默认你已经知道如何生成一个自己的[……]

阅读全文»

Python批量下载图片

爬取图片可真的是一个可遇不可求的机会。

有需求就会动力。

目标:爬取某个网站上n多页的链接,每个链接有n多张图片,每一页对应一个文件夹,每个文件夹包含n个链接所对应的文件夹。

步骤1:获得网页的所有链接,访问所有链接,获得链接里的图片地址。

这一步通过上一篇文章的学习,同时写好正则匹配,就可以简单地完成。

步骤2:根据图片地址下载图片。

下载jpg格式的图片其实很容易。
socket = urllib2.urlopen(url)
data = socket.read[……]

阅读全文»

Python多篇新闻自动采集

昨天用python写了一个天气预报采集,今天趁着兴头写个新闻采集的。

目标是,将腾讯新闻主页上所有新闻爬取下来,获得每一篇新闻的名称、时间、来源以及正文。

接下来分解目标,一步一步地做。

步骤1:将主页上所有链接爬取出来,写到文件里。

根据上一篇文章的方法,可以简单地获取到整个主页的文本内容。

我们都知道html链接的标签是“a”,链接的属性是“href”,也就是要获得html中所有tag=a,attrs=href 值。

查阅了资料,一开始我打算用HTMLParser,[……]

阅读全文»

Python的一些用法

前不久学了点python,昨天刚好要处理一个文件,于是拿来试试。

1)正则表达式的使用。

#正则表达式的模块
import re

#正则表达式
rePattern = ‘.*[0-9]{4}’

pattern = re.compile(rePattern)

#匹配
if pattern.match(line):
return True
else:
return False
2)在函数中使用全局变量。

def func([……]

阅读全文»

鄂ICP备13000209号-1

鄂公网安备 42050602000277号