分类: 默认

Python天气预报采集器(网页爬虫)

python是一门很强大的语言,在实现爬虫方面也十分方便。

这个天气预报采集是从中国天气网提取广东省内主要城市的天气并回显。本来是打算采集腾讯天气的,但是貌似它的数据是用js写上去还是什么的,得到的html文本中不包含数据,所以就算了。

爬虫简单说来包括两个步骤:获得网页文本、过滤得到数据。

1、获得html文本。

python在获取html方面十分方便,寥寥数行代码就可以实现我们需要的功能。

def getHtml(url):
pag[……]

阅读全文»

PHP取二进制文件头快速判断文件类型

一般我们都是按照文件扩展名来判断文件类型,但是这个很不靠谱,轻易就通过修改扩展名来躲避了,一般必须要读取文件信息来识别。
<?php

$files = array(‘./test.jpg’, ‘test.png’);
$fileTypes = array(
7790 => ‘exe’,
7784 => ‘midi’,
8075 => ‘zip’,
8297 => ‘rar’,
225216[……]

阅读全文»

如何优化MySQL insert性能

对于一些数据量较大的系统,面临的问题除了是查询效率低下,还有一个很重要的问题就是插入时间长。我们就有一个业务系统,每天的数据导入需要4-5个钟。这种费时的操作其实是很有风险的,假设程序出了问题,想重跑操作那是一件痛苦的事情。因此,提高大数据量系统的MySQL insert效率是很有必要的。

经过对MySQL的测试,发现一些可以提高insert效率的方法,供大家参考参考。

1. 一条SQL语句插入多条数据。

常用的插入语句如:

INSERT [……]

阅读全文»

地方网站如何留住用户?

地方网站领域有多个现象值得关注:地方网站的主要形态是地方社区;地方网站主要关注本地化消费;地方网站对百度的流量依附性不算强。我们可以看到地方网站领域许许多多辉煌的案例,例如19楼、厦门小鱼、化龙巷等。我们分析这些网站正在采用和曾经采用的一些运营手段,可以解答许多初期地方网站运营者的疑惑:地方网站如何留住用户?

留住用户这个问题很到位,囊括了诸多菜鸟问题,如:怎么做内容?怎么推广?怎么找版主?怎么定规则?怎么盈利?——该问题已经接近运营的本质,社区就是留住人的。地方网站之所以以地方社区形式存在,[……]

阅读全文»

mysqldump导入导出数据库总结

基本的使用方法总结:

1 导出所有库

 系统命令行
 mysqldump -uusername -ppassword –all-databases > all.sql
 
 2 导入所有库
 mysql命令行
 mysql>source all.sql;
 
 3 导出某些库
 系统命令行
 mysqldump -uusername -ppassword -[……]

阅读全文»

[MySQL FAQ]系列 — 新手必看:一步到位之InnoDB

前言:MySQL发展到今天,InnoDB引擎已经作为绝对的主力,除了像大数据量分析等比较特殊领域需求外,它适用于众多场景。然而,仍有不少开发者还在“执迷不悟”的使用MyISAM引擎,觉得对InnoDB无法把握好,还是MyISAM简单省事,还能支持快速COUNT(*)。本文是由于最近几天帮忙处理discuz论坛有感而发,希望能对广大开发者有帮助。

1. 快速认识InnoDB
InnoDB是MySQL下使用最广泛的引擎,它是基于MySQL的高可扩展性和高性能存储引擎,从5.5版本开始,它已经成为了默认[……]

阅读全文»

MySQL优化 之 Discuz论坛优化

一. 前言
近日由于需要,对discuz论坛(简称dz)进行优化,当然了,只是涉及到数据库的优化.
先说一下服务器及dz的数据量,2 * Intel(R) Xeon(TM) CPU 2.40GHz, 4GB mem, SCISC硬盘.
MySQL 版本为 4.0.23. 数据表情况:
cdb_attachments 2万
cdb_members 10万
cdb_posts 68万
cdb_threads 7万
二. 缓存优化
在 my.cnf 中添加/修改以下选项:

 #[……]

阅读全文»

百万记录级MySQL数据库及Discuz!论坛优化[转]

最近,帮一个朋友优化一个拥有20万主题,100万帖子,3万多会员,平均在线人数2000人的Discuz!论坛,采用Linux2.6+Apache2+mod_php5+MySQL5,服务器配置为双至强+4G内存,优化前,系统平均负载(load average)基本维持在10以上,MySQL的CPU占用率基本在90%以上,优化后,系统平均负载降到0.5以下,MySQL的CPU占用率很少有超过10%的时候。优化前YSlow得分只有35分,优化后YSlow得分86分。
    现将优化的过程[……]

阅读全文»

MySQL Explain 举例详解

一.语法
explain < table_name >
例如: explain select * from t3 where id=3952602;
二.explain输出解释
+—-+————-+——-+——-+——————-+———+———+——-+——+——-+
| id | select_type | table | type  | possible_keys     | key     | key_len | ref &nb[……]

阅读全文»

MySQL优化 之 Discuz论坛MySQL通用优化

今日帮朋友优化号称日均500PV,100UV的论坛,后台DB采用R710(16G Ram,PERC 6/i 256MB BBU,4块 15K RPM SAS盘做raid 1+0,ext3文件系统,E5620 * 2),这个配置看似也不错了,不过压力仍然较大,大量的请求处于:sending data和statistics状态。
   经过分析,确认瓶颈主要在:
1. IO读,IO写倒还好,不算高;因为数据表都是MyISAM,需要产生较高的物理读,不能通过内存有效缓冲;
2. 使用的[……]

阅读全文»

鄂ICP备13000209号-1

鄂公网安备 42050602000277号