python之爬虫

一、从网页爬下字符串清除特殊字符

import re

def validateTitle(title):
rstr = r"[\/\\\:\*\?\"\<\>\|\t]"
new_title = re.sub(rstr, "", title)
return new_title

说明:如上函数用以过滤/\:*?'<>| 以及table、空格(文件夹、文件名中也尽量不要使用空格)

  

上一篇:[模拟] hdu 4452 Running Rabbits


下一篇:win10/win7 笔记本 开启虚拟无线 批处理