【Python】DAY01学习日记,一个像我一样毫无意义的小爬虫
昨天才开始正经地接触Python,以前都是白嫖别人写好的程序。好吧,其实现在也依然没有正经地系统性学习,学会什么算什么吧。关于这个像我一样毫无意义的小爬虫:爬取BiliBili首页的标题和描述,保存.txt文档到本地爬取img标签里的图片url保存到本地,下载url对应的图片到本地(要写爬虫就要分析......
昨天才开始正经地接触Python,以前都是白嫖别人写好的程序。好吧,其实现在也依然没有正经地系统性学习,学会什么算什么吧。关于这个像我一样毫无意义的小爬虫:爬取BiliBili首页的标题和描述,保存.txt文档到本地爬取img标签里的图片url保存到本地,下载url对应的图片到本地(要写爬虫就要分析......
编程语言2022-09-11
python正则表达式,要先导入re的包re模块使python语言拥有了全部的正则表达式的功能compile函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象,该对象拥有一系列方法re.match尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none......
编程语言2022-09-11
正则表达式实例:#!/usr/bin/pythonimportreline="Catsaresmarterthandogs"matchObj=re.match(r'(.*)are(.*?).*',line,re.M|re.I)ifmatchObj:print"matchObj.group():",m......
编程语言2022-09-11
importre#匹配以字符串开头pa=re.compile(r"^1\d+.\d+.\d+|^1\d+")url=re.match(pa,"1rrrrwww.baidu.coms11254122")ifurl:print(url.group())#print(re.match('www','www......
编程语言2022-09-11
函数说明re.search()在一个字符串中搜索匹配正则表达式的第一个位置,返回match对象re.match()从一个字符串的开始位置起匹配正则表达式,返回match对象re.findall()搜索字符串,以列表类型返回全部能匹配的子串re.split()将一个字符串按照正则表达式匹配结果进行分割......
编程语言2022-09-11
1 操作系统接口os 模块提供了一系列与系统交互的模块:>>>os.getcwd()#Returnthecurrentworkingdirectory‘/home/minix/Documents/Note/Programming/python/lib1‘>>>os......
编程语言2022-09-10
摘要:你有没有这样的应用场景:调试一个程序,出现debug的提示信息,现在你需要定位是哪个文件包含了这个debug信息,也就是说,你需要在一个目录下的多个文件(可能包含子目录)中查找某个字符串的位置;另外,有时候,一个程序崩溃,我们需要通过进程控制将其杀死,如何快速找到进程号并杀死进程。本文所讲的g......
编程语言2022-09-09
Sed命令:sed是一种流编辑器,它是文本处理中非常中的工具,能够完美的配合正则表达式使用,功能不同凡响。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(patternspace),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到......
编程语言2022-09-07
echo"mvu3_yunying.war u3_yunying.war_`date+%Y%m%d%H%M`"|sed"s/\(mv\)\(\w*.war\) \(\w*.war_\w*\)/\1/g"echo"mvu3_yunying.war u3_yunying.war_`date+%Y%......
编程语言2022-09-06
先把以前自己写过的几篇老文章贴上来,Squid缓存视频是个很能节约企业、机构出口流量的方案。不过由于视频网站的技术更新很快,这篇写于2011年的文章如今是否还能不加修改的应用。我相信懂了原理之后稍加修改即可。==============================================......
编程语言2022-09-06
C++GUIQt4学习笔记05 qtc++正则表达式QIntValidator -- 只让用户输入整数QDoubleValidator -- 只让用户输入浮点数QRegExpValidator -- 只让用户按照正则表达式定义好的样式进行输入 本章讲解如何使用Qt开发自定义窗口部......
编程语言2022-09-06
文本搜索工具:grep,egrep,fgrepGREP介绍grep: 根据模式条件搜索文本,并将符合模式的文本行显示出来。 过滤条件:文本字符和正则表达式的元字符组合而成匹配条件以正则表达式的元字符,以及正常字符组合而成。即pattern(模式)grep命令语法:grep[options]PATTE......
编程语言2022-09-06
1、查看所有进程信息,但是只想获取COMMAND列的值SDCxM-SDCAM-root-root>psauxUSER PID%CPU%MEM VSZ RSSTTY STATSTART TIMECOMMANDroot 1 0.0 0.0 ......
编程语言2022-09-05
ubuntu14.04更新gcc/g++4.9.2最近看到c++11非常的好用,尤其是自带了regex,于是稍微学了一下c++11的新特性。可是我在编译一个regex程序是却发现稍微复杂一点的正则表达式就无法运行。查了一下发现是g++4.8还没有实现这些功能。囧。于是决定更新一下gcc/g++的版本......
编程语言2022-09-05
摘要:你会学到一种原创的同时循环两个列表的方法。类似于Python或者Haskell的zip函数,非常简洁直观,效果如下:$paste<(seq)<(seq)|whilereadhostip;doecho"vm$host:172.16.116.$ip";donevm1:172.16.11......
编程语言2022-09-04
在文件中搜索模式grep[options] pattern [file-list]参数pattern为正则表达式,file-list为grep要搜索的普通文本文件的路径名列表选项-c 只显示每个文件中包含匹配模式的行数-v 显示......
编程语言2022-09-03
到目前为止都在讨论如何链接两个元素的绑定。但在数据驱动的应用程序中,更常见的情况是创建从不可见的对象中提取数据绑定表达式。唯一的要求是希望显示的信息必须存储在公有的属性中。WPF数据绑定基础结构不能获取私有信息或共有字段。当绑定到非元素对象时,需要放弃Binding.ElementName属性,并使......
编程语言2022-09-03
爬虫(二)urllib库数据挖掘1、第一个爬虫1fromurllibimportrequest23url=r‘http://www.baidu.com‘45#发送请求,获取6response=request.urlopen(url).read()78#1、打印获取信息9print(response)......
编程语言2022-09-02
正则表达式在字符串处理上有着强大的功能,sun在jdk1.4加入了对它的支持下面简单的说下它的4种常用功能:查询:Stringstr="abcefgABC"; StringregEx="a|f";//表示a或fPatternp=Pattern.compile(regEx);Matcherm=p.ma......
编程语言2022-09-02
当日志文件存储日志很大时,我们就不能用vi直接进去查看日志,需要Linux的命令去完成我们的查看任务.Log位置:/var/log/message系统启动后的信息和错误日志,是RedHatLinux中最常用的日志之一/var/log/secure与安全相关的日志信息/var/log/maillog与......
编程语言2022-08-31