delphi WebBrowser控件上网页验证码图片识别教程(一)

步骤一:获取网页中验证码图片的url地址
在delphi中加入一个BitBtn和一个memo以及WebBrowser控件实现网页中验证码图片的url地址的获取
程序如下:
procedure TForm1.BitBtn1Click(Sender: TObject);
var
  I:Integer;
begin
  for I:=0 to WebBrowser1.OleObject.document.images.length-1 do
    Memo1.Lines.Add(WebBrowser1.OleObject.document.images.item(i).href);
end;

步骤二:下载网页中验证码图片到image中 
在delphi中加入一个BitBtn和一个image以及WebBrowser控件,image用来显示下载的图片
代码:
procedure TForm1.BitBtn5Click(Sender: TObject);
var
  i:Integer;
  rang:IHTMLControlRange;
  s:string;
begin
try
  s := (IHTMLDocument2(WebBrowser.Document).images.item('img_validatecode',EmptyParam) as IHTMLElement).getAttribute('src',0);
  rang:=((IHTMLDocument2(WebBrowser.Document).body as HTMLBody).createControlRange)as IHTMLControlRange;
  rang.add(IHTMLDocument2(WebBrowser.Document).images.item('img_validatecode',EmptyParam)as IHTMLControlElement);
  rang.execCommand('Copy',False,0);
  Image1.Picture.Assign(clipboard);//若为加入Clipbrd单元,编译时会提示clipboard为定义
except
end;
end; 
注意:
1、在程序的uses中必须先加入ActiveX,Clipbrd单元,其中Clipbrd不加入会造成 clipboard未定义
2、img_validatecode 为网页验证码图片的id号,
3、上面代码为delphi WebBrowser中的通用代码,使用时只需修改id号和uses中 添加单元即可使用

步骤三:image图片的灰度处理 
 首先我们需要知道图片的灰度处理是将一些彩色的验证码图片变成灰色图片方便图片的后续处理,这里有三种方法对图片进行灰色处理。
 方法一:求出RGB这三个像素点的平均值,然后把平均值分给三个像素点;
 方法二:求每个像素点RGB三个分量的最大值,然后把最大值分给三个像素点;
 方法三:根据YUV的颜色空间,求出Y的值;
 方法一:
 代码: 
 procedure TForm1.BitBtn4Click(Sender: TObject);

var
  p: pbyteArray;  //位指针
  x,y: integer;//x宽,y高
  Bmp: TBitmap;//位图组件(TBitMap)
  Gray: integer;//灰度值
begin
  Bmp := TBitmap.Create;//建立一个TBitmap
  Bmp.Assign(Form1.Image1.Picture.Bitmap);//将image图片转为位图模式
  Bmp.PixelFormat := pf24bit; //设为24位之彩色位图,PixelFormat 为位图的内存格式和颜色深度,总共9个值
  for y := 0 to Bmp.Height-1 do
  begin
    p :=Bmp.ScanLine[y];//ScanLine方法用于获取像素颜色值
    for x:=0 to Bmp.Width-1 do
    begin
      Gray:=(p[3*x+2]+p[3*x+1]+p[3*x]) div 3;//3处像素点的平均值
      p[3*x+2]:=byte(Gray);
      p[3*x+1]:=byte(Gray);
      p[3*x]:=byte(Gray);
    end;
  end;
  image4.Picture.Bitmap := Bmp;
  Bmp.Free;//释放TBitmap
end;
原图:    delphi WebBrowser控件上网页验证码图片识别教程(一)
处理后:delphi WebBrowser控件上网页验证码图片识别教程(一)

方法二:
代码:

procedure TForm1.BitBtn4Click(Sender: TObject);
var
  p: pbyteArray;  //位指针
  x,y: integer;//x宽,y高
  Bmp: TBitmap;//位图组件(TBitMap)
  Gray: integer;//灰度值
begin
  Bmp := TBitmap.Create;//建立一个TBitmap
  Bmp.Assign(Form1.Image1.Picture.Bitmap);//将image图片转为位图模式
  Bmp.PixelFormat := pf24bit; //设为24位之彩色位图,PixelFormat 为位图的内存格式和颜色深度,总共9个值
  for y := 0 to Bmp.Height-1 do
  begin
    p :=Bmp.ScanLine[y];//ScanLine方法用于获取像素颜色值
    for x:=0 to Bmp.Width-1 do
    begin
      Gray:=Max(p[3*x+2],p[3*x+1]);  //使用max函数旭定义Math单元
      Gray:=Max(Gray,p[3*x]);
      p[3*x+2]:=byte(Gray);
      p[3*x+1]:=byte(Gray);
      p[3*x]:=byte(Gray);
    end;
  end;
  image4.Picture.Bitmap := Bmp;
  Bmp.Free;//释放TBitmap
end;
原图:    delphi WebBrowser控件上网页验证码图片识别教程(一)  
处理后:delphi WebBrowser控件上网页验证码图片识别教程(一) 
 

 方法三:运用公式Y=0.299R+0.857G+0.113B

procedure TForm1.BitBtn4Click(Sender: TObject);
var
  p: pbyteArray;  //位指针
  x,y: integer;//x宽,y高
  Bmp: TBitmap;//位图组件(TBitMap)
  Gray: integer;//灰度值
begin
  Bmp := TBitmap.Create;//建立一个TBitmap
  Bmp.Assign(Form1.Image1.Picture.Bitmap);//将image图片转为位图模式
  Bmp.PixelFormat := pf24bit; //设为24位之彩色位图,PixelFormat 为位图的内存格式和颜色深度,总共9个值
  for y := 0 to Bmp.Height-1 do
  begin
    p :=Bmp.ScanLine[y];//ScanLine方法用于获取像素颜色值
    for x:=0 to Bmp.Width-1 do
    begin
      Gray:=round(p[3*x+2]*0.3+p[3*x+1]*0.59+p[3*x]*0.11);//公式Y=0.299R+0.857G+0.113B
      p[3*x+2]:=byte(Gray);
      p[3*x+1]:=byte(Gray);
      p[3*x]:=byte(Gray);
    end;
  end;
  image4.Picture.Bitmap := Bmp;
  Bmp.Free;//释放TBitmap
end;
原图:   delphi WebBrowser控件上网页验证码图片识别教程(一)
处理后:delphi WebBrowser控件上网页验证码图片识别教程(一)

步骤四:image图片的二值化
 

在对图像二值化之前需要对图像进行灰度处理,二值化原理:通过设定阈值(threshold),把灰度图像变成仅用0或1来表示图像目标和背景,其中图像目标大多为数字,字母,设为1,;背景设为0。在位图中0对应0,1对应255,二值化方法很多,但是重点是在于对阈值的选择。

     阈值的选择主要分为两类:全局阈值和局部阈值。
     全局阈值是对整个图像采用一个阈值进行划分,例如固定阈值法二值化、判断分析化二值化等;
     局部阈值是将图像分为几块,每个子块采用不同的阈值;(具体局部阈值法可以自行百度,这里不必过多解释)
代码:
procedure TForm1.BitBtn4Click(Sender: TObject);
var
  p: pbyteArray;  //位指针
  x,y: integer;//x宽,y高
  Bmp: TBitmap;//位图组件(TBitMap)
  Gray: integer;//灰度值
begin
  Bmp := TBitmap.Create;//建立一个TBitmap
  Bmp.Assign(Form1.Image1.Picture.Bitmap);//将image图片转为位图模式
  Bmp.PixelFormat := pf24bit; //设为24位之彩色位图,PixelFormat 为位图的内存格式和颜色深度,总共9个值
  for y := 0 to Bmp.Height-1 do
  begin
    p :=Bmp.ScanLine[y];//ScanLine方法用于获取像素颜色值
    for x:=0 to Bmp.Width-1 do
    begin
      Gray:=round(p[3*x+2]*0.3+p[3*x+1]*0.59+p[3*x]*0.11);//公式Y=0.299R+0.857G+0.113B
      //图像二值化
      if Gray > 120 then//阈值为120
      begin
        p[3*x+2]:=255;
        p[3*x+1]:=255;
        p[3*x]:=255;
      end
      else
      begin
        p[3*x+2]:=0;
        p[3*x+1]:=0;
        p[3*x]:=0;
      end; 
//分割线------------------------------------- 
    end;
  end;
  image4.Picture.Bitmap := Bmp;
  Bmp.Free;//释放TBitmap
end;

原图:   delphi WebBrowser控件上网页验证码图片识别教程(一)
处理后:delphi WebBrowser控件上网页验证码图片识别教程(一)
从效果图可以看出,图像二值化就是设定一个阈值,然后判定每点的RGB值大于还是小于阈值,大于则为255即黑色,小于阈值则为0即白色。

 
qq:673890989    欢迎有兴趣的伙伴交流
 
经验
 
上一篇:WebBrowser控件使用详解


下一篇:C# 虚函数