Email地址有效性的检验是一个经常遇到的问题啦!一般的检验方法是对Email地址字符串进行简单的格式检验,如是否含有@ .等有效字符等。这种方法只能保证该地址从格式上看似有效,并不能保证地址可达。最近进行大量的地址校验,写了一个小程序,可以检测Email地址是否真正可达。
Email地址包括两个部分:用户名和邮件服务器。因此,检验邮件地址可以分为两步进行:首先检验邮件服务器,然后检验用户名。如[email protected],首先检验yahoo.com.cn服务器是否是有效的邮件服务器,如果是再在该服务器上确认是否存在brookes_luan用户。
通过查询DNS服务器,获取域名的MX(Mail Exchanger)记录,可以确定某一域名对应的邮件服务器是否有效。在Windows系统中,可以使用nslookup程序来查看这一记录。
//通过nslookup程序查询MX记录,获取域名对应的mail服务器
public string getMailServer(string strEmail)
{
string strDomain=strEmail.Split('@')[1];
ProcessStartInfo info=new ProcessStartInfo();
info.UseShellExecute=false;
info.RedirectStandardInput=true;
info.RedirectStandardOutput=true;
info.FileName="nslookup";
info.CreateNoWindow=true;
info.Arguments="-type=mx "+strDomain;
Process ns=Process.Start(info);
StreamReader sout=ns.StandardOutput;
Regex reg=new Regex("mail exchanger = (?<mailServer>[^\\s]+)");
string strResponse="";
while((strResponse=sout.ReadLine())!=null){
Match amatch=reg.Match(strResponse);
if(reg.Match(strResponse).Success) return amatch.Groups["mailServer"].Value;
}
return null;
}
第二步,连接邮件服务器,确认服务器的可用性和用户是否存在
public int checkEmail(string mailAddress)
{
Regex reg=new Regex("^[a-zA-Z0-9_-]+@([a-zA-Z0-9-]+\\.){1,}(com|net|edu|miz|biz|cn|cc)$");
if(!reg.IsMatch(mailAddress) return 405;//Email地址形式上就不对
string mailServer=getMailServer(mailAddress);
if(mailServer==null)
{
return 404; //邮件服务器探测错误
}
TcpClient tcpc=new TcpClient();
tcpc.NoDelay=true;
tcpc.ReceiveTimeout=3000;
tcpc.SendTimeout=3000;
try{
tcpc.Connect(mailServer,25);
NetworkStream s=tcpc.GetStream();
StreamReader sr=new StreamReader(s,Encoding.Default);
StreamWriter sw=new StreamWriter(s,Encoding.Default);
string strResponse="";
string strTestFrom="[email protected]";
sw.WriteLine("helo "+mailServer);
sw.WriteLine("mail from:<"+mailAddress+">");
sw.WriteLine("rcpt to:<"+strTestFrom+">");
strResponse=sr.ReadLine();
if(!strResponse.StartsWith("2")) return 403; //用户名有误
sw.WriteLine("quit");
return 200; //Email地址检查无误
}catch(Exception ee)
{
return 403;//发生错误或邮件服务器不可达
}
}
这个程序是根据SMTP的基本过程实现的。与一个mail服务器连接发邮件的基本过程可能是这样的:
telnet mail.brookes.com 25
>>220 brookes.com<IMail 8.02>
HELO
>>250 mail.brookes.com
MAIL FROM:[email protected]
>>250 Ok
RCPT TO:[email protected]
>>250 ok its for [email protected]
DATA
>>ok.send it ;end with <CRLF>.<CRLF>
soem data.
>>250 message queued
QUIT
>>221 Goodbye.
灰色部分代码是一个常规的Email地址检查方法,检查地址形式上的有效性。
程序用到了System.IO,System.Net.Sockets,System.Diagnostics命名空间,通过checkMail(mailAddress)调用。
说明:
1.这种方法可以进一步检查Email地址的有效性,比只从形式上验证有了很大的进步。对于需要通过Email地址进行注册信息验证、发送密码等应用,可以更进一步保证有效;
2.由于Email服务器的多样和可配置性,因此次程序并不能保证结果的普遍适用;
3.对于一些大的邮件服务器,通常具有较强的反垃圾邮件功能,对于此类探测可能会作出反应,因此不适合于大量的地址探测。比如,我在探测过程中就发现了163.com服务器停止对次进行响应。
本文地址:http://com.8s8s.com/it/it8177.htm