使用XMLDocment遍历CSDN论坛帖子回复
一天在水园看到别人整理的水园语录,就是把某人一个时间段在论坛参与的回复都整理在一块,顿时感到心血来潮,自己何不也整一个,在必要的时候可以讨好自己中意的MM,呵呵也可以多了解一些别人,何乐而不为啊 :)
仔细研究了一下论坛的文件格式都是xml的,Delphi6不是自带有一个XmlDocument控件吗?可以很方便的对xml文件进行读取,研究了几篇相关的文章,自己就动手开始做起来,花了二个多小时基本搞定,唯一的缺陷就是速度有点慢,遍历2000个帖子大概需要5分钟左右,那为兄弟有时间可以帮忙给完善一下,例如做成多线程什么的,我实在是懒得改进了,呵呵,废话少说,现贴出部分的代码,主要完成对特定作者的回复进行搜索,其他通过设定关键字、论坛编号、时间段检索大家可以自己完善。
主要代码部分:
窗体上主要有4个文本框,一个memo控件和二个按扭
通过指定帖子起始编号、结束编号和作者名称,点“search”按扭,就可以将结果显示到memo框中。
unit XmlDocSearch;
interface
uses
Windows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,
Dialogs, StdCtrls, xmldom, XMLIntf, msxmldom, XMLDoc, ComCtrls;
const
url='http://expert.csdn.net/Expert/topic/';
type
TFormTest = class(TForm)
MemoOutput: TMemo;
Button1: TButton;
Label1: TLabel;
Label2: TLabel;
Label3: TLabel;
Label4: TLabel;
Edit1: TEdit;
Edit2: TEdit;
Edit3: TEdit;
Edit4: TEdit;
Button2: TButton;
XMLDoc: TXMLDocument;
procedure Button1Click(Sender: TObject);
procedure Button2Click(Sender: TObject);
private
{ Private declarations }
StartID,EndID :LongInt;
KeyWord,Author :string;
public
{ Public declarations }
end;
var
FormTest: TFormTest;
implementation
uses SearchThread;
{$R *.dfm}
procedure TFormTest.Button1Click(Sender: TObject);
显示格式:
{# # # 搜索范围:489000--493000# # #
帖子ID:489353
回复者:傻傻猫
回复时间:2002-1-21 10:48:45
内容:
等一下吧。我发个短消息问她
# # # # # # # # # # # # # # # # # # # # # # # #
}
var
Root,CurNode,ChildNode :IXMLNode; //根结点,当前节点,子节点
sStr, sStrReturn: String;
TopicID,ReplyName,ReplyNickName,ReplyTime,ReplyContent :string;
//主题编号,回复人名称,回复人呢称,回复时间,回复内容
CurUrl :PChar;
dtr,dts,dte : TDateTime;
min : double;
CurID :integer; //当前编号
begin
dts :=now; //开始时间
StartID :=strtoint(edit3.Text);
EndID :=strtoint(edit4.Text);
KeyWord :=trim(edit1.Text);
Author :=trim(edit2.Text);
MemoOutput.Clear;
sStrReturn := Chr(13) + Chr(10);
sStr :='# # # 搜索范围:'+inttostr(StartID)+'--'+inttostr(EndID)+'# # #'+sStrReturn+sStrReturn;
MemoOutput.SetSelTextBuf(PChar(sStr));
for CurID:=StartID to EndID do
begin
TopicID :=inttostr(CurID);
CurUrl :=PChar(Url+copy(TopicID,1,length(TopicID)-3)+'/'+TopicID+'.xml');
xmldoc.LoadFromFile(CurUrl);
xmldoc.Active :=true;
Root :=xmldoc.DocumentElement; //取XML文件的根结点,即Topic
CurNode :=Root.ChildNodes['Replys']; //使当前节点指向第二个子节点Replys
CurNode :=CurNode.ChildNodes.First; //使当前节点指向Replys节点的第一个子节点信息
while (CurNode<>nil) do //循环读取多个Reply信息
begin
if CurNode.ChildNodes['PostUserName'].Text =Author then
begin
ChildNode :=CurNode.ChildNodes.First ; //使ChildNode指向该Reply的第一个子节点信息
while (ChildNode<>nil) do //循环读取Reply的各个子节点
begin
if (ChildNode.NodeName ='PostUserName') then
ReplyName :=ChildNode.Text
else if (ChildNode.NodeName ='PostUserNickName') then
ReplyNickName :=ChildNode.Text
else if (ChildNode.NodeName ='PostDateTime') then
ReplyTime :=ChildNode.Text
else if (ChildNode.NodeName ='Content') then
ReplyContent :=trim(ChildNode.Text);
ChildNode:=ChildNode.NextSibling ; //顺序取下一个Reply的子节点信息
end;
sStr :='帖子ID:'+TopicID+sStrReturn;
sStr :=sStr+'回复者:'+ReplyName+'('+ReplyNickName+')'+sStrReturn;
sStr :=sStr+'回复时间:'+ReplyTime+sStrReturn;
sStr :=sStr+'内容:'+sStrReturn+sStrReturn+ReplyContent+sStrReturn+sStrReturn;
sStr :=sStr+'# # # # # # # # # # # # # # # # # # # # # # # #';
sStr :=sStr+sStrReturn;
MemoOutput.SetSelTextBuf(PChar(sStr));
end;
CurNode :=CurNode.NextSibling; //顺序取下一个Reply信息
end;
// xmldoc.SaveToFile('.\down\'+TopicID+'.xml'); //保存文件
end;
dte :=now; //结束时间
dtr :=dte-dts;
min :=dtr*24*60*60;
showmessage('总共使用了'+floattostr(min)+'秒!');
end;
procedure TFormTest.Button2Click(Sender: TObject);
begin
close;
end;
end.
主要代码部分就是上面所写的,那位朋友有什么问题或有更好的建议,请和我联系,我的Email:[email protected]。
完成日期:2003/5/28
本文地址:http://com.8s8s.com/it/it5368.htm