文件夹遍历技术是一种非常有用的技术,在文件的搜索以及杀毒软件中都使用了这种技术。以下我将讨论如何在Win32下实现这种技术。
文件夹遍历技术的核心就是使用递归算法,关于递归算法我这里就不多介绍了,不明白的朋友请参阅相关内容。
以下是我的算法伪代码:
void function(LPCTSTR lpszPath)
{
开始查找;
if (没有找到文件)
return;
do
{
if (找到的文件是目录)
function(找到的目录);
else
对文件进行操作;
} while (查找下一个文件并成功);
}
实现这个算法所需要用到的API函数以及结构体有:
·FindFirstFile;
·FindNextFile;
·WIN32_FIND_DATA。
在此我假定你已经明白了以上函数及结构体的用法,now let's begin。
现在我来编写开始查找的代码。在这之前,我先假定函数参数lpszPath传入的路径格式为X:\(根目录)或X:\Dir(非根目录),因为Win32程序设计中通常使用的就是这种路径格式。你一定注意到了,如果路径是根目录,它的后边有一个路径分隔符“\”,反之则没有。那么我在写代码的时候必须对这两种情况分别处理。这段代码如下:
TCHAR szFind[MAX_PATH];
lstrcpy(szFind, lpszPath);
if (!IsRoot(szFind)) // IsRoot是我自己编写的函数,若参数是根目录,则返回true
lstrcat(szFind, "\\");
lstrcat(szFind, "*.*"); // 找所有文件
WIN32_FIND_DATA wfd;
HANDLE hFind = FindFirstFile(szFind, &wfd);
if (hFind == INVALID_HANDLE_VALUE) // 如果没有找到或查找失败
return;
下面我将讨论的是如果找到了文件,该怎么办。不过在此之前,请你进入MS-DOS方式,并输入dir回车,你看到了什么?
是的,DOS是不会说假话的,不像Windows一样总把重要的东西隐藏起来不让你看到——如果你所在的不是根目录,你将会看到“.”与“..”这两个目录——这是在资源管理器中看不到的。从DOS时代走过的朋友们大抵都明白吧,一个点代表的是当前目录,两个点代表的是上一级目录。那么我在处理信息时,就一定得把它们两个过滤出去,原因我在下面解释。do-while段的代码如下:
do
{
if (wfd.cFileName[0] == '.')
continue; // 过滤这两个目录
if (wfd.dwFileAttributes & FILE_ATTRIBUTE_DIRECTORY)
{
TCHAR szFile[MAX_PATH];
if (IsRoot(lpszPath))
wsprintf(szFile, "%s%s", lpszPath, wfd.cFileName);
else
wsprintf(szFile, "%s\\%s", lpszPath, wfd.cFileName);
function(szFile); // 如果找到的是目录,则进入此目录进行递归
}
else
{
// 对文件进行操作
}
} while (FindNextFile(hFind, &wfd));
FindClose(hFind); // 关闭查找句柄
现在我来解释为什么要把那两个带点的目录过滤出去。如你所见,如果找到的是目录,那么进入此目录进行递归——那么若是当前目录呢?答案很明显,如果不对其进行过滤,那么程序将进入“当前目录”进行递归。是的,如是将导致递归无休止地进行下去。
算法就这么多了,由于这是一个极其耗费系统资源的算法,因此你在程序中用到它的时候,最好将其放到一个单独的线程中运行,否则将会导致你的程序在查找过程中没有任何响应。
附:IsRoot函数源码
BOOL IsRoot(LPCTSTR lpszPath)
{
TCHAR szRoot[4];
wsprintf(szRoot, "%c:\\", lpszPath[0]);
return (lstrcmp(szRoot, lpszPath) == 0);
}
本文地址:http://com.8s8s.com/it/it1156.htm