仿函数和区间(4)

类别:编程语言 点击:0 评论:0 推荐:

第34章 仿函数和区间(4)

                                                                              Mathew Wilson /著

        刘未鹏(pongba) /译


34.3.6 再进一步,走得太远了!

    你可能想知道:我们能否更进一步,把需要指定字符类型的限制也去掉。答案是:可以,这很容易,见Listing 34.6:

 

Listing 34.6

struct is_large

: public std::unary_function<. . ., bool>

{

template <typename S>

bool operator ()(S const &file) const

{

return is_large_(c_str_ptr(file));

}

private:

static bool is_large_(char const *file);

static bool is_large_(wchar_t const *file);

};

 

    现在,使用它变得更容易了,如下:

 

n = std::count_if(rs.begin(), rs.end(), is_large());

n = std::count_if(gs.begin(), gs.end(), is_large());

n = std::count_if(gsw.begin(), gsw.end(), is_large());

 

    然而,有很好的理由阻止我们这样做。这个仿函数是一个谓词(predicate)——谓词是这样一个仿函数:其operator()返回一个bool值,该值反映了其(一个或多个)实参的某些方面。谓词的一个重要方面是它们可以和适配器(adapter)结合起来[Muss01],就像下面这行语句——它计算小文件的个数:

 

n = std::count_if( gs.begin(), gs.end()

, std::not1(is_large<char>()));

 

    为了使适配器可以和谓词协同工作,谓词必须给出成员typedef:argument_type和result_type。通常,通过继承自std::unary_operator可以完成这个任务。现在我们知道为什么Listing 34.6中的最后一步精化(refinement)无法完成了——如果那样做,我们就没有办法指定argument_type。所以,我们不得不将谓词类定义为含有单个模板参数的模板类。并且,每次使用都必须提供模板实参,因为我们无法提供一个有意义的缺省模板实参——那样做既会导致使用上的麻烦又会带来阅读上的混淆。

    这就是为什么我们的仿函数类是个(具有两个模板参数的)模板类的缘故,其第一个模板参数C表示字符类型,而第二个模板参数A则缺省为C const*,表示该谓词的argument_type。

 

template< typename C

, typename A = C const *

struct is_large

: public std::unary_function<A, bool>

{

. . .

 

    现在,当我们想要将它和一个适配器(adapter)以及一个“::value_type”不是C const* 的序列一起使用时,我们可以这样做:

 

n = std::count_if( rs.begin(), rs.end() // rs: readdir_sequence

, std::not1(is_large<char, struct dirent const*>()));

 

    看起来,这并没有“令人窒息的美感”,但是,考虑到这种情况(序列和适配器同时使用)并不常见,以及通用性和复用性的优点,所以这是个可以承受的选择。另外,它还促进了更高程度的通用性,因为我们可以编写一个能和任何序列完美兼容的模板算法,并同时保持类型隧道,像这样:

 

template< typename C // character type

, typename S // sequence type

void do_stuff(. . .)

{

S s = . . .;

size_t n = std::count_if( s.begin(), s.end()

, std::not1(is_large<C, typename S::value_type>()));

. . .

 

    好吧,在你觉得我已经精神失常之前,我得承认这并不能算是一件会欢快的“蹦”入你脑海的事情,却是一件你一定得去思考的事情。然而,有些时候我们必须得面对复杂的代码,如果你不信,可以看一看一些开源C++库的代码。

    重要的是,我们有了一个机制可以用于编写高度通用的(或称“可复用的”)组件,它们服从一些被广泛接受的惯用形式,所以使用起来很方便。这种通用性基于一个可接受的(至少我这么认为)代价(即,如果和适配器一起使用,则序列中必须有“::value_type”这个typedef)。

 

34.3.7 局部仿函数和回调API

    局部仿函数不能被用于STL算法并不意味着它们不能被用于枚举。事实上,当面对回调式枚举API时,局部类是个非常不错的选择。考虑FindChildById()函数的实现(见Listing 34.7),它和广为人之的Win32 API——GetDlgItem()——功能相似,不过FindByChildId()可以定位任何级别的(直接派生和间接派生的)子窗口,而并非仅仅是第一级子窗口:

 

Listing 34.7

HWND FindChildById(HWND hwndParent, int id)

{

if(::GetDlgCtrlID(hwndParent) == id)

{

return hwndParent; // Searching for self

}

else

{

struct ChildFind

{

ChildFind(HWND hwndParent, int id)

: m_hwndChild(NULL), m_id(id)

{

// Enumerate, passing "this" as identity structure

::EnumChildWindows( hwndParent,FindProc,

reinterpret_cast<LPARAM>(this));

}

static BOOL CALLBACK FindProc(HWND hwnd, LPARAM lParam)

{

ChildFind &find = *reinterpret_cast<ChildFind*>(lParam);

return (::GetDlgCtrlID(hwnd) == find.m_id)?

 (find.m_hwndChild = hwnd, FALSE):TRUE;

}

HWND m_hwndChild;

int const m_id;

} find(hwndParent, id);

 

return find.m_hwndChild;

}

}

 

    类ChildFind定义在FindChildById()的函数体中,最大化了封装程度。而窗口句柄和子窗口id被传给对象find的构造函数。构造函数把id保存在m_id成员中,并且把用于保存搜索结果的成员m_hwndChild设为NULL。然后,构造函数调用Win32的回调式枚举函数EnumChildWindows(),它接受父窗口的句柄,以及一个回调函数和一个调用者提供的参数。find对象将FindProc()静态成员函数作为回调函数传入,并将自身的地址也作为参数传入。FindProc()在每次被回调的过程中都会判断id是否匹配,如果是,则将相应的窗口句柄保存起来并结束查找。

    当find的构造完成时,它内部的m_hwndChild成员要么保存着用户需要的句柄,要么保存的是NULL(即没有找到),最后,这将被返回给FindChildById()的调用端。整个枚举的过程在ChildFind这个局部类的构造函数中完成,而它的定义对于外界是不可见的,所以说,FindChildById()完美的封装了ChildFind类。

 

34.4 区间(Ranges)

    前面我们已经看到,区间枚举和仿函数的使用存在着两个问题:第一,对于一个序列类型,我们想要避免通常(尽管并非“遍地都是”)的重复指定begin()和end()。第二,我们想要避免编写过多特定的“一次编写,仅用一处”的仿函数。

    在我和朋友John Torjo[1]的一次讨论中,我们发现我们对这些问题已经有了清醒的认识,并且,我们需要一个更好的解决方案。于是我们创造了“区间(Range)”这个概念(concept)。很自然的,对于这个问题他和我的看法有些不一样[2],下面给出的区间的定义和组件的实现主要反映的是我的观点。

 

34.4.1 区间(Range)的概念(concept)

    区间的概念相当简单:

 

定义:区间表示有限的一集元素,这些元素可以通过一种递增的方式来访问。区间封装了一个逻辑上的范围(一个起始点(begin)和一个结束点(end)以及遍历的规则(从头至尾遍历)),并具体表达为一个可被客户代码用来访问其中的元素的单个实体。

 

    这听起来过于简单以至于没有意义,是吗?不然!该定义的最为显著的部分就是——区间是一个单个的实体。使用它的规范形式如下:

 

for(R r = . . .; r; ++r)

{

f(*r);

}

 

    或者,如果你不主张操作符重载的话,也可以这样写:

 

for(R r = . . .; r.is_open(); r.advance())

{

f(r.current());

}

 

    这从形式上有了显著的简化——这是区间这个概念的起因之一。区间具有Table 34.2所列出的特性。

    让我们来看看区间如何使用:

 

// A range over a sequence

glob_sequence gs("/usr/include/", "impcpp*");

for(sequence_range<glob_sequence> r(gs); r; ++r)

{

puts(*r); // Print the matched file entry to stdout

}

// A "notional range"

for(integral_range<int> r(10, 20, 2); r; ++r)

{

cout << *r << endl; // Print int value at current point

}

[1]

[2]

本文地址:http://com.8s8s.com/it/it25156.htm