编程语言：valarray::apply()的批判

热点排行

valarray::apply()的批判

类别：编程语言点击：0 评论：0 推荐：

valarray::apply()的批判。

本人因恰好需要对数组做整体+=，-=,max等操作，发现valarray是一个挺好的东西，就用这个东西来帮助操作了。

然后发现了一个看上去更好的valarray::apply()：它的描述是——把一个函数f的指针传给apply()，apply()就能返回一个被f作用过于每一个元素的valarray

就是说如果我想把一个数组a的每一个值乘以2得到一个新的数组，那么可以写成:
int f(int i)
{
return i * 2;
}

valarray<int>a(10);
valarray<int>b(10);

blahblah.../* 把a赋值为 {1,2,3,4,5,6,7,8,9,10}*/

b = a.apply(f); /*于是b就变成 {2,4,6,8,10,12,14,16,18,20}了*/

但是我对整个过程挺拿不准，写了一个constructor,copy constructor, operator = 都带有输出的类来检测，发现运行一次apply()就会调用很多次各种构造器和operator =()。于是打开<valarray>的源代码，发现这个apply()的定义是：

valarray<_Ty> apply(_Ty _F(_Ty)) const
{_VALOP(_Ty, size(), _F(_Ptr[_I])); }

#define _VALOP(TYPE, LENGTH, RHS) \
valarray<TYPE> _Ans(LENGTH); \
for (size_t _I = 0; _I < _Ans.size(); ++_I) \
_Ans[_I] = RHS; \
return (_Ans)

这样一看，我就认为apply()是一个效率非常低的东西了。因为为了做一个a的每个元素乘2得到的b，它会：
1.产生一个临时valarray: _Ans，长为10。
2.调用f()给_Ans的每一个元素赋值，循环10次。
3.return的时候产生再产生一个用来保存返回值的临时对象，大小也是10，并运行copy constructor将_Ans复制给它
4.再调用operator=()将刚才的临时返回值对象复制给b,循环10次。

其中又：
2.1 在调用f期间，如果f的传参数方式不是传引用，那么每call一次f调用一次copy constructor，在本例中为10次。
即使是传引用，因为这个引用是const,f中间也必须做一个临时的TYPE对象，还是要产生10次。
2.2 f的返回值必须是传值方式，于是f每返回一次又要生成一个临时返回值对象，调用一次copy constructor.合计10次。
2.3 把f的返回值传给_Ans，要调用TYPE::operator =(),又合计10次。

就是说为了把a全部10个元素每个乘2赋给已经初始化过的b，总计会产生10+10+10+10=40个临时对象，调用operator=()至少20次。再加上销毁对象的操作，额外开销相当大了。显然完全没有用循环来赋值合算。

（我很疑惑为什么apply()不定义成b.apply(f, a)的调用方式，而要写成b = a.apply(f)。如果用前面的方法可以节省中间的_Ans的产生，以及传递_Ans的返回值临时对象的产生。）

另外，apply()的这种形式也限制了不需要传参数与不需要返回值的操作的灵活性。
比如
1.要让a的所有成员赋为一个随机数，虽然可以写一个与传入值无关的f:
int f(int /* not used*/)
{
    return rand();
}
但是写a = a.apply(f)的时候还是有很大浪费。
又如
2.我要输出a里所有的元素，那么定义f:
int f(int i)
{
    cout << i << endl;
    return i;
}
这样可以用a.apply(f)来执行，但是其中多做的返回值处理的操作又浪费了……

综上：我认为valarray::apply()从微观上来看是一个很不好的东东。但是就软件工程的观点来说，它用多余的4倍的损耗节省了开发者写一个循环的精力。所以我写这篇文章纯粹是开发时代的无病呻吟。

gambolgs April 23, 2005

本文地址：http://com.8s8s.com/it/it22220.htm