C++ 函数返回局部变量的std::move()的适用场景(转)

作者:神奇先生
链接:https://www.zhihu.com/question/57048704/answer/151446405
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

编程时经常会写的一种函数叫做named constructor,这种函数的返回值是某个类的实例,其实本质上就是一种构造函数,但是因为可能需要在构建时执行一些其他的步骤,所以没有写成constructor的形式。比如:

User create_user(const std::string &username, const std::string &password) {
User user(username, password);
validate_and_save_to_db(user);
return user;
}
void signup(const std::string &username, const std::string &password) {
auto new_user = create_user(username, password);
login(user);
}

这里create_user就是一个named constructor。

一些c++初学者可能会觉得这个代码不够优化,因为按照这个代码字面意思来理解,create_user创建先创建了一个user,然后返回时又把user赋值给new_user,这个赋值会copy user里面的内容,如果user很大的话(很有可能user里面存了很多信息,比如username这种string的类型),这样太慢(copy string可能还需要多做一次malloc)。

这样难免一些人会想用c++11引入的move来优化,因为create_user里面的user return了之后就没用了,我可以把user move到new_user这样不就省掉了copy时很大的开销了么(比如user里面的username就不需要malloc新内存也不需要一个个字符copy了)。

但事实上,在这种简单的情况下编译器比你更聪明,编译器可以直接把user创建在new_user里,所以user只被创建一次,没有任何copy开销,user和new_user经过编译器优化之后其实是同一个variable!这种优化就叫做copy elision。但是很不幸的是,如果用户想自己用move优化的话,编译器就不用做copy elision了,只能乖乖地按照用户说的来,先创建一个user,然后在调用User的move constructor来创建new_user。这样肯定比前一种开销大很多。这就是为什么clang非常“聪明”地给题主的例子给了一个warning。

接下来我们再说说我们怎么能知道编译器会不会对我写的函数做copy elision的优化呢?有没有可能我写的函数逻辑特别复杂,编译器没法优化呢?如果有的话,我如果写return move(a)不就会比copy更快了吗?

这个逻辑是正确的,编译器其实很傻,一旦create_user里面的逻辑太复杂,编译器可能就没办法分析出你能不能用一个变量取代两个(user和new_user),那它就不做copy elision了。这时候用move就合情合理。

那到底什么时候应该move,什么时候应该依靠copy elision呢?通常主流的编译器都会100% copy elision以下两种情况:

1. URVO(Unnamed Return Value Optimization):函数的所有执行路径都返回同一个类型的匿名变量,比如

User create_user(const std::string &username, const std::string &password) {
if (find(username)) return get_user(username);
else if (validate(username) == false) return create_invalid_user();
else User{username, password};
}

这里所有的return都返回一个User类型,且每个返回的都是一个匿名变量。那编译器100%会执行copy elision。

2. NRVO(Named Return Value Optimization):函数的所有路径都返回同一个非匿名变量,比如

User create_user(const std::string &username, const std::string &password) {
User user{username, password};
if (find(username)) {
user = get_user(username);
return user;
} else if (user.is_valid() == false) {
user = create_invalid_user();
return user;
} else {
return user;
}
}

这里因为所有路径都返回同一个变量user。编译器100%会执行copy elision。

其他的情况编译器可能都不会使用copy elision的优化。

首先 URVO 在 C++17 是强制的。不过 NRVO 不是强制,意味着有时不这么优化也是允许的。
其次,若 return 的表达式是符合返回类型的左值,且编译器没有进行复制省略,那么标准(C++11 开始)也要求编译器先试图把表达式当右值,优先匹配移动构造函数(再匹配通常的复制构造函数),若失败的话则再将其当左值,匹配接受非 const 引用的复制构造函数。

所以按照标准,上面的 std::move(a) 是不必要的(除非你希望强制调用移动构造函数),编译器在必要时会做同样的处理。

作者:神奇先生 &暮无井见铃
链接:https://www.zhihu.com/question/57048704/answer/151453824
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

上一篇:c++ 设计模式3 (重构技法 Template Method)


下一篇:jQuery插件开发入门