协慌网

登录 贡献 社区

修剪 std :: string 的最佳方法是什么?

我目前正在使用以下代码对程序中的所有std::strings进行右修剪:

std::string s;
s.erase(s.find_last_not_of(" \n\r\t")+1);

它可以正常工作,但我想知道是否有某些最终案例可能会失败?

当然,我们欢迎您提供其他优雅的解决方案以及左修剪解决方案。

答案

编辑自 c ++ 17 起,标准库的某些部分已删除。幸运的是,从 c ++ 11 开始,我们有了 lambda,它们是一种出色的解决方案。

#include <algorithm> 
#include <cctype>
#include <locale>

// trim from start (in place)
static inline void ltrim(std::string &s) {
    s.erase(s.begin(), std::find_if(s.begin(), s.end(), [](int ch) {
        return !std::isspace(ch);
    }));
}

// trim from end (in place)
static inline void rtrim(std::string &s) {
    s.erase(std::find_if(s.rbegin(), s.rend(), [](int ch) {
        return !std::isspace(ch);
    }).base(), s.end());
}

// trim from both ends (in place)
static inline void trim(std::string &s) {
    ltrim(s);
    rtrim(s);
}

// trim from start (copying)
static inline std::string ltrim_copy(std::string s) {
    ltrim(s);
    return s;
}

// trim from end (copying)
static inline std::string rtrim_copy(std::string s) {
    rtrim(s);
    return s;
}

// trim from both ends (copying)
static inline std::string trim_copy(std::string s) {
    trim(s);
    return s;
}

感谢https://stackoverflow.com/a/44973498/524503提供了现代解决方案。

原始答案:

我倾向于使用以下三种之一来满足自己的修整需求:

#include <algorithm> 
#include <functional> 
#include <cctype>
#include <locale>

// trim from start
static inline std::string &ltrim(std::string &s) {
    s.erase(s.begin(), std::find_if(s.begin(), s.end(),
            std::not1(std::ptr_fun<int, int>(std::isspace))));
    return s;
}

// trim from end
static inline std::string &rtrim(std::string &s) {
    s.erase(std::find_if(s.rbegin(), s.rend(),
            std::not1(std::ptr_fun<int, int>(std::isspace))).base(), s.end());
    return s;
}

// trim from both ends
static inline std::string &trim(std::string &s) {
    return ltrim(rtrim(s));
}

它们是自我解释的,并且工作得很好。

编辑 :顺便说一句,我在那里有std::ptr_fun以帮助消除std::isspace歧义,因为实际上还有第二个支持语言环境的定义。这本来可以是相同的演员,但我倾向于更好。

编辑 :解决有关通过引用接受参数,修改并返回它的一些注释。我同意。我可能更喜欢的一种实现是两组函数,一组用于原位,而另一组进行复制。更好的例子是:

#include <algorithm> 
#include <functional> 
#include <cctype>
#include <locale>

// trim from start (in place)
static inline void ltrim(std::string &s) {
    s.erase(s.begin(), std::find_if(s.begin(), s.end(),
            std::not1(std::ptr_fun<int, int>(std::isspace))));
}

// trim from end (in place)
static inline void rtrim(std::string &s) {
    s.erase(std::find_if(s.rbegin(), s.rend(),
            std::not1(std::ptr_fun<int, int>(std::isspace))).base(), s.end());
}

// trim from both ends (in place)
static inline void trim(std::string &s) {
    ltrim(s);
    rtrim(s);
}

// trim from start (copying)
static inline std::string ltrim_copy(std::string s) {
    ltrim(s);
    return s;
}

// trim from end (copying)
static inline std::string rtrim_copy(std::string s) {
    rtrim(s);
    return s;
}

// trim from both ends (copying)
static inline std::string trim_copy(std::string s) {
    trim(s);
    return s;
}

我出于上下文的考虑而保留了上面的原始答案,目的是使获得高票的答案仍然可用。

使用Boost 的字符串算法将是最简单的:

#include <boost/algorithm/string.hpp>

std::string str("hello world! ");
boost::trim_right(str);

str现在是"hello world!" 。还有trim_lefttrim ,它会修剪两侧。


如果将_copy后缀添加到以上任何函数名称(例如trim_copy ,该函数将返回字符串的修剪后的副本,而不是通过引用对其进行修改。

如果将_if后缀添加到上述任何函数名称(例如trim_copy_if ,则可以修剪所有满足您的自定义谓词的字符,而不是空白。

使用以下代码从std::stringsideone )右修剪(跟踪)空格和制表符:

// trim trailing spaces
size_t endpos = str.find_last_not_of(" \t");
size_t startpos = str.find_first_not_of(" \t");
if( std::string::npos != endpos )
{
    str = str.substr( 0, endpos+1 );
    str = str.substr( startpos );
}
else {
    str.erase(std::remove(std::begin(str), std::end(str), ' '), std::end(str));
}

为了平衡起见 ,我还将包括左修剪代码( ideone ):

// trim leading spaces
size_t startpos = str.find_first_not_of(" \t");
if( string::npos != startpos )
{
    str = str.substr( startpos );
}