C++ wstring与string相互转换_C++宽字符与多字节字符转换技巧

C++中字符串编码转换需根据平台和需求选择方法:Windows下推荐使用MultiByteToWideChar和WideCharToMultiByte实现UTF-8与宽字符互转,跨平台项目建议采用Boost.Locale统一处理,临时方案可用std::wstring_convert(仅C++11-C++17支持),注意编码格式一致性以避免乱码。

在C++开发中,处理不同字符编码时经常需要在std::wstring(宽字符字符串)和std::string(多字节字符字符串)之间进行转换。这种需求常见于Windows API调用、国际化支持或多语言文本处理场景。下面介绍几种实用且跨平台兼容性较好的转换方法。

使用std::wstring_convert(C++11 到 C++17)

从C++11开始,标准库提供了std::wstring_convert类来简化宽字符与多字节字符之间的转换,但它在C++17中被弃用,在C++20中移除。尽管如此,在支持的编译器上仍可使用。

string 转 wstring:

#include 
#include 
#include 

std::string str = "Hello 世界"; std::wstring_convert> converter; std::wstring wstr = converter.from_bytes(str);

wstring 转 string:

std::wstring wstr = L"Hello 世界";
std::wstring_convert> converter;
std::string str = converter.to_bytes(wstr);

注意:此方法依赖头文件,仅在部分实现中可用(如MSVC和旧版GCC),某些Linux环境下可能不支持。

使用平台相关API(Windows推荐)

在Windows平台上,最稳定高效的方法是使用Win32 API中的MultiByteToWideCharWideCharToMultiByte函数。

string 转 wstring(UTF-8 to wide):

#include 
#include 

std::wstring string_to_wstring(const std::string& str) { int len = MultiByteToWideChar(CP_UTF8, 0, str.c_str(), -1, nullptr, 0); std::wstring wstr(len, 0); MultiByteToWideChar(CP_UTF8, 0, str.c_str(), -1, &wstr[0], len); wstr.resize(len - 1); // 去掉末尾空字符 return wstr; }

wstring 转 string(wide to UTF-8):

std::string wstring_to_string(const std::wstring& wstr) {
    int len = WideCharToMultiByte(CP_UTF8, 0, wstr.c_str(), -1, nullptr, 0, nullptr, nullptr);
    std::string str(len, 0);
    WideCharToMultiByte(CP_UTF8, 0, wstr.c_str(), -1, &str[0], len, nullptr, nullptr);
    str.resize(len - 1);
    return str;
}

这种方式适用于Windows下的所有C++项目,尤其是涉及系统API交互的情况。

跨平台方案:Boost.Locale

若需构建跨平台应用,建议使用Boost库中的boost::locale,它封装了底层差异,提供统一接口。

#include 
#include 

std::string wstring_to_string(const std::wstring& wstr) { return boost::locale::conv::to_utf(wstr); }

std::wstring string_to_wstring(const std::string& str) { return boost::locale::conv::to_utf(str); }

Boost.Locale自动处理编码细节,支持多种字符集,适合复杂国际化项目。

注意事项与建议

  • 确认源字符串的实际编码格式,常见为UTF-8或系统本地编码(如GBK)。
  • 避免在无BOM的UTF-8与ANSI混合环境中误判编码。
  • 调试时可通过打印字符长度或十六进制值验证转换正确性。
  • 对于纯ASCII内容,直接逐字节赋值也可行,但不具备通用性。

基本上就这些。选择哪种方式取决于你的目标平台、是否允许引入第三方库以及对标准版本的要求。Windows下优先考虑API函数,跨平台项目推荐Boost,临时小工具可用wstring_convert(注意兼容性)。关键是理解编码本质,避免乱码问题。