字符编码转化（字符编码转换）

容器化与Kubernetes 来源：网络编辑：小编更新时间：2026-04-04 12:09:04 浏览量：60

C++的项目，字符编码是一个大坑，不同平台之间的编码往往不一样，如果不同编码格式用一套字符读取格式读取就会出现乱码。因此，一般都是转化成UTF-8这种平台通用，且支持性很好的编码格式。

Unicode、UTF-8的概念不做过多解释，这里说一下ANSI，我第一次看到这个名词，我看成了ASCII。被Mentor狠批一顿。

以上内容摘自百度百科，可以看出，ANSI和ASCII还是有关系的。ANSI也叫本地码。

我们要做到能在Unicode、UTF-8、ANSI这三种编码格式中自由转换。如下图所示：

在C++中，要怎么做呢？当然是用标准库的东西啦，C++11对国际化标准做得还是可以的，提供了这些接口，正如图中虚线所示，标准库没有提供UTF-8到ANSI的互相转化接口，但是我们可以自己封转接口，借用这条路(UTF-8 <=> Unicode <=> ANSI)来实现。

因此，接下来就聊聊UTF8 <=> Unicode和Unicode <=> ANSI。

而C++11提供了wstring_convert这个类，这个类可以在wchar_t string和multibyte string之间来回转换；

而codecvt_utf8可以提供UTF-8的编码规则。这个类在#include 中。有了wstring_convert提供宽字符字符串到多字节字符串的转化，而这个转换规则由codecvt_uft8提供。这样子就可以实现UTF8和Unicode的互相转换。

讲下wcsrtombs，这个函数把宽字符串转成多字节字符串。编码规则受地域的LC_CTYPE影响。因此这个函数可以用于本地码的转化(和本地的编码息息相关)。

因此，有关于本地码的使用，在代码中要加上下列语句：

可以看到，LC_CTYPE = en_US.UTF-8，这表示英文，英国，UTF-8编码，也就是说本地码就是这个。

当然，你也可以在setlocale中指定一些编码规则，把wcsrtombs用于别的编码转化，但是，这里不推荐，因为setlocale是全局的，设置了这个就会影响其他地方的编码。

wcsrtombs的四个参数分别代表什么意思呢？

std::size_t wcsrtombs( char* dst, const wchar_t src, std::size_t len, std::mbstate_t* ps );

mbsrtowcs同理。

对了，在Linux下加上setlocale(LC_CTYPE, "")后程序在命令行中可以正常显示，不加有可能不正常显示，原因是setlocale(LC_CTYPE, "")也影响了cout，全局的嘛；而在CodeBlocks下不能正常显示，不知道为什么，但是调试的过程中，观察到了正常的结果；Visual Studio中没有做实验，不过应该没问题。

参考：

到此这篇字符编码转化（字符编码转换）的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章，希望大家都能在编程的领域有一番成就！

上一篇： kvm虚拟化是哪个厂商（kvm虚拟化技术原理）

下一篇： docker启动镜像失败（docker启动镜像容器命令）

版权声明：
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符，请将相关资料发送至xkadmin@xkablog.com进行投诉反馈，一经查实，立即处理！

转载请注明出处，原文链接：https://www.xkablog.com/do-docker-k8s/43147.html

相关文章：