数据中“州”字的
GBK 编码:D6 DD,但是实际的数据中由于某种原因造成D6丢失,由于
GBK是双字节
编码,所以DD和后面的字节(CA)重新组成了另一个汉字:菔,而以此类推后面的汉字,每两个字节组成一个汉字,但B7 34在
GBK 编码中不能组成汉字,34在
GBK 编码中是:4,也正是“437号”中的“4”。它用于进行字符
编码之间的
转换。■ Python的内置
库codecs对中文
转换时采用一种“
转换最多中文字符”的策略,所以codecs在本示例中,遇到乱码后,最终
转换的字符为:“菔刑旌忧天河北路437号”。
到此这篇字符集转码(字符集编码转换)的文章就 介绍到这了,更多相关内容请继续浏览下面的相关 推荐文章,希望大家都能在编程的领域有一番成就!版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/bcyy/23005.html