锟斤拷
| 基本资料 | |
| 用语名称 | 锟斤拷 |
|---|---|
| 其他表述 | 锟届瀿锟斤拷雮傡锟斤拷直锟斤拷锟 |
| 用语出处 | 字符集转换BUG |
| 相关条目 | 俸俸伲购美病 |
锟斤拷是一个著名的由字符集转换bug而衍生出的用语,是乱码梗的典型代表之一。
简介
“锟斤拷”是GBK字符集与Unicode字符集之间转换过程中出现的一种乱码现象。当Unicode字符集中某些字符无法被正确表示时,会使用一个特殊的占位符字符U+FFFD(REPLACEMENT CHARACTER)来代替。这个占位符在UTF-8编码中对应的字节是0xEFBFBD。当这个字节序列重复出现并被错误地按照GBK编码解读时,就会显示出“
这个梗的流行也与编程和计算机技术的发展有关,因为很多程序员在开发过程中经常遇到编码问题。“锟斤拷”成为了对编码错误的一种幽默和自嘲的表达方式,也反映了数字时代信息交流中可能出现的障碍。此外,与之相似的乱码现象还有“烫烫烫”和“屯屯屯”,这些也是由于不同的编码转换问题导致的。
“锟斤拷”不仅是技术应用的黑历史,也成为了网络文化中的一个有趣现象,经常出现在各种网络论坛、社交媒体和编程社区中,用来戏谑那些因编码错误导致的奇怪字符显示问题。
这类乱码现象也在一些游戏中出现过,比如RPG游戏《英雄传说 空之轨迹SC》的中文版中,“嘿嘿嘿,还好啦”因为乱码而显示成了“俸俸伲 购美病”。虽然原理和“锟斤拷”不一样,但因为同样都是乱码,同样导致了一波网络流行。亦被网友归纳为“乱码梗”,经常作为趣谈一并提起。
衍生
同样属于编码转换bug的还有“烫烫烫”、“屯屯屯”和“锘*”,因为辨识度不如锟斤拷高,所以通常很少单独被拿出来玩梗,但是和锟斤拷一起拿出来玩的概率很高:
“烫烫烫”和“屯屯屯”乱码的形成原因主要与Visual Studio的内存初始化方式有关。在Debug模式下,Visual Studio会将未初始化的栈内存填充为0xCC,而未初始化的堆内存填充为0xCD。重复出现就会在GB2312编码中对应中文字符“
“锘”开头乱码的形成和锟斤拷很像。这类错误与语言无关,错误的原因是UTF-8的BOM。BOM(Byte Order Mark)是UTF-8文档的Unicode签名,即0xEFBBBF这三个字节,当把文件编码选为UTF-8时,系统会自动在文件头部添加上这三个字节,而选为UTF-8 NO BOM时会自动去掉这三个字节。一般平台通常不会自动去加BOM,但微软会搞这些小动作,就导致了“锘”开头乱码的现象。(例1:【锘縣】开头的文本是h,http被显示为锘縣ttp;例2:【锘缝】开头的文本是p,public被显示为锘缝ulic)
用法
- 锟斤拷锟斤拷烫烫烫
- 手持两把锟斤拷,口中疾呼烫烫烫;脚踏千朵屯屯屯,笑看万物锘锘锘。
- 《我的世界》中国版里的中文版《终末之诗》中的动态乱码被翻译为“锟斤拷”等乱码。
- 《崩坏:星穹铁道》中的橡木兵人会复述“锟斤拷锟斤拷锟斤拷。”和“烫烫烫烫烫烫烫。”;幽囚狱金人则会说“消消消消消消灭人类暴政…未来属于于于于智械。新的帝帝帝帝帝皇即将诞生……将对有有有有机生命展开开开净化。锟斤拷烫烫烫……”
- 《绝区零》中的委托“救救锟斤拷”。
扩展阅读
| ||||||||||||||