有没有哪位英文好并且精通中文编码方面的问题啊

RT,因为一处Fences5的翻译问题正在和开发组老哥解释,但是自己看了半天似乎还是没大解释明白……

原帖: Fences 5的问题大家没人发现还都在用?!

现代的Windows应用基本没有gb2312了,我觉得你该问是utf-8还是gbk

gbk与2312一脉相承,主要是它的软件用不着gbk我就没管:xk:

其实是压根分不清2312与gbk在编码方面有啥不同

2312是gbk子集

这我知道,但是更深入的详细区别就不甚了解了……

就是 500 个 ASCII 字符,或者 250 个 UTF-16 字符吧,和操作系统交互的字符一般就是 ASCII 和 UTF-16 两种字符,一般不考虑 UTF-8

What the “character” mean? 500 utf-8 character or 500 ancii character(250 utf-8)

对于英文来说,ASCII 和 UTF-8 编码是一样的,所以不要纠结什么编码,他们的程序员就没考虑汉字编码什么的,就是 500 个单字节字符

问题就在这里,他们用的啥编码处理汉字呢?
gb2312是2字节
utf8是3字节

所以我该翻译成250个汉字还是166个汉字又是一个问题……

就翻译成“请将标题长度限制在 500 个单字节字符以内。”就可以了,懂得都懂,不懂的你说的再清楚他还是一头雾水

实在要严谨点的话,翻译成“请将标题长度限制在 500 个单字节字符(约 250 个汉字)以内。”吧

1 个赞

有道理,不过目前懒得改,过两天再说,反正只要我issues不关pr就不会merge

你要实在纠结这个的话,那就创建一个 250 个汉字的标题试试,不就知道到底是多少个汉字了么? :yum:

因为fences太难用早早卸载的我: :wl:

确实,对英文为母语的开发者来说,编码什么的都是浮云,所有内容都是1个字节,也可以说是1个character。
如对方所说,500 utf-8 character,对中文来说实际上可能是750(或者更多)Byte;
所以对这事,不如就坦率直白的说明,针对中文,希望他们限制最长长度不超过500个汉字(或所对应的最长字节)。
(一般情况下,用utf-8编码,500个汉字大概是1500个字节,偶尔遇到生僻汉字,也会超过1500)

1 个赞

gb18030才是真的高难度,少有直接打开不乱码的外国编辑器

找到支持的大多国人的,但是ui和代码染色都不满意

我现在基本上只跟开源/免费的汉化了.

商业软件汉化问题很多, 涉及版权, 担责又没啥好处.

如果看的不爽,我基本汉化后自用, 不会分享.

说这么多, 就是想告诉你, 如果一个软件很适合汉化, 早就有人做了. 轮不到机翻.

这个适合, 不是单指技术本身.

说的很好……确实是我没想到的角度……