2023年政策修订增补工作正在进行中,欢迎参与!
  • Moegirl.ICU:萌娘百科流亡社群 581077156(QQ),欢迎对萌娘百科运营感到失望的编辑者加入
  • Moegirl.ICU:账号认领正在试运行,有意者请参照账号认领流程

Template talk:Tja

萌娘百科,万物皆可萌的百科全书!转载请标注来源页面的网页链接,并声明引自萌娘百科。内容不可商用。
跳转到导航 跳转到搜索

一点小建议

这样没法转换促音,可不可以做一个模块然后输出罗马音?--東東君讨论) 2018年5月26日 (六) 14:58 (CST)

日语盲无能为力,我连促音原理都不知道= = -- 宇文西修ิิۣۣۖۖۖ特拉瑟 2018年5月26日 (六) 15:48 (CST)
好厉害...我都没想出怎么在wikitext里写_(:з」∠)_ 另外:像「けっしょう」、「ふっきゅう」这种促音后面跟拗音的无法转换,希望可以修复。--東東君讨论) 2018年5月26日 (六) 17:52 (CST)
好吧一个问题解决了又来一个问题= =待我先缓会儿 -- 宇文西修ิิۣۣۖۖۖ特拉瑟 2018年5月26日 (六) 18:00 (CST)
如果不嫌弃的话也可以试一下我刚才写的模块:模块:Sandbox/東東君/sandbox,之前本来想写完后引入的,结果发现你已经把促音的转换写出来了--東東君讨论) 2018年5月26日 (六) 18:19 (CST)
有模块的话就好多了,本来也想挊模块来着,可惜不熟,怕耽搁时间。。另外还有一些没实现的,你看帮助:沙盒 -- 宇文西修ิิۣۣۖۖۖ特拉瑟 2018年5月26日 (六) 18:41 (CST)
要解决最后一个问题那就得全部在模块里进行了,其实我之前也想写一个这种功能的模块的,结果日语那些音打到na行,想到还有拗音那些就不想打了,这次数据都有了想办法做出来吧--東東君讨论) 2018年5月26日 (六) 19:14 (CST)
辛苦了,效果很赞!其实我原本只是想做个假名读音一一对应的查询器来着,结果到最后越来越复杂。。 -- 宇文西修ิิۣۣۖۖۖ特拉瑟 2018年5月27日 (日) 00:00 (CST)

促音问题

查了下促音っ只出现在か行、さ行、た行、ぱ行前面。所以我之前那个模板只是在这几行假名那写了特例实现。在模块里可以单独标注出来,这样就不会出现错误促音也被识别的情况了。

另外加促音之后部分读音写法会变,比如し/シ(shi)变为ssi,ち/チ(chi)变为tti,つ/ツ(tsu)变为ttu,得单独写个特例。 -- 宇文西修ิิۣۣۖۖۖ特拉瑟 2018年5月27日 (日) 11:44 (CST)

你试一下吧,最后一个有些不了解呢,我没有系统地学习过日语,查了一下也没查到,就按照sshi → ssi, cchi → tti, ttsu → ttu这种直接替换了--東東君讨论) 2018年5月27日 (日) 13:10 (CST)
促音不止出现在这四行前面,也存在一些特例,如ッグ(bag, baggu)・キッズ(kids, kizzu)・ウェッブ(=ウェブ, webbu)。它们虽然是特例,但也是可能出现的,尤其是现在的日本人滥用促音的很多。这些音我建议的处理方式是:(输入法能打出来的就双写,打不出来就不双写)
っあ っか っが っさ っざ った っだ っな っは っば っぱ っま っや っら っわ っん
a kka gga ssa zza tta dda na hha bba ppa mma yya rra wwa n
实际情况要比这复杂得多。比如想在AQUARIUM恋爱#歌词的最后一行,原句“だいきよもうかくさない!”(歌词本上真的就是这样写的),其中的促音很明显只是断句用的,不能双写。
现在在日本对日语的罗马字注音有好几种,参看jawp:ローマ字。我也没有系统地区分过这几种,也不知道哪种更常用(我自己一般用的是每组第一个),简单地列举一下其中关于し・ち・つ的几种常见罗马字:

し shi・si
ち chi・ti
つ tsu・tu


じ ji・zi
ぢ ji・di・zi
づ zu・du


しゃ sha・sya
じゃ ja・zya・jya
ちゃ cha・tya・cya
ぢゃ ja・dya・zya・jya

っし sshi・ssi
っち cchi・tchi・tti
っつ ttsu・ttu


っじ jji・zzi
っぢ jji・ddi・zzi
っづ zzu・ddu


っしゃ ssha・ssya
っじゃ jja・zzya・jjya
っちゃ ccha・tcha・ttya・ccya
っぢゃ jja・ddya・zzya・jjya

おお oo・ō・ô・oh・o-・ou

还有一些问题:
有关隔音符号的问题,大概可以试试识别“んン”接“あいうえおアイウエオ”的组合,单独列出,一共20种。如んあ→n'a。
开头就出现的小写假名,如“”“”这样的;不按常理出牌的假名:如“たょ”“ずゅるぃいっょ”之类的。一般都是直接将其视作大写假名注音。(不信看这里→niconiconi:“にっこにっこに~ぬぃ~ぬぃ~ぬぃ~”“にこにーはみんなのも”)
は・へ两个助词注音(wa・e)应该是无解的,连谷歌翻译有时都分不清哪个是不是助词。还有一种情况是专有注音,“这个人名就是要搞特殊”:東條とうじょう Tōjō絵里えり Eli、にこ Nico。所以写上“注音可能有误”的提示还是很有必要的。— 葫芦又留言 2018年5月27日 (日) 20:49 (CST)
感觉这个越弄越复杂的趋势和最开始的想法越来越远了。。。 -- 宇文西修ิิۣۣۖۖۖ特拉瑟 2018年5月27日 (日) 21:59 (CST)
emmmmmm,首先这个模板也只能是转换转换人名之类的,其他再复杂的基本是用不了。第二要以传入的是符合规范的日语为前提,因为语言这种东西实在是太多变了(其实之前做的那些容错我感觉都是不必要的,因为既然传进来的就是有误的、不规范的,那自然输入也不可能正常啊,强行给掰正常反而不能发现错误了)。第三不需要过多关注拉丁字母外来语的片假名,因为这个本来在转换中就应该变回它的源语言,机械地转换为罗马音反而是错的。
所以,我认为其他口语化的、怪异的用法还有外来语先不考虑,多种罗马音标注的可以统一一个方案使用,隔音符号可以实现,指定促音行的限制放宽或解除。--東東君讨论) 2018年5月27日 (日) 22:29 (CST)
其实我本来还想反向转换来着。。。。 -- 宇文西修ิิۣۣۖۖۖ特拉瑟 2018年5月28日 (一) 09:42 (CST)

平文式统一化

看来想把这个模板做到完美可能本来就是个错误的想法……
仔细读了维基百科,大概整理如下:日语罗马字现在一般有三种:训令式、平文式、日本式,其中平文式和日本式都经过了改良或修正。
训令式 平文式 日本式
si shi si
zi ji zi
ti chi ti(旧) ci(新)
(zi) (ji) di
tu tsu tu(旧) cu(新)
(zu) (zu) du
hu fu hu
しゃ sya sha sya
じゃ zya ja zya
ちゃ tya cha tya(旧) cya(新)
ぢゃ (zya) (ja) dya
てぃ (tei) tei(旧) ti(修正) (tei)
おお ô o・oo・oh(旧) ō(修正) ô・ō・oo
んあ n'a na(旧) n'a(修正) n'a
っち tti tchi tti
现在最通行的是平文式(ヘボン式),而且是新旧平文式混用(そっちのおおきいパーティーじゃないんよ → Sotchi no ooki pa-ti- ja nain'yo),但教学中通常使用训令式。但我好像没有找到“jya”这种写法。除了这个jya和tti,现在这个模板都是使用的平文式。
上面这个例子里又出现了一个问题:隔音符号也会出现在や・ゆ・よ前,んや→n'ya。当然还有,虽然一般这里会是有空格隔开的。ゐ・ゑ也逃不过……
顺便问一下tja是什么的缩写啊……— 葫芦又留言 2018年5月29日 (二) 01:37 (CST)
enwp:Transcription into Japanese_yoonhɑkcher留言 2018年5月29日 (二) 09:20 (CST)

按你的这个表改了一下,现在除了外来语片假名其他都是平文式了。--東東君讨论) 2018年5月29日 (二) 09:07 (CST)

隔音符号问题

隔音符号的插入貌似有问题,参见沙盒,有n'ha、n'so、n'ta、n'cho、n'no、n'de、n'te、n'ko、n'wo等不需要隔音的地方仍插入隔音符号。_yoonhɑkcher留言 2018年5月29日 (二) 11:23 (CST)

bug修不明白了...现在的问题就是,只要一句中出现需要加隔音符号的地方,所有的n后面就都会被加上隔音,可是我明明都写了每轮只替换1次mw.ustring.gsub(roma, '[んン]', "n'", 1),有点弄不明白--東東君讨论) 2018年5月29日 (二) 13:58 (CST)
已修复--東東君讨论) 2018年5月29日 (二) 16:49 (CST)

长音问题

一个变化更为复杂的问题来了。平文式假名的长音出现的地方除了在长音符()上之外,还有一些处于单个汉字内的连音,而其他情况下则需要照写。恕我词穷,具体情况请看沙盒_yoonhɑkcher留言 2018年5月29日 (二) 18:10 (CST)

感觉要是实现了这个功能,我们离做出个输入法也不远了...--東東君讨论) 2018年5月29日 (二) 18:38 (CST)
目前是u + u、o + o必然转换为长音,要不要统一一下把o + u也加入转换,或者全不转换。--東東君讨论) 2018年5月29日 (二) 21:30 (CST)
我觉得应该可以使用默认全部转换长音符,然后通过手动插入空格等方式实现汉字与其他部件的拆分。比如こう→kōma, うま→kouma。_yoonhɑkcher留言 2018年5月30日 (三) 15:32 (CST)
改完了,用的是手动插入'(半角单引号),要是用空格的话,输入的空格不管是不是拆分读音都会被吞掉。--東東君讨论) 2018年5月31日 (四) 15:28 (CST)
辛苦了,感谢。_yoonhɑkcher留言 2018年5月31日 (四) 17:29 (CST)
拆分读音可否放在替换长音符工序之后?现在きょうとうアニメーション拆分读音之后会输出kyō to u a n i me - sho n_yoonhɑkcher留言 2018年5月31日 (四) 20:27 (CST)

完成,不过用的是判断s是否等于1,若为真,则不进行hebon中的替换。--東東君讨论) 2018年6月1日 (五) 07:24 (CST)