模板讨论:Tja
一点小建议
这样没法转换促音,可不可以做一个模块然后输出罗马音?--东东君(讨论) 2018年5月26日 (六) 14:58 (CST)
- 日语盲无能为力,我连促音原理都不知道= = -- 宇文西修ิิۣۣۖۖۖ特拉瑟☺ 2018年5月26日 (六) 15:48 (CST)
- 好厉害...我都没想出怎么在wikitext里写_(:з」∠)_ 另外:像「けっしょう」、「ふっきゅう」这种促音后面跟拗音的无法转换,希望可以修复。--东东君(讨论) 2018年5月26日 (六) 17:52 (CST)
- 好吧一个问题解决了又来一个问题= =待我先缓会儿 -- 宇文西修ิิۣۣۖۖۖ特拉瑟☺ 2018年5月26日 (六) 18:00 (CST)
- 如果不嫌弃的话也可以试一下我刚才写的模块:模块:Sandbox/东东君/sandbox,之前本来想写完后引入的,结果发现你已经把促音的转换写出来了--东东君(讨论) 2018年5月26日 (六) 18:19 (CST)
- 好吧一个问题解决了又来一个问题= =待我先缓会儿 -- 宇文西修ิิۣۣۖۖۖ特拉瑟☺ 2018年5月26日 (六) 18:00 (CST)
- 好厉害...我都没想出怎么在wikitext里写_(:з」∠)_ 另外:像「けっしょう」、「ふっきゅう」这种促音后面跟拗音的无法转换,希望可以修复。--东东君(讨论) 2018年5月26日 (六) 17:52 (CST)
- 有模块的话就好多了,本来也想挊模块来着,可惜不熟,怕耽搁时间。。另外还有一些没实现的,你看帮助:沙盒 -- 宇文西修ิิۣۣۖۖۖ特拉瑟☺ 2018年5月26日 (六) 18:41 (CST)
- 要解决最后一个问题那就得全部在模块里进行了,其实我之前也想写一个这种功能的模块的,结果日语那些音打到na行,想到还有拗音那些就不想打了,这次数据都有了想办法做出来吧--东东君(讨论) 2018年5月26日 (六) 19:14 (CST)
- 辛苦了,效果很赞!其实我原本只是想做个假名读音一一对应的查询器来着,结果到最后越来越复杂。。 -- 宇文西修ิิۣۣۖۖۖ特拉瑟☺ 2018年5月27日 (日) 00:00 (CST)
- 要解决最后一个问题那就得全部在模块里进行了,其实我之前也想写一个这种功能的模块的,结果日语那些音打到na行,想到还有拗音那些就不想打了,这次数据都有了想办法做出来吧--东东君(讨论) 2018年5月26日 (六) 19:14 (CST)
促音问题
查了下促音っ只出现在か行、さ行、た行、ぱ行前面。所以我之前那个模板只是在这几行假名那写了特例实现。在模块里可以单独标注出来,这样就不会出现错误促音也被识别的情况了。
另外加促音之后部分读音写法会变,比如し/シ(shi)变为ssi,ち/チ(chi)变为tti,つ/ツ(tsu)变为ttu,得单独写个特例。 -- 宇文西修ิิۣۣۖۖۖ特拉瑟☺ 2018年5月27日 (日) 11:44 (CST)
- 你试一下吧,最后一个有些不了解呢,我没有系统地学习过日语,查了一下也没查到,就按照sshi → ssi, cchi → tti, ttsu → ttu这种直接替换了--东东君(讨论) 2018年5月27日 (日) 13:10 (CST)
- 促音不止出现在这四行前面,也存在一些特例,如バッグ(bag, baggu)・キッズ(kids, kizzu)・ウェッブ(=ウェブ, webbu)。它们虽然是特例,但也是可能出现的,尤其是现在的日本人滥用促音的很多。这些音我建议的处理方式是:(输入法能打出来的就双写,打不出来就不双写)
っあ | っか | っが | っさ | っざ | った | っだ | っな | っは | っば | っぱ | っま | っや | っら | っわ | っん |
a | kka | gga | ssa | zza | tta | dda | na | hha | bba | ppa | mma | yya | rra | wwa | n |
- 实际情况要比这复杂得多。比如想在AQUARIUM恋爱#歌词的最后一行,原句“
大( )好( )きよっもうかくさない!”(歌词本上真的就是这样写的),其中的促音很明显只是断句用的,不能双写。
- 现在在日本对日语的罗马字注音有好几种,参看jawp:ローマ字。我也没有系统地区分过这几种,也不知道哪种更常用(我自己一般用的是每组第一个),简单地列举一下其中关于し・ち・つ的几种常见罗马字:
し shi・si
ち chi・ti
つ tsu・tu
じ ji・zi
ぢ ji・di・zi
づ zu・du
しゃ sha・sya
じゃ ja・zya・jya
ちゃ cha・tya・cya
ぢゃ ja・dya・zya・jya
っし sshi・ssi
っち cchi・tchi・tti
っつ ttsu・ttu
っじ jji・zzi
っぢ jji・ddi・zzi
っづ zzu・ddu
っしゃ ssha・ssya
っじゃ jja・zzya・jjya
っちゃ ccha・tcha・ttya・ccya
っぢゃ jja・ddya・zzya・jjya
おお oo・ō・ô・oh・o-・ou
- 还有一些问题:
- 有关隔音符号的问题,大概可以试试识别“んン”接“あいうえおアイウエオ”的组合,单独列出,一共20种。如んあ→n'a。
- 开头就出现的小写假名,如“ぁ”“ょ”这样的;不按常理出牌的假名:如“たょ”“ずゅるぃいっょ”之类的。一般都是直接将其视作大写假名注音。(不信看这里→niconiconi:“にっこにっこに~ぬぃ~ぬぃ~ぬぃ~”“にこにーはみんなのもっの”)
- 给は・へ两个助词注音(wa·e)应该是无解的,连谷歌翻译有时都分不清哪个は是不是助词。还有一种情况是专有注音,“这个人名就是要搞特殊”:
東條( ) Tōjō、絵里( ) Eli、にこ Nico。所以写上“注音可能有误”的提示还是很有必要的。— 葫芦又留言 2018年5月27日 (日) 20:49 (CST)- 感觉这个越弄越复杂的趋势和最开始的想法越来越远了。。。 -- 宇文西修ิิۣۣۖۖۖ特拉瑟☺ 2018年5月27日 (日) 21:59 (CST)
- emmmmmm,首先这个模板也只能是转换转换人名之类的,其他再复杂的基本是用不了。第二要以传入的是符合规范的日语为前提,因为语言这种东西实在是太多变了(其实之前做的那些容错我感觉都是不必要的,因为既然传进来的就是有误的、不规范的,那自然输入也不可能正常啊,强行给掰正常反而不能发现错误了)。第三不需要过多关注拉丁字母外来语的片假名,因为这个本来在转换中就应该变回它的源语言,机械地转换为罗马音反而是错的。
- 所以,我认为其他口语化的、怪异的用法还有外来语先不考虑,多种罗马音标注的可以统一一个方案使用,隔音符号可以实现,指定促音行的限制放宽或解除。--东东君(讨论) 2018年5月27日 (日) 22:29 (CST)
- 其实我本来还想反向转换来着。。。。 -- 宇文西修ิิۣۣۖۖۖ特拉瑟☺ 2018年5月28日 (一) 09:42 (CST)
- 感觉这个越弄越复杂的趋势和最开始的想法越来越远了。。。 -- 宇文西修ิิۣۣۖۖۖ特拉瑟☺ 2018年5月27日 (日) 21:59 (CST)
平文式统一化
- 看来想把这个模板做到完美可能本来就是个错误的想法……
- 仔细读了维基百科,大概整理如下:日语罗马字现在一般有三种:训令式、平文式、日本式,其中平文式和日本式都经过了改良或修正。
训令式 | 平文式 | 日本式 | |
---|---|---|---|
し | si | shi | si |
じ | zi | ji | zi |
ち | ti | chi | ti(旧) ci(新) |
ぢ | (zi) | (ji) | di |
つ | tu | tsu | tu(旧) cu(新) |
づ | (zu) | (zu) | du |
ふ | hu | fu | hu |
しゃ | sya | sha | sya |
じゃ | zya | ja | zya |
ちゃ | tya | cha | tya(旧) cya(新) |
ぢゃ | (zya) | (ja) | dya |
てぃ | (tei) | tei(旧) ti(修正) | (tei) |
おお | ô | o·oo·oh(旧) ō(修正) | ô·ō·oo |
んあ | n'a | na(旧) n'a(修正) | n'a |
っち | tti | tchi | tti |
- 现在最通行的是平文式(ヘボン式),而且是新旧平文式混用(そっちのおおきいパーティーじゃないんよ → Sotchi no ooki pa-ti- ja nain'yo),但教学中通常使用训令式。但我好像没有找到“jya”这种写法。除了这个jya和tti,现在这个模板都是使用的平文式。
- 上面这个例子里又出现了一个问题:隔音符号也会出现在や・ゆ・よ前,んや→n'ya。当然还有を,虽然一般这里会是有空格隔开的。ゐ・ゑ也逃不过……
- 顺便问一下tja是什么的缩写啊……— 葫芦又留言 2018年5月29日 (二) 01:37 (CST)
- enwp:Transcription into Japanese?_yoonhɑkcher(留言) 2018年5月29日 (二) 09:20 (CST)
按你的这个表改了一下,现在除了外来语片假名其他都是平文式了。--东东君(讨论) 2018年5月29日 (二) 09:07 (CST)
隔音符号问题
隔音符号的插入貌似有问题,参见沙盒,有n'ha、n'so、n'ta、n'cho、n'no、n'de、n'te、n'ko、n'wo等不需要隔音的地方仍插入隔音符号。_yoonhɑkcher(留言) 2018年5月29日 (二) 11:23 (CST)
- bug修不明白了...现在的问题就是,只要一句中出现需要加隔音符号的地方,所有的n后面就都会被加上隔音,可是我明明都写了每轮只替换1次
mw.ustring.gsub(roma, '[んン]', "n'", 1)
,有点弄不明白--东东君(讨论) 2018年5月29日 (二) 13:58 (CST) - 已修复--东东君(讨论) 2018年5月29日 (二) 16:49 (CST)
长音问题
一个变化更为复杂的问题来了。平文式假名的长音出现的地方除了在长音符(ー)上之外,还有一些处于单个汉字内的连音,而其他情况下则需要照写。恕我词穷,具体情况请看沙盒。_yoonhɑkcher(留言) 2018年5月29日 (二) 18:10 (CST)
- 感觉要是实现了这个功能,我们离做出个输入法也不远了...--东东君(讨论) 2018年5月29日 (二) 18:38 (CST)
- 目前是u + u、o + o必然转换为长音,要不要统一一下把o + u也加入转换,或者全不转换。--东东君(讨论) 2018年5月29日 (二) 21:30 (CST)
- 我觉得应该可以使用默认全部转换长音符,然后通过手动插入空格等方式实现汉字与其他部件的拆分。比如
紅( )魔( )→kōma,子( )馬( )→kouma。_yoonhɑkcher(留言) 2018年5月30日 (三) 15:32 (CST)- 改完了,用的是手动插入
'
(半角单引号),要是用空格的话,输入的空格不管是不是拆分读音都会被吞掉。--东东君(讨论) 2018年5月31日 (四) 15:28 (CST)- 辛苦了,感谢。_yoonhɑkcher(留言) 2018年5月31日 (四) 17:29 (CST)
- 拆分读音可否放在替换长音符工序之后?现在
きょうとうアニメーション
拆分读音之后会输出kyō to u a n i me - sho n
。_yoonhɑkcher(留言) 2018年5月31日 (四) 20:27 (CST)
- 改完了,用的是手动插入
- 我觉得应该可以使用默认全部转换长音符,然后通过手动插入空格等方式实现汉字与其他部件的拆分。比如
完成,不过用的是判断s是否等于1,若为真,则不进行hebon
中的替换。--东东君(讨论) 2018年6月1日 (五) 07:24 (CST)