模板讨论:Tja

一点小建议

这样没法转换促音，可不可以做一个模块然后输出罗马音？--东东君（讨论） 2018年5月26日 (六) 14:58 (CST)

日语盲无能为力，我连促音原理都不知道= = --

宇文西修ิิۣۣۖۖۖ特拉瑟 ☺ 2018年5月26日 (六) 15:48 (CST)

好厉害...我都没想出怎么在wikitext里写_(:з」∠)_ 另外：像「けっしょう」、「ふっきゅう」这种促音后面跟拗音的无法转换，希望可以修复。--东东君（讨论） 2018年5月26日 (六) 17:52 (CST)

好吧一个问题解决了又来一个问题= =待我先缓会儿 --

宇文西修ิิۣۣۖۖۖ特拉瑟 ☺ 2018年5月26日 (六) 18:00 (CST)

如果不嫌弃的话也可以试一下我刚才写的模块：模块:Sandbox/东东君/sandbox，之前本来想写完后引入的，结果发现你已经把促音的转换写出来了--东东君（讨论） 2018年5月26日 (六) 18:19 (CST)

有模块的话就好多了，本来也想挊模块来着，可惜不熟，怕耽搁时间。。另外还有一些没实现的，你看帮助:沙盒 --

宇文西修ิิۣۣۖۖۖ特拉瑟 ☺ 2018年5月26日 (六) 18:41 (CST)

要解决最后一个问题那就得全部在模块里进行了，其实我之前也想写一个这种功能的模块的，结果日语那些音打到na行，想到还有拗音那些就不想打了，这次数据都有了想办法做出来吧--东东君（讨论） 2018年5月26日 (六) 19:14 (CST)

辛苦了，效果很赞！其实我原本只是想做个假名读音一一对应的查询器来着，结果到最后越来越复杂。。 --

宇文西修ิิۣۣۖۖۖ特拉瑟 ☺ 2018年5月27日 (日) 00:00 (CST)

促音问题

查了下促音っ只出现在か行、さ行、た行、ぱ行前面。所以我之前那个模板只是在这几行假名那写了特例实现。在模块里可以单独标注出来，这样就不会出现错误促音也被识别的情况了。

另外加促音之后部分读音写法会变，比如し/シ(shi)变为ssi，ち/チ(chi)变为tti，つ/ツ(tsu)变为ttu，得单独写个特例。 -- 宇文西修ิิۣۣۖۖۖ特拉瑟 ☺ 2018年5月27日 (日) 11:44 (CST)

你试一下吧，最后一个有些不了解呢，我没有系统地学习过日语，查了一下也没查到，就按照sshi → ssi， cchi → tti， ttsu → ttu这种直接替换了--东东君（讨论） 2018年5月27日 (日) 13:10 (CST)

促音不止出现在这四行前面，也存在一些特例，如バッグ(bag, baggu)・キッズ(kids, kizzu)・ウェッブ(＝ウェブ, webbu)。它们虽然是特例，但也是可能出现的，尤其是现在的日本人滥用促音的很多。这些音我建议的处理方式是：（输入法能打出来的就双写，打不出来就不双写）

っあ	っか	っが	っさ	っざ	った	っだ	っな	っは	っば	っぱ	っま	っや	っら	っわ	っん
a	kka	gga	ssa	zza	tta	dda	na	hha	bba	ppa	mma	yya	rra	wwa	n

实际情况要比这复杂得多。比如想在AQUARIUM恋爱#歌词的最后一行，原句“大（だい）好（す）きよっもうかくさない！”(歌词本上真的就是这样写的)，其中的促音很明显只是断句用的，不能双写。

现在在日本对日语的罗马字注音有好几种，参看jawp:ローマ字。我也没有系统地区分过这几种，也不知道哪种更常用（我自己一般用的是每组第一个），简单地列举一下其中关于し・ち・つ的几种常见罗马字：

し　shi・si
ち　chi・ti
つ　tsu・tu

じ　ji・zi
ぢ　ji・di・zi
づ　zu・du

しゃ　sha・sya
じゃ　ja・zya・jya
ちゃ　cha・tya・cya
ぢゃ　ja・dya・zya・jya

っし　sshi・ssi
っち　cchi・tchi・tti
っつ　ttsu・ttu

っじ　jji・zzi
っぢ　jji・ddi・zzi
っづ　zzu・ddu

っしゃ　ssha・ssya
っじゃ　jja・zzya・jjya
っちゃ　ccha・tcha・ttya・ccya
っぢゃ　jja・ddya・zzya・jjya

おお　oo・ō・ô・oh・o-・ou

还有一些问题：

有关隔音符号的问题，大概可以试试识别“んン”接“あいうえおアイウエオ”的组合，单独列出，一共20种。如んあ→n'a。

开头就出现的小写假名，如“ぁ”“ょ”这样的；不按常理出牌的假名：如“たょ”“ずゅるぃいっょ”之类的。一般都是直接将其视作大写假名注音。（不信看这里→niconiconi：“にっこにっこに～ぬぃ～ぬぃ～ぬぃ～”“にこにーはみんなのもっの”）

给は・へ两个助词注音(wa·e)应该是无解的，连谷歌翻译有时都分不清哪个は是不是助词。还有一种情况是专有注音，“这个人名就是要搞特殊”：東條（とうじょう） Tōjō、絵里（えり） Eli、にこ Nico。所以写上“注音可能有误”的提示还是很有必要的。— 葫芦又留言 2018年5月27日 (日) 20:49 (CST)

感觉这个越弄越复杂的趋势和最开始的想法越来越远了。。。 --

宇文西修ิิۣۣۖۖۖ特拉瑟 ☺ 2018年5月27日 (日) 21:59 (CST)

emmmmmm，首先这个模板也只能是转换转换人名之类的，其他再复杂的基本是用不了。第二要以传入的是符合规范的日语为前提，因为语言这种东西实在是太多变了（其实之前做的那些容错我感觉都是不必要的，因为既然传进来的就是有误的、不规范的，那自然输入也不可能正常啊，强行给掰正常反而不能发现错误了）。第三不需要过多关注拉丁字母外来语的片假名，因为这个本来在转换中就应该变回它的源语言，机械地转换为罗马音反而是错的。

所以，我认为其他口语化的、怪异的用法还有外来语先不考虑，多种罗马音标注的可以统一一个方案使用，隔音符号可以实现，指定促音行的限制放宽或解除。--东东君（讨论） 2018年5月27日 (日) 22:29 (CST)

其实我本来还想反向转换来着。。。。 --

宇文西修ิิۣۣۖۖۖ特拉瑟 ☺ 2018年5月28日 (一) 09:42 (CST)

平文式统一化

看来想把这个模板做到完美可能本来就是个错误的想法……

仔细读了维基百科，大概整理如下：日语罗马字现在一般有三种：训令式、平文式、日本式，其中平文式和日本式都经过了改良或修正。

	训令式	平文式	日本式
し	si	shi	si
じ	zi	ji	zi
ち	ti	chi	ti(旧) ci(新)
ぢ	(zi)	(ji)	di
つ	tu	tsu	tu(旧) cu(新)
づ	(zu)	(zu)	du
ふ	hu	fu	hu
しゃ	sya	sha	sya
じゃ	zya	ja	zya
ちゃ	tya	cha	tya(旧) cya(新)
ぢゃ	(zya)	(ja)	dya
てぃ	(tei)	tei(旧) ti(修正)	(tei)
おお	ô	o·oo·oh(旧) ō(修正)	ô·ō·oo
んあ	n'a	na(旧) n'a(修正)	n'a
っち	tti	tchi	tti

现在最通行的是平文式(ヘボン式)，而且是新旧平文式混用(そっちのおおきいパーティーじゃないんよ → Sotchi no ooki pa-ti- ja nain'yo)，但教学中通常使用训令式。但我好像没有找到“jya”这种写法。除了这个jya和tti，现在这个模板都是使用的平文式。

上面这个例子里又出现了一个问题：隔音符号也会出现在や・ゆ・よ前，んや→n'ya。当然还有を，虽然一般这里会是有空格隔开的。ゐ・ゑ也逃不过……

顺便问一下tja是什么的缩写啊……— 葫芦又留言 2018年5月29日 (二) 01:37 (CST)

enwp:Transcription into Japanese？_yoonhɑkcher（留言） 2018年5月29日 (二) 09:20 (CST)

按你的这个表改了一下，现在除了外来语片假名其他都是平文式了。--东东君（讨论） 2018年5月29日 (二) 09:07 (CST)

隔音符号问题

隔音符号的插入貌似有问题，参见沙盒，有n'ha、n'so、n'ta、n'cho、n'no、n'de、n'te、n'ko、n'wo等不需要隔音的地方仍插入隔音符号。_yoonhɑkcher（留言） 2018年5月29日 (二) 11:23 (CST)

bug修不明白了...现在的问题就是，只要一句中出现需要加隔音符号的地方，所有的n后面就都会被加上隔音，可是我明明都写了每轮只替换1次mw.ustring.gsub(roma, '[んン]', "n'", 1)，有点弄不明白--东东君（讨论） 2018年5月29日 (二) 13:58 (CST)

已修复--东东君（讨论） 2018年5月29日 (二) 16:49 (CST)

长音问题

一个变化更为复杂的问题来了。平文式假名的长音出现的地方除了在长音符（ー）上之外，还有一些处于单个汉字内的连音，而其他情况下则需要照写。恕我词穷，具体情况请看沙盒。_yoonhɑkcher（留言） 2018年5月29日 (二) 18:10 (CST)

感觉要是实现了这个功能，我们离做出个输入法也不远了...--东东君（讨论） 2018年5月29日 (二) 18:38 (CST)

目前是u + u、o + o必然转换为长音，要不要统一一下把o + u也加入转换，或者全不转换。--东东君（讨论） 2018年5月29日 (二) 21:30 (CST)

我觉得应该可以使用默认全部转换长音符，然后通过手动插入空格等方式实现汉字与其他部件的拆分。比如紅（こう）魔（ま）→kōma，子（こ）馬（うま）→kouma。_yoonhɑkcher（留言） 2018年5月30日 (三) 15:32 (CST)

改完了，用的是手动插入'(半角单引号)，要是用空格的话，输入的空格不管是不是拆分读音都会被吞掉。--东东君（讨论） 2018年5月31日 (四) 15:28 (CST)

辛苦了，感谢。_yoonhɑkcher（留言） 2018年5月31日 (四) 17:29 (CST)

拆分读音可否放在替换长音符工序之后？现在きょうとうアニメーション拆分读音之后会输出kyō to u a n i me - sho n。_yoonhɑkcher（留言） 2018年5月31日 (四) 20:27 (CST)

完成，不过用的是判断s是否等于1，若为真，则不进行hebon中的替换。--东东君（讨论） 2018年6月1日 (五) 07:24 (CST)

模板讨论:Tja

目录

一点小建议

促音问题

平文式统一化

隔音符号问题

长音问题

导航菜单

模板讨论:Tja

一点小建议

促音问题

平文式统一化

隔音符号问题

长音问题

导航菜单

搜索