模板討論:Tja

一點小建議

這樣沒法轉換促音，可不可以做一個模塊然後輸出羅馬音？--東東君（討論） 2018年5月26日 (六) 14:58 (CST)

日語盲無能為力，我連促音原理都不知道= = --

宇文西修ิิۣۣۖۖۖ特拉瑟 ☺ 2018年5月26日 (六) 15:48 (CST)

好厲害...我都沒想出怎麼在wikitext里寫_(:з」∠)_ 另外：像「けっしょう」、「ふっきゅう」這種促音後面跟拗音的無法轉換，希望可以修復。--東東君（討論） 2018年5月26日 (六) 17:52 (CST)

好吧一個問題解決了又來一個問題= =待我先緩會兒 --

宇文西修ิิۣۣۖۖۖ特拉瑟 ☺ 2018年5月26日 (六) 18:00 (CST)

如果不嫌棄的話也可以試一下我剛才寫的模塊：模塊:Sandbox/東東君/sandbox，之前本來想寫完後引入的，結果發現你已經把促音的轉換寫出來了--東東君（討論） 2018年5月26日 (六) 18:19 (CST)

有模塊的話就好多了，本來也想挊模塊來著，可惜不熟，怕耽擱時間。。另外還有一些沒實現的，你看幫助:沙盒 --

宇文西修ิิۣۣۖۖۖ特拉瑟 ☺ 2018年5月26日 (六) 18:41 (CST)

要解決最後一個問題那就得全部在模塊里進行了，其實我之前也想寫一個這種功能的模塊的，結果日語那些音打到na行，想到還有拗音那些就不想打了，這次數據都有了想辦法做出來吧--東東君（討論） 2018年5月26日 (六) 19:14 (CST)

辛苦了，效果很贊！其實我原本只是想做個假名讀音一一對應的查詢器來著，結果到最後越來越複雜。。 --

宇文西修ิิۣۣۖۖۖ特拉瑟 ☺ 2018年5月27日 (日) 00:00 (CST)

促音問題

查了下促音っ只出現在か行、さ行、た行、ぱ行前面。所以我之前那個模板只是在這幾行假名那寫了特例實現。在模塊里可以單獨標註出來，這樣就不會出現錯誤促音也被識別的情況了。

另外加促音之後部分讀音寫法會變，比如し/シ(shi)變為ssi，ち/チ(chi)變為tti，つ/ツ(tsu)變為ttu，得單獨寫個特例。 -- 宇文西修ิิۣۣۖۖۖ特拉瑟 ☺ 2018年5月27日 (日) 11:44 (CST)

你試一下吧，最後一個有些不了解呢，我沒有系統地學習過日語，查了一下也沒查到，就按照sshi → ssi， cchi → tti， ttsu → ttu這種直接替換了--東東君（討論） 2018年5月27日 (日) 13:10 (CST)

促音不止出現在這四行前面，也存在一些特例，如バッグ(bag, baggu)・キッズ(kids, kizzu)・ウェッブ(＝ウェブ, webbu)。它們雖然是特例，但也是可能出現的，尤其是現在的日本人濫用促音的很多。這些音我建議的處理方式是：（輸入法能打出來的就雙寫，打不出來就不雙寫）

っあ	っか	っが	っさ	っざ	った	っだ	っな	っは	っば	っぱ	っま	っや	っら	っわ	っん
a	kka	gga	ssa	zza	tta	dda	na	hha	bba	ppa	mma	yya	rra	wwa	n

實際情況要比這複雜得多。比如想在AQUARIUM戀愛#歌詞的最後一行，原句「大（だい）好（す）きよっもうかくさない！」(歌詞本上真的就是這樣寫的)，其中的促音很明顯只是斷句用的，不能雙寫。

現在在日本對日語的羅馬字注音有好幾種，參看jawp:ローマ字。我也沒有系統地區分過這幾種，也不知道哪種更常用（我自己一般用的是每組第一個），簡單地列舉一下其中關於し・ち・つ的幾種常見羅馬字：

し　shi・si
ち　chi・ti
つ　tsu・tu

じ　ji・zi
ぢ　ji・di・zi
づ　zu・du

しゃ　sha・sya
じゃ　ja・zya・jya
ちゃ　cha・tya・cya
ぢゃ　ja・dya・zya・jya

っし　sshi・ssi
っち　cchi・tchi・tti
っつ　ttsu・ttu

っじ　jji・zzi
っぢ　jji・ddi・zzi
っづ　zzu・ddu

っしゃ　ssha・ssya
っじゃ　jja・zzya・jjya
っちゃ　ccha・tcha・ttya・ccya
っぢゃ　jja・ddya・zzya・jjya

おお　oo・ō・ô・oh・o-・ou

還有一些問題：

有關隔音符號的問題，大概可以試試識別「んン」接「あいうえおアイウエオ」的組合，單獨列出，一共20種。如んあ→n'a。

開頭就出現的小寫假名，如「ぁ」「ょ」這樣的；不按常理出牌的假名：如「たょ」「ずゅるぃいっょ」之類的。一般都是直接將其視作大寫假名注音。（不信看這裡→niconiconi：「にっこにっこに～ぬぃ～ぬぃ～ぬぃ～」「にこにーはみんなのもっの」）

給は・へ兩個助詞注音(wa·e)應該是無解的，連谷歌翻譯有時都分不清哪個は是不是助詞。還有一種情況是專有注音，「這個人名就是要搞特殊」：東條（とうじょう） Tōjō、絵里（えり） Eli、にこ Nico。所以寫上「注音可能有誤」的提示還是很有必要的。— 葫蘆又留言 2018年5月27日 (日) 20:49 (CST)

感覺這個越弄越複雜的趨勢和最開始的想法越來越遠了。。。 --

宇文西修ิิۣۣۖۖۖ特拉瑟 ☺ 2018年5月27日 (日) 21:59 (CST)

emmmmmm，首先這個模板也只能是轉換轉換人名之類的，其他再複雜的基本是用不了。第二要以傳入的是符合規範的日語為前提，因為語言這種東西實在是太多變了（其實之前做的那些容錯我感覺都是不必要的，因為既然傳進來的就是有誤的、不規範的，那自然輸入也不可能正常啊，強行給掰正常反而不能發現錯誤了）。第三不需要過多關注拉丁字母外來語的片假名，因為這個本來在轉換中就應該變回它的源語言，機械地轉換為羅馬音反而是錯的。

所以，我認為其他口語化的、怪異的用法還有外來語先不考慮，多種羅馬音標註的可以統一一個方案使用，隔音符號可以實現，指定促音行的限制放寬或解除。--東東君（討論） 2018年5月27日 (日) 22:29 (CST)

其實我本來還想反向轉換來著。。。。 --

宇文西修ิิۣۣۖۖۖ特拉瑟 ☺ 2018年5月28日 (一) 09:42 (CST)

平文式統一化

看來想把這個模板做到完美可能本來就是個錯誤的想法……

仔細讀了維基百科，大概整理如下：日語羅馬字現在一般有三種：訓令式、平文式、日本式，其中平文式和日本式都經過了改良或修正。

	訓令式	平文式	日本式
し	si	shi	si
じ	zi	ji	zi
ち	ti	chi	ti(舊) ci(新)
ぢ	(zi)	(ji)	di
つ	tu	tsu	tu(舊) cu(新)
づ	(zu)	(zu)	du
ふ	hu	fu	hu
しゃ	sya	sha	sya
じゃ	zya	ja	zya
ちゃ	tya	cha	tya(舊) cya(新)
ぢゃ	(zya)	(ja)	dya
てぃ	(tei)	tei(舊) ti(修正)	(tei)
おお	ô	o·oo·oh(舊) ō(修正)	ô·ō·oo
んあ	n'a	na(舊) n'a(修正)	n'a
っち	tti	tchi	tti

現在最通行的是平文式(ヘボン式)，而且是新舊平文式混用(そっちのおおきいパーティーじゃないんよ → Sotchi no ooki pa-ti- ja nain'yo)，但教學中通常使用訓令式。但我好像沒有找到「jya」這種寫法。除了這個jya和tti，現在這個模板都是使用的平文式。

上面這個例子裡又出現了一個問題：隔音符號也會出現在や・ゆ・よ前，んや→n'ya。當然還有を，雖然一般這裡會是有空格隔開的。ゐ・ゑ也逃不過……

順便問一下tja是什麼的縮寫啊……— 葫蘆又留言 2018年5月29日 (二) 01:37 (CST)

enwp:Transcription into Japanese？_yoonhɑkcher（留言） 2018年5月29日 (二) 09:20 (CST)

按你的這個表改了一下，現在除了外來語片假名其他都是平文式了。--東東君（討論） 2018年5月29日 (二) 09:07 (CST)

隔音符號問題

隔音符號的插入貌似有問題，參見沙盒，有n'ha、n'so、n'ta、n'cho、n'no、n'de、n'te、n'ko、n'wo等不需要隔音的地方仍插入隔音符號。_yoonhɑkcher（留言） 2018年5月29日 (二) 11:23 (CST)

bug修不明白了...現在的問題就是，只要一句中出現需要加隔音符號的地方，所有的n後面就都會被加上隔音，可是我明明都寫了每輪只替換1次mw.ustring.gsub(roma, '[んン]', "n'", 1)，有點弄不明白--東東君（討論） 2018年5月29日 (二) 13:58 (CST)

已修復--東東君（討論） 2018年5月29日 (二) 16:49 (CST)

長音問題

一個變化更為複雜的問題來了。平文式假名的長音出現的地方除了在長音符（ー）上之外，還有一些處於單個漢字內的連音，而其他情況下則需要照寫。恕我詞窮，具體情況請看沙盒。_yoonhɑkcher（留言） 2018年5月29日 (二) 18:10 (CST)

感覺要是實現了這個功能，我們離做出個輸入法也不遠了...--東東君（討論） 2018年5月29日 (二) 18:38 (CST)

目前是u + u、o + o必然轉換為長音，要不要統一一下把o + u也加入轉換，或者全不轉換。--東東君（討論） 2018年5月29日 (二) 21:30 (CST)

我覺得應該可以使用默認全部轉換長音符，然後通過手動插入空格等方式實現漢字與其他部件的拆分。比如紅（こう）魔（ま）→kōma，子（こ）馬（うま）→kouma。_yoonhɑkcher（留言） 2018年5月30日 (三) 15:32 (CST)

改完了，用的是手動插入'(半角單引號)，要是用空格的話，輸入的空格不管是不是拆分讀音都會被吞掉。--東東君（討論） 2018年5月31日 (四) 15:28 (CST)

辛苦了，感謝。_yoonhɑkcher（留言） 2018年5月31日 (四) 17:29 (CST)

拆分讀音可否放在替換長音符工序之後？現在きょうとうアニメーション拆分讀音之後會輸出kyō to u a n i me - sho n。_yoonhɑkcher（留言） 2018年5月31日 (四) 20:27 (CST)

完成，不過用的是判斷s是否等於1，若為真，則不進行hebon中的替換。--東東君（討論） 2018年6月1日 (五) 07:24 (CST)

模板討論:Tja

目次

一點小建議

促音問題

平文式統一化

隔音符號問題

長音問題

導覽選單

模板討論:Tja

一點小建議

促音問題

平文式統一化

隔音符號問題

長音問題

導覽選單

搜尋