2023年政策修订增补工作正在进行中,欢迎参与!
  • Moegirl.ICU:萌娘百科流亡社群 581077156(QQ),欢迎对萌娘百科运营感到失望的编辑者加入
  • Moegirl.ICU:账号认领正在试运行,有意者请参照账号认领流程

模板討論:Tja

萌娘百科,萬物皆可萌的百科全書!轉載請標註來源頁面的網頁連結,並聲明引自萌娘百科。內容不可商用。
跳至導覽 跳至搜尋

一點小建議

這樣沒法轉換促音,可不可以做一個模塊然後輸出羅馬音?--東東君討論) 2018年5月26日 (六) 14:58 (CST)

日語盲無能為力,我連促音原理都不知道= = -- 宇文西修ิิۣۣۖۖۖ特拉瑟 2018年5月26日 (六) 15:48 (CST)
好厲害...我都沒想出怎麼在wikitext里寫_(:з」∠)_ 另外:像「けっしょう」、「ふっきゅう」這種促音後面跟拗音的無法轉換,希望可以修復。--東東君討論) 2018年5月26日 (六) 17:52 (CST)
好吧一個問題解決了又來一個問題= =待我先緩會兒 -- 宇文西修ิิۣۣۖۖۖ特拉瑟 2018年5月26日 (六) 18:00 (CST)
如果不嫌棄的話也可以試一下我剛才寫的模塊:模塊:Sandbox/東東君/sandbox,之前本來想寫完後引入的,結果發現你已經把促音的轉換寫出來了--東東君討論) 2018年5月26日 (六) 18:19 (CST)
有模塊的話就好多了,本來也想挊模塊來著,可惜不熟,怕耽擱時間。。另外還有一些沒實現的,你看幫助:沙盒 -- 宇文西修ิิۣۣۖۖۖ特拉瑟 2018年5月26日 (六) 18:41 (CST)
要解決最後一個問題那就得全部在模塊里進行了,其實我之前也想寫一個這種功能的模塊的,結果日語那些音打到na行,想到還有拗音那些就不想打了,這次數據都有了想辦法做出來吧--東東君討論) 2018年5月26日 (六) 19:14 (CST)
辛苦了,效果很贊!其實我原本只是想做個假名讀音一一對應的查詢器來著,結果到最後越來越複雜。。 -- 宇文西修ิิۣۣۖۖۖ特拉瑟 2018年5月27日 (日) 00:00 (CST)

促音問題

查了下促音っ只出現在か行、さ行、た行、ぱ行前面。所以我之前那個模板只是在這幾行假名那寫了特例實現。在模塊里可以單獨標註出來,這樣就不會出現錯誤促音也被識別的情況了。

另外加促音之後部分讀音寫法會變,比如し/シ(shi)變為ssi,ち/チ(chi)變為tti,つ/ツ(tsu)變為ttu,得單獨寫個特例。 -- 宇文西修ิิۣۣۖۖۖ特拉瑟 2018年5月27日 (日) 11:44 (CST)

你試一下吧,最後一個有些不了解呢,我沒有系統地學習過日語,查了一下也沒查到,就按照sshi → ssi, cchi → tti, ttsu → ttu這種直接替換了--東東君討論) 2018年5月27日 (日) 13:10 (CST)
促音不止出現在這四行前面,也存在一些特例,如ッグ(bag, baggu)・キッズ(kids, kizzu)・ウェッブ(=ウェブ, webbu)。它們雖然是特例,但也是可能出現的,尤其是現在的日本人濫用促音的很多。這些音我建議的處理方式是:(輸入法能打出來的就雙寫,打不出來就不雙寫)
っあ っか っが っさ っざ った っだ っな っは っば っぱ っま っや っら っわ っん
a kka gga ssa zza tta dda na hha bba ppa mma yya rra wwa n
實際情況要比這複雜得多。比如想在AQUARIUM戀愛#歌詞的最後一行,原句「だいきよもうかくさない!」(歌詞本上真的就是這樣寫的),其中的促音很明顯只是斷句用的,不能雙寫。
現在在日本對日語的羅馬字注音有好幾種,參看jawp:ローマ字。我也沒有系統地區分過這幾種,也不知道哪種更常用(我自己一般用的是每組第一個),簡單地列舉一下其中關於し・ち・つ的幾種常見羅馬字:

し shi・si
ち chi・ti
つ tsu・tu


じ ji・zi
ぢ ji・di・zi
づ zu・du


しゃ sha・sya
じゃ ja・zya・jya
ちゃ cha・tya・cya
ぢゃ ja・dya・zya・jya

っし sshi・ssi
っち cchi・tchi・tti
っつ ttsu・ttu


っじ jji・zzi
っぢ jji・ddi・zzi
っづ zzu・ddu


っしゃ ssha・ssya
っじゃ jja・zzya・jjya
っちゃ ccha・tcha・ttya・ccya
っぢゃ jja・ddya・zzya・jjya

おお oo・ō・ô・oh・o-・ou

還有一些問題:
有關隔音符號的問題,大概可以試試識別「んン」接「あいうえおアイウエオ」的組合,單獨列出,一共20種。如んあ→n'a。
開頭就出現的小寫假名,如「」「」這樣的;不按常理出牌的假名:如「たょ」「ずゅるぃいっょ」之類的。一般都是直接將其視作大寫假名注音。(不信看這裡→niconiconi:「にっこにっこに~ぬぃ~ぬぃ~ぬぃ~」「にこにーはみんなのも」)
は・へ兩個助詞注音(wa·e)應該是無解的,連谷歌翻譯有時都分不清哪個是不是助詞。還有一種情況是專有注音,「這個人名就是要搞特殊」:東條とうじょう Tōjō絵里えり Eli、にこ Nico。所以寫上「注音可能有誤」的提示還是很有必要的。— 葫蘆又留言 2018年5月27日 (日) 20:49 (CST)
感覺這個越弄越複雜的趨勢和最開始的想法越來越遠了。。。 -- 宇文西修ิิۣۣۖۖۖ特拉瑟 2018年5月27日 (日) 21:59 (CST)
emmmmmm,首先這個模板也只能是轉換轉換人名之類的,其他再複雜的基本是用不了。第二要以傳入的是符合規範的日語為前提,因為語言這種東西實在是太多變了(其實之前做的那些容錯我感覺都是不必要的,因為既然傳進來的就是有誤的、不規範的,那自然輸入也不可能正常啊,強行給掰正常反而不能發現錯誤了)。第三不需要過多關注拉丁字母外來語的片假名,因為這個本來在轉換中就應該變回它的源語言,機械地轉換為羅馬音反而是錯的。
所以,我認為其他口語化的、怪異的用法還有外來語先不考慮,多種羅馬音標註的可以統一一個方案使用,隔音符號可以實現,指定促音行的限制放寬或解除。--東東君討論) 2018年5月27日 (日) 22:29 (CST)
其實我本來還想反向轉換來著。。。。 -- 宇文西修ิิۣۣۖۖۖ特拉瑟 2018年5月28日 (一) 09:42 (CST)

平文式統一化

看來想把這個模板做到完美可能本來就是個錯誤的想法……
仔細讀了維基百科,大概整理如下:日語羅馬字現在一般有三種:訓令式、平文式、日本式,其中平文式和日本式都經過了改良或修正。
訓令式 平文式 日本式
si shi si
zi ji zi
ti chi ti(舊) ci(新)
(zi) (ji) di
tu tsu tu(舊) cu(新)
(zu) (zu) du
hu fu hu
しゃ sya sha sya
じゃ zya ja zya
ちゃ tya cha tya(舊) cya(新)
ぢゃ (zya) (ja) dya
てぃ (tei) tei(舊) ti(修正) (tei)
おお ô o·oo·oh(舊) ō(修正) ô·ō·oo
んあ n'a na(舊) n'a(修正) n'a
っち tti tchi tti
現在最通行的是平文式(ヘボン式),而且是新舊平文式混用(そっちのおおきいパーティーじゃないんよ → Sotchi no ooki pa-ti- ja nain'yo),但教學中通常使用訓令式。但我好像沒有找到「jya」這種寫法。除了這個jya和tti,現在這個模板都是使用的平文式。
上面這個例子裡又出現了一個問題:隔音符號也會出現在や・ゆ・よ前,んや→n'ya。當然還有,雖然一般這裡會是有空格隔開的。ゐ・ゑ也逃不過……
順便問一下tja是什麼的縮寫啊……— 葫蘆又留言 2018年5月29日 (二) 01:37 (CST)
enwp:Transcription into Japanese_yoonhɑkcher留言 2018年5月29日 (二) 09:20 (CST)

按你的這個表改了一下,現在除了外來語片假名其他都是平文式了。--東東君討論) 2018年5月29日 (二) 09:07 (CST)

隔音符號問題

隔音符號的插入貌似有問題,參見沙盒,有n'ha、n'so、n'ta、n'cho、n'no、n'de、n'te、n'ko、n'wo等不需要隔音的地方仍插入隔音符號。_yoonhɑkcher留言 2018年5月29日 (二) 11:23 (CST)

bug修不明白了...現在的問題就是,只要一句中出現需要加隔音符號的地方,所有的n後面就都會被加上隔音,可是我明明都寫了每輪只替換1次mw.ustring.gsub(roma, '[んン]', "n'", 1),有點弄不明白--東東君討論) 2018年5月29日 (二) 13:58 (CST)
已修復--東東君討論) 2018年5月29日 (二) 16:49 (CST)

長音問題

一個變化更為複雜的問題來了。平文式假名的長音出現的地方除了在長音符()上之外,還有一些處於單個漢字內的連音,而其他情況下則需要照寫。恕我詞窮,具體情況請看沙盒_yoonhɑkcher留言 2018年5月29日 (二) 18:10 (CST)

感覺要是實現了這個功能,我們離做出個輸入法也不遠了...--東東君討論) 2018年5月29日 (二) 18:38 (CST)
目前是u + u、o + o必然轉換為長音,要不要統一一下把o + u也加入轉換,或者全不轉換。--東東君討論) 2018年5月29日 (二) 21:30 (CST)
我覺得應該可以使用默認全部轉換長音符,然後通過手動插入空格等方式實現漢字與其他部件的拆分。比如こう→kōma, うま→kouma。_yoonhɑkcher留言 2018年5月30日 (三) 15:32 (CST)
改完了,用的是手動插入'(半角單引號),要是用空格的話,輸入的空格不管是不是拆分讀音都會被吞掉。--東東君討論) 2018年5月31日 (四) 15:28 (CST)
辛苦了,感謝。_yoonhɑkcher留言 2018年5月31日 (四) 17:29 (CST)
拆分讀音可否放在替換長音符工序之後?現在きょうとうアニメーション拆分讀音之後會輸出kyō to u a n i me - sho n_yoonhɑkcher留言 2018年5月31日 (四) 20:27 (CST)

完成,不過用的是判斷s是否等於1,若為真,則不進行hebon中的替換。--東東君討論) 2018年6月1日 (五) 07:24 (CST)