模板討論:Tja
一點小建議
這樣沒法轉換促音,可不可以做一個模塊然後輸出羅馬音?--東東君(討論) 2018年5月26日 (六) 14:58 (CST)
- 日語盲無能為力,我連促音原理都不知道= = -- 宇文西修ิิۣۣۖۖۖ特拉瑟☺ 2018年5月26日 (六) 15:48 (CST)
- 好厲害...我都沒想出怎麼在wikitext里寫_(:з」∠)_ 另外:像「けっしょう」、「ふっきゅう」這種促音後面跟拗音的無法轉換,希望可以修復。--東東君(討論) 2018年5月26日 (六) 17:52 (CST)
- 好吧一個問題解決了又來一個問題= =待我先緩會兒 -- 宇文西修ิิۣۣۖۖۖ特拉瑟☺ 2018年5月26日 (六) 18:00 (CST)
- 如果不嫌棄的話也可以試一下我剛才寫的模塊:模塊:Sandbox/東東君/sandbox,之前本來想寫完後引入的,結果發現你已經把促音的轉換寫出來了--東東君(討論) 2018年5月26日 (六) 18:19 (CST)
- 好吧一個問題解決了又來一個問題= =待我先緩會兒 -- 宇文西修ิิۣۣۖۖۖ特拉瑟☺ 2018年5月26日 (六) 18:00 (CST)
- 好厲害...我都沒想出怎麼在wikitext里寫_(:з」∠)_ 另外:像「けっしょう」、「ふっきゅう」這種促音後面跟拗音的無法轉換,希望可以修復。--東東君(討論) 2018年5月26日 (六) 17:52 (CST)
- 有模塊的話就好多了,本來也想挊模塊來著,可惜不熟,怕耽擱時間。。另外還有一些沒實現的,你看幫助:沙盒 -- 宇文西修ิิۣۣۖۖۖ特拉瑟☺ 2018年5月26日 (六) 18:41 (CST)
- 要解決最後一個問題那就得全部在模塊里進行了,其實我之前也想寫一個這種功能的模塊的,結果日語那些音打到na行,想到還有拗音那些就不想打了,這次數據都有了想辦法做出來吧--東東君(討論) 2018年5月26日 (六) 19:14 (CST)
- 辛苦了,效果很贊!其實我原本只是想做個假名讀音一一對應的查詢器來著,結果到最後越來越複雜。。 -- 宇文西修ิิۣۣۖۖۖ特拉瑟☺ 2018年5月27日 (日) 00:00 (CST)
- 要解決最後一個問題那就得全部在模塊里進行了,其實我之前也想寫一個這種功能的模塊的,結果日語那些音打到na行,想到還有拗音那些就不想打了,這次數據都有了想辦法做出來吧--東東君(討論) 2018年5月26日 (六) 19:14 (CST)
促音問題
查了下促音っ只出現在か行、さ行、た行、ぱ行前面。所以我之前那個模板只是在這幾行假名那寫了特例實現。在模塊里可以單獨標註出來,這樣就不會出現錯誤促音也被識別的情況了。
另外加促音之後部分讀音寫法會變,比如し/シ(shi)變為ssi,ち/チ(chi)變為tti,つ/ツ(tsu)變為ttu,得單獨寫個特例。 -- 宇文西修ิิۣۣۖۖۖ特拉瑟☺ 2018年5月27日 (日) 11:44 (CST)
- 你試一下吧,最後一個有些不了解呢,我沒有系統地學習過日語,查了一下也沒查到,就按照sshi → ssi, cchi → tti, ttsu → ttu這種直接替換了--東東君(討論) 2018年5月27日 (日) 13:10 (CST)
- 促音不止出現在這四行前面,也存在一些特例,如バッグ(bag, baggu)・キッズ(kids, kizzu)・ウェッブ(=ウェブ, webbu)。它們雖然是特例,但也是可能出現的,尤其是現在的日本人濫用促音的很多。這些音我建議的處理方式是:(輸入法能打出來的就雙寫,打不出來就不雙寫)
っあ | っか | っが | っさ | っざ | った | っだ | っな | っは | っば | っぱ | っま | っや | っら | っわ | っん |
a | kka | gga | ssa | zza | tta | dda | na | hha | bba | ppa | mma | yya | rra | wwa | n |
- 實際情況要比這複雜得多。比如想在AQUARIUM戀愛#歌詞的最後一行,原句「
大( )好( )きよっもうかくさない!」(歌詞本上真的就是這樣寫的),其中的促音很明顯只是斷句用的,不能雙寫。
- 現在在日本對日語的羅馬字注音有好幾種,參看jawp:ローマ字。我也沒有系統地區分過這幾種,也不知道哪種更常用(我自己一般用的是每組第一個),簡單地列舉一下其中關於し・ち・つ的幾種常見羅馬字:
し shi・si
ち chi・ti
つ tsu・tu
じ ji・zi
ぢ ji・di・zi
づ zu・du
しゃ sha・sya
じゃ ja・zya・jya
ちゃ cha・tya・cya
ぢゃ ja・dya・zya・jya
っし sshi・ssi
っち cchi・tchi・tti
っつ ttsu・ttu
っじ jji・zzi
っぢ jji・ddi・zzi
っづ zzu・ddu
っしゃ ssha・ssya
っじゃ jja・zzya・jjya
っちゃ ccha・tcha・ttya・ccya
っぢゃ jja・ddya・zzya・jjya
おお oo・ō・ô・oh・o-・ou
- 還有一些問題:
- 有關隔音符號的問題,大概可以試試識別「んン」接「あいうえおアイウエオ」的組合,單獨列出,一共20種。如んあ→n'a。
- 開頭就出現的小寫假名,如「ぁ」「ょ」這樣的;不按常理出牌的假名:如「たょ」「ずゅるぃいっょ」之類的。一般都是直接將其視作大寫假名注音。(不信看這裡→niconiconi:「にっこにっこに~ぬぃ~ぬぃ~ぬぃ~」「にこにーはみんなのもっの」)
- 給は・へ兩個助詞注音(wa·e)應該是無解的,連谷歌翻譯有時都分不清哪個は是不是助詞。還有一種情況是專有注音,「這個人名就是要搞特殊」:
東條( ) Tōjō、絵里( ) Eli、にこ Nico。所以寫上「注音可能有誤」的提示還是很有必要的。— 葫蘆又留言 2018年5月27日 (日) 20:49 (CST)- 感覺這個越弄越複雜的趨勢和最開始的想法越來越遠了。。。 -- 宇文西修ิิۣۣۖۖۖ特拉瑟☺ 2018年5月27日 (日) 21:59 (CST)
- emmmmmm,首先這個模板也只能是轉換轉換人名之類的,其他再複雜的基本是用不了。第二要以傳入的是符合規範的日語為前提,因為語言這種東西實在是太多變了(其實之前做的那些容錯我感覺都是不必要的,因為既然傳進來的就是有誤的、不規範的,那自然輸入也不可能正常啊,強行給掰正常反而不能發現錯誤了)。第三不需要過多關注拉丁字母外來語的片假名,因為這個本來在轉換中就應該變回它的源語言,機械地轉換為羅馬音反而是錯的。
- 所以,我認為其他口語化的、怪異的用法還有外來語先不考慮,多種羅馬音標註的可以統一一個方案使用,隔音符號可以實現,指定促音行的限制放寬或解除。--東東君(討論) 2018年5月27日 (日) 22:29 (CST)
- 其實我本來還想反向轉換來著。。。。 -- 宇文西修ิิۣۣۖۖۖ特拉瑟☺ 2018年5月28日 (一) 09:42 (CST)
- 感覺這個越弄越複雜的趨勢和最開始的想法越來越遠了。。。 -- 宇文西修ิิۣۣۖۖۖ特拉瑟☺ 2018年5月27日 (日) 21:59 (CST)
平文式統一化
- 看來想把這個模板做到完美可能本來就是個錯誤的想法……
- 仔細讀了維基百科,大概整理如下:日語羅馬字現在一般有三種:訓令式、平文式、日本式,其中平文式和日本式都經過了改良或修正。
訓令式 | 平文式 | 日本式 | |
---|---|---|---|
し | si | shi | si |
じ | zi | ji | zi |
ち | ti | chi | ti(舊) ci(新) |
ぢ | (zi) | (ji) | di |
つ | tu | tsu | tu(舊) cu(新) |
づ | (zu) | (zu) | du |
ふ | hu | fu | hu |
しゃ | sya | sha | sya |
じゃ | zya | ja | zya |
ちゃ | tya | cha | tya(舊) cya(新) |
ぢゃ | (zya) | (ja) | dya |
てぃ | (tei) | tei(舊) ti(修正) | (tei) |
おお | ô | o·oo·oh(舊) ō(修正) | ô·ō·oo |
んあ | n'a | na(舊) n'a(修正) | n'a |
っち | tti | tchi | tti |
- 現在最通行的是平文式(ヘボン式),而且是新舊平文式混用(そっちのおおきいパーティーじゃないんよ → Sotchi no ooki pa-ti- ja nain'yo),但教學中通常使用訓令式。但我好像沒有找到「jya」這種寫法。除了這個jya和tti,現在這個模板都是使用的平文式。
- 上面這個例子裡又出現了一個問題:隔音符號也會出現在や・ゆ・よ前,んや→n'ya。當然還有を,雖然一般這裡會是有空格隔開的。ゐ・ゑ也逃不過……
- 順便問一下tja是什麼的縮寫啊……— 葫蘆又留言 2018年5月29日 (二) 01:37 (CST)
- enwp:Transcription into Japanese?_yoonhɑkcher(留言) 2018年5月29日 (二) 09:20 (CST)
按你的這個表改了一下,現在除了外來語片假名其他都是平文式了。--東東君(討論) 2018年5月29日 (二) 09:07 (CST)
隔音符號問題
隔音符號的插入貌似有問題,參見沙盒,有n'ha、n'so、n'ta、n'cho、n'no、n'de、n'te、n'ko、n'wo等不需要隔音的地方仍插入隔音符號。_yoonhɑkcher(留言) 2018年5月29日 (二) 11:23 (CST)
- bug修不明白了...現在的問題就是,只要一句中出現需要加隔音符號的地方,所有的n後面就都會被加上隔音,可是我明明都寫了每輪只替換1次
mw.ustring.gsub(roma, '[んン]', "n'", 1)
,有點弄不明白--東東君(討論) 2018年5月29日 (二) 13:58 (CST) - 已修復--東東君(討論) 2018年5月29日 (二) 16:49 (CST)
長音問題
一個變化更為複雜的問題來了。平文式假名的長音出現的地方除了在長音符(ー)上之外,還有一些處於單個漢字內的連音,而其他情況下則需要照寫。恕我詞窮,具體情況請看沙盒。_yoonhɑkcher(留言) 2018年5月29日 (二) 18:10 (CST)
- 感覺要是實現了這個功能,我們離做出個輸入法也不遠了...--東東君(討論) 2018年5月29日 (二) 18:38 (CST)
- 目前是u + u、o + o必然轉換為長音,要不要統一一下把o + u也加入轉換,或者全不轉換。--東東君(討論) 2018年5月29日 (二) 21:30 (CST)
- 我覺得應該可以使用默認全部轉換長音符,然後通過手動插入空格等方式實現漢字與其他部件的拆分。比如
紅( )魔( )→kōma,子( )馬( )→kouma。_yoonhɑkcher(留言) 2018年5月30日 (三) 15:32 (CST)- 改完了,用的是手動插入
'
(半角單引號),要是用空格的話,輸入的空格不管是不是拆分讀音都會被吞掉。--東東君(討論) 2018年5月31日 (四) 15:28 (CST)- 辛苦了,感謝。_yoonhɑkcher(留言) 2018年5月31日 (四) 17:29 (CST)
- 拆分讀音可否放在替換長音符工序之後?現在
きょうとうアニメーション
拆分讀音之後會輸出kyō to u a n i me - sho n
。_yoonhɑkcher(留言) 2018年5月31日 (四) 20:27 (CST)
- 改完了,用的是手動插入
- 我覺得應該可以使用默認全部轉換長音符,然後通過手動插入空格等方式實現漢字與其他部件的拆分。比如
完成,不過用的是判斷s是否等於1,若為真,則不進行hebon
中的替換。--東東君(討論) 2018年6月1日 (五) 07:24 (CST)