2023年政策修订增补工作正在进行中,欢迎参与!
  • Moegirl.ICU:萌娘百科流亡社群 581077156(QQ),欢迎对萌娘百科运营感到失望的编辑者加入
  • Moegirl.ICU:账号认领正在试运行,有意者请参照账号认领流程

MoeSS

萌娘百科,萬物皆可萌的百科全書!轉載請標註來源頁面的網頁連結,並聲明引自萌娘百科。內容不可商用。
跳至導覽 跳至搜尋
大萌字.svg
萌娘百科歡迎您參與完善本條目☆Kira~
歡迎正在閱讀這個條目的您協助編輯本條目。編輯前請閱讀Wiki入門條目編輯規範,並查找相關資料。萌娘百科祝您在本站度過愉快的時光。
Ambox currentevent.svg
此頁面中存在需要長期更新的內容及資料列表,現存條目中資料未必是最新。
另請編輯者注意:請不要在人物歷程等相關內容中懸掛此模板。具體使用方法詳見模板說明文檔
Commons-emblem-success.svg
這個條目曾經被作者本人巡迴過甚至就是其親自編寫的。
啊嘞?!
這個ACG相關軟件缺少照片,需要補上……
基本資料
軟件名 Moe Speech Synthesis
其他名字 MoeSS、MioSS、MioTTS、Tacotron2UI
開發者 Ναρουσέ·μ·γιουμεμί·Χινακάννα、MapleSpe
作業系統 Windows
語言 C/C++
軟件類型 開源軟件
許可協議 GPL
首次發佈 1.0.0
穩定版本 4.3.2

MoeSS是由Ναρουσέ·μ·γιουμεμί·Χινακάννα(白葉)基於Onnx框架創作的AI語音合成軟件。

簡介

MoeSS支持的語音項目有:Tacotron2、Vits、Pits、SoVitsSvc、DiffSvc、DiffSinger。相較於Python源項目,其最大的優勢就是不需要安裝依賴就可以執行推理,方便模型訓練者發佈模型以及小白使用模型。

MoeSS在開發過程中經歷了兩次改名,最初的名字為Tacotron2UI,計劃只支持Tacotron2,所以一開始的框架只是為一個項目服務。但是沒想到後期語音領域會有這麼多新的需要支持的東西出現,而這些項目的出現都具有一個時間差,所以並沒有做多項目的計劃和框架,於是代碼越來越屎山。

由於與so-vits-svc面臨着相同問題,MoeSS所有在Bilibili的教程視頻以及大多數在其他平台的教程視頻已經被刪除。

4月3日之後,MoeSS完全重構並將代碼轉移至MoeVS的倉庫中。

開發歷史

2022年
8月6日Tacotron2UI項目正式創建並開始開發1.0版本,該版本基於落憶編寫的推理後端,含有不少複雜的命令行調用,所以性能較差,UI的界面也非常不美觀。
8月8日Tacotron2UI項目更名為MioTTS,發佈1.1版本,該版本拋棄了舊版的推理後端,轉而使用白葉自編寫的推理後端,並且為Vits預留了空位當時沒有支持Vits是因為這個時候白葉還在硬剛Vits的Onnx導出
8月9日MioTTS發佈1.2版本,修改了UI佈局和圖像,並添加了內置播放器。
8月10日MioTTS發佈1.3版本,基於Libtorch框架編寫了Vits單角色模型的推理後端。
8月11日MioTTS發佈1.4版本,支持了Vits的多角色模型,同時增加了英文的TextCleaner。
8月12日MioTTS發佈1.5版本,基於Cjangjengh的日文G2p,增加了日文的TextCleaner。
8月13日MioTTS發佈1.6版本,TextCleaner輸出的結果會提示用戶是否自行修改。
11月11日MioTTS發佈2.0-Alpha版本,並進行了一次徹底的更新,將QT框架替換為MapleSpe開發的UI框架,並由MapleSpe設計了新的界面並將推理後端完全加入至UI,這也成為了MoeSS屎山化的開始
12月19日MioTTS發佈2.0-Beta版本,支持了SoVits的推理。
2023年
1月3日MioTTS項目正式更名為MoeSS,發佈了MoeSS 2.1版本,支持了SoVits推理參數的設置。
1月6日MoeSS發佈2.2版本,模型配置文件改為Json,增加了TextCleaner接口,用戶可以根據自己的需求自行編寫TextCleaner。Vits拋棄了Libtorch,使用OnnxCpu進行推理,推理速度可觀,同時大大縮減了軟件的大小,也大大提高了軟件的可靠性。
1月11日MoeSS發佈2.2.2版本,增加了Vits和SoVits三個參數的設置(長度規模,噪聲規模和Duration噪聲規模)。
1月15日MoeSS發佈2.3版本,支持了SoVits3.0。
1月17日MoeSS發佈2.4版本,增加了模型串聯(套娃)功能,作用是將TTS模型的輸出直接送入SVC的輸入來讓SVC模型實現TTS功能但是效果很差
1月19日MoeSS發佈2.4的多個小版本,更改了SVC參數設置(變為彈窗輸入框),同時進一步優化了Vits的推理程序。
1月22日MoeSS發佈2.5版本,將界面做了一個較大的修改。
1月25日MoeSS發佈3.0版本,支持了DiffSvc,配置文件結構大修,修復了幾個已知的BUG,在謬紗特的建議下做了一些更加人性化的設定,並支持了SoVits和DiffSvc的批量推理。
2月2日MoeSS發佈3.1版本,支持了emotionalVits,支持情感模型多個情感參數的輸入(類似於Stable-DiffusionTag的輸入),Diffusion模型的加速倍率和Step變得可以設置。
2月9日MoeSS發佈3.2版本,支持了CUDA推理。
2月11日MoeSS發佈4.0版本,支持了DiffSinger,支持了白葉分開導出的DiffSinger,加入了文件拖放,鼠標滾輪修改speaker的功能,同時支持了windows7系統。
2月15日MoeSS發佈4.1版本,支持了OpenVpi合併的DiffSinger,並且增加了中日音素轉換功能。
2月22日MoeSS發佈4.2版本,支持了SoVits4.0的V1和V2,修復了已知的BUG。
3月7日MoeSS發佈4.3版本,支持了Pits,加入了一個HTTP伺服器,用來對接串串香火鍋的實時VCVST插件。

註釋及外部連結