AmadeuSYを支える技術

AmadeuSY Research Labでは独自に開発した技術を含め以下の技術を使用しています。

専門技術

AI・機械学習

深層学習 (PyTorch, Keras)
歌声合成AIの設計と実装を行っています。独自の工夫により、たった1曲の学習データから、すぐに歌声を作れるようになりました。自分の声をデジタル資産として手軽に活用できる環境を目指しています。VocoderにはWORLDを採用していますが2026年度中をめどに独自技術を採用したVocoderを開発します。
音声信号処理
メルスペクトログラム解析、F0抽出（WORLD, harvest）、位相復元(Griffin-Lim / HiFi-GAN)などの技術を実装しています。また、UTAUで使用される原音設定を自動化するAI原音設定も開発中です。
データセット構築
AI学習用のデータセット作成も行っています。「読唇術 AI」のための音素アノテーションや、対話データ整理、各国から集められた多言語音声データなど質の高いデータを作ることでAIの性能を向上させます。

開発プロジェクト実績

AIキャラクター・リップシンク (ずんだもん)
「ずんだもん」においてAmadeuSYのAI音素ラベリングソフトが使用されSSS合同会社のクラウドファンディングプロジェクトに技術提供という形で協力しました。
歌声合成技術
歌声合成ライブラリのコア部分を開発しています。2021年にコードを0から書き直し、追加のアルゴリズム実装などを行いました。