UTDUSS: UTokyo-SaruLab System for Interspeech2024 Speech Processing Using Discrete Speech Unit Challenge W Nakata, K Yamauchi, D Yang, H Hyodo, Y Saito arXiv preprint arXiv:2403.13720, 2024 | | 2024 |
VQ-VAE に基づく解釈可能なアクセント潜在変数を用いた多方言音声合成 山内一輝, 齋藤佑樹, 猿渡洋 研究報告音声言語情報処理 (SLP) 2024 (52), 1-6, 2024 | | 2024 |
StyleCap: 音声および言語の自己教師あり学習モデルに基づく音声の発話スタイルに関するキャプション生成 山内一輝, 井島勇祐, 齋藤佑樹 日本音響学会 2024年春季研究発表会 講演論文集, 2024, 3-2-14, 843--846, 2024 | | 2024 |
StyleCap: Automatic Speaking-Style Captioning from Speech Based on Speech and Language Self-supervised Learning Models K Yamauchi, Y Ijima, Y Saito Proc. ICASSP 2024, 2023 | | 2023 |
アクセント潜在変数の予測と制御が可能な TTS モデルによる方言音声合成の検討 山内一輝, 齋藤佑樹, 猿渡洋 日本音響学会 2023年秋季研究発表会 講演論文集, 2-Q-30, 2023, 1255--1256, 2023 | | 2023 |