音響学会2025秋季研究発表会にて発表(阿部研学生・共著)

News Publication Presentation

2025年9月10日から12日にかけて開催された 日本音響学会 2025秋季研究発表会において, 阿部研究室修士学生による研究発表が行われました.

廣畑和音, 原直, 阿部匡伸, ``WTNet:ウェーブテーブル合成に基づいた軽量なニューラルボコーダ,’’ 日本音響学会講演論文集,’' 日本音響学会講演論文集, 1-Q-50, pp.1031–1034, Sept. 2025. — ポスター発表[2025.9.10], 日本音響学会 2025年秋季研究発表会, 2025.9.10--12

概要

本報告では,ウェーブテーブル合成に基づいた,f0再現性の高い軽量なニューラルボコーダであるWTNetを提案する.提案方式では,入力特徴量から,フレームごとに一周期分の波形を持つウェーブテーブルを推定する.そして,このウェーブテーブルを時系列方向にアップサンプリングし,f0に基づいてサンプルを取り出すことで周期成分の波形を生成する.このアプローチは,周期成分をf0の整数次倍音に限定するDDSPのような手法とは異なり,より柔軟に倍音構造を表現可能にすることを目的としている.また,畳み込みのアーキテクチャとしてConvNeXtを使用することで,VocosやSiFiGANの約100分の1のパラメータ数を実現し,推論速度においてもCPU上でVocosと同程度のRTFを達成した.

参考URL