日本語音声合成向けに東京式アクセントを自動推定する自然言語処理ソフト「tdmelodic」がオープンソース化
- 自然言語処理
実績概要
- プロジェクト期間
- 2020/9/18 (OSS公開)
自然言語処理ソフトウエア「tdmelodic」(Tokyo Dialect MELOdic accent DICtionary generator:東京方言高低アクセント辞書ジェネレーター)をオープンソースとして公開いたしました。tdmelodicを使用すると、様々な単語の東京式アクセントを推定することができ、それにより大語彙アクセント辞書を自動生成することができます。この辞書は、より自然に感じられる日本語音声合成などの用途に利用できます。
技術について
本ソフトウエアは、単語の表層形(漢字など、単語が文章中で現れる形)と読み(フリガナ)から、その単語のアクセントを、深層学習に基づく技術により推定するというものです。
本ソフトウエアを、既存のオープンソースの大規模日本語辞書のひとつである「NEologd」などに適用すると、語彙サイズ数百万単語規模の大規模なMeCab用アクセント辞書を一括で自動生成することができます。tdmelodicの活用法の一例として、音声合成システム開発者はまずtdmelodicとNEologdによる自動生成辞書をベースラインとして開発を始め、必要に応じて辞書中の誤りを適宜修正しながら文章読み上げの性能を向上させていく、といった開発プロセスへの活用などが考えられます。
tdmelodicは以下のような機能を提供します。
・日本語の単語の表層形と読みを入力とし、その単語の東京式アクセントを出力する機能
・既存の日本語形態素解析用辞書であるUniDicとNEologdをベースとして、MeCab用の大語彙アクセント辞書を自動生成する機能
本成果は、音声・音響分野のトップカンファレンスであるICASSP2020に採択されております。
Hideyuki Tachibana, Yotaro Katayama. Accent Estimation of Japanese Words from Their Surfaces and Romanizations for Building Large Vocabulary Accent Dictionaries.
担当メンバー
橘 秀幸HIDEYUKI
Tachibana東京大学工学部計数工学科卒。東京大学大学院情報理工学研究科博士課程修了。博士(情報理工学)。明治大学研究員を経て、PKSHA Technologyに参画。主に音声処理、言語処理、信号処理の研究開発に従事。