超要約: リアルな声(「in-the-wild」データ)で、音声技術のセキュリティとサービスを最強にする研究だよ!✨
● 従来のデータじゃなくて、現実世界の音データを使うのがイケてる!😎 ● 偽物の声(偽装音声)を見破る技術も開発するって、セキュリティ最強じゃん?🛡️ ● 金融とかエンタメとか、色んなサービスで役立つ未来が楽しみすぎる💖
背景 音声技術って、AIアシスタントとか色んな所で使われてるけど、偽物の声とかノイズに弱いっていう弱点があったの😢。そこで、もっとリアルな状況(「in-the-wild」)に対応できる技術を開発しようって研究だよ!
方法 現実世界のデータを使って、TTS(音声合成)とSASV(偽装音声検出)の技術を強化するよ!TTSで偽物の声を作って、SASVでそれを検出するっていう、すごい連携プレイも目指してるみたい!
続きは「らくらく論文」アプリで
The WildSpoof Challenge aims to advance the use of in-the-wild data in two intertwined speech processing tasks. It consists of two parallel tracks: (1) Text-to-Speech (TTS) synthesis for generating spoofed speech, and (2) Spoofing-robust Automatic Speaker Verification (SASV) for detecting spoofed speech. While the organizers coordinate both tracks and define the data protocols, participants treat them as separate and independent tasks. The primary objectives of the challenge are: (i) to promote the use of in-the-wild data for both TTS and SASV, moving beyond conventional clean and controlled datasets and considering real-world scenarios; and (ii) to encourage interdisciplinary collaboration between the spoofing generation (TTS) and spoofing detection (SASV) communities, thereby fostering the development of more integrated, robust, and realistic systems.