SMASH corpus / SMASHコーパス
A spontaneous speech corpus recording third-person audio commentaries on gameplay
ゲーム動画の後づけ実況解説音声収録に基づく自発発話音声コーパス
Download / ダウンロード
To avoid overloading the server, direct links are not allowed. If you are unable to download the file from the following links, please retry later.
サーバへの負荷を避けるために直接リンクを禁止しています.以下のリンクからダウンロードできない場合は,時間をおいて再トライしてください.
Description / 内容
This corpus is designed for the establishment of human-entertaining speech technology, and has the following three types of data. All data is synchronized in time. Details are described in our paper.
- Players' conversation during gameplay: Conversational audio of two game players playing Super Smash Bros. Ultimate while talking to each other.
- Game screen capture: screen capture duing gameplay
- Third-person audio commentaries: audio commentary audio to entertain, and its transcripts
本コーパスは,人を楽しませる音声技術の確立に向けて設計されたもので,以下の3種類のデータを有します.全てのデータは時間的に同期しています.詳細は論文に記述されています.
- ゲーム中のプレイヤー音声:2人のゲームプレイヤーが,お互いに会話しながら大乱闘スマッシュブラザーズスペシャルをプレイしたときの会話音声.
- ゲーム画面:プレイ中の画面キャプチャ
- 実況者音声:そのプレイを盛り上げるために,後づけした実況音声,およびその書き起こしデータ
Terms of use / 使い方
All data in the corpus may be used for
- Research by academic institutions
- Non-commercial research, including research conducted within commercial organizations
- Personal use, including blog posts.
Any use that will violate public order and standards of decency are prohibited. Re-distribution is not permitted, but you can upload a part of this corpus (e.g., ~5 audio files) in your website or blog. If possible, please let us know when you revealed papers, blog posts, and others. It will be very helpful to investigate contributions of this corpus.
コーパスに含まれる全データは,以下の場合に限り使用可能です.
- アカデミック機関での研究
- 非商用目的の研究(営利団体での研究も含む)
- 個人での利用(ブログなどを含む)
公序良俗に反する利用は認められていません.音声データの再配布は認められていませんが,あなたのウェブページやブログなどでコーパスの一部(例えば,5文程度)を公開することは可能です.できれば,あなたが論文やブログポスト等の成果を公開した際には,我々まで連絡してもらえると助かります.このコーパスの貢献を調査することは,我々にとって非常に有効な情報となります.
Contributors / 作成者
All contributors are with the University of Tokyo, Japan.
全作成者は東京大学に属します.
Paper / 論文
Please cite the following papers when you refer to our work.
本コーパスを参照する際は,以下の論文を引用して下さい.
- Yuki Saito, Shinnosuke Takamichi, and Hiroshi Saruwatari, "SMASH corpus: a spontaneous speech corpus recording third-person audio commentaries on gameplay," Proc. LREC, pp. 6573--6579, Marseille, France, May 2020. (English)
- 齋藤 佑樹, 高道 慎之介, 猿渡 洋, "SMASHコーパス:ゲーム動画の後付け実況解説音声収録に基づく自発発話音声コーパス," 日本音響学会 2020年春季研究発表会 講演論文集, 1-2-14, pp. 1061--1064, 2020年3月. (日本語)
Acknowledgement / 謝辞
This work is suppored by the followings.
本コーパスの構築は,以下のプロジェクトを受けて実施したものです.
- JSPS KAKENHI Grant Number 18J22090 and 19H01116
Update / 更新
- Jul. 2022: first commit (ver.1.0)