2024.03.21
- 2019年1月16日
- IT・科学
自動作曲システム「Orpheus」は将来の芸術分野のひとつになる
嵯峨山 茂樹 明治大学 総合数理学部 教授(2019年3月退任)近年、AI(人工知能)の開発が様々な分野で進められています。従来は難しいとされてきた芸術の分野でも様々な形でアプローチされていますが、作詞・作曲をテーマに数理で人の感覚を読み解く研究を行っているのが、本学の嵯峨山研究室です。
確率モデルによる自動作詞
現在、私たちが研究を進めているのが、自動作曲システム「Orpheus」(オルフェウス)です。研究の成果はネット上(www.orpheus-music.org/v3/)で随時公開し、多くの方々に活用してもらっているので、ご存じの方もいらっしゃるかもしれません。いままでに累積で50万曲が作曲され、400万回以上の閲覧があります。
なぜ、私たちが「Orpheus」を開発しているのかといえば、いまや、音楽は非常に多くの人に愛されている音による情報メディアです。しかし、聴くだけでなく、自分で作詞、作曲したいと思っても、そのための理論を学び、スキルを身につけるのは大変です。
そこで、パソコンの簡単な操作で、自動で作詞から、作曲、伴奏演奏が作れ、合成歌唱音声で歌ってくれるシステムの開発を目指したのです。
それは、一般のユーザーの関心も市場も大きいだけでなく、私たちにとっては、芸術の仕組みを解き明かすこと、数理によって人の感覚を解き明かすという試みも含んでいます。
簡単に、「Orpheus」の仕組みを紹介しましょう。システムは、まず、作詞から始まります。ユーザー自身でオリジナルの作詞をすることもできますが、キーワードを3語~5語設定すれば、システムが自動で作詞を行います。
その場合、4行の歌詞が10パターンずつ出てくるので、ユーザーはその中から好きなものを選べますし、選んだものを自分が表現したい歌詞にエディットすることもできます。
この自動作詞の原理は、数理的な方法論による確率的なモデルです。まず、ある単語のあとに隣接する単語を連鎖確率によって推定する、バイグラム(bigram)確率を応用します。
例えば、「雨」という言葉のあとにはどんな単語が来るのか。それは、「が」であったり、「に」であったり、「を」、「は」、「も」などで、それらが来る確率を、大量の言語データから推定します。
さらに、概念としてはあるが、既存の文章データの中にはまずないであろうバイグラム確率にも薄い確率を入れます。すると、「甘い雨」などという表現も作られる可能性が出てきます。
さらに、近い意味の単語が同一文中に共存する単語共起確率も既存データから学習して応用します。例えば、「雨」という単語があると、「雪」という単語が出てくる確率が高いのです。
このバイグラム確率と単語共起確率の積によって文章の生成確率を評価するわけです。
ここで注意すべきは、システムは文章の意味解析を行っているわけではないことです。あくまでも、ある単語に繋がる確率の高い単語を組み合わせているのです。
意味解析は今後の課題ではありますが、私は数理の研究者として、徹底的に確率にこだわるアプローチをとっています。
結果として、できた歌詞は意味のある文章になっているわけではないのですが、最低限の文法をある程度満たし、意味は人に考えさせるようになっています。それが、日常的な会話と異なり、歌詞の世界には合致しているかもしれません。
実際、「夏の桜」だとか、「砂の情熱」などという表現は、なにか意味ありげであり、ユーザーからは、自分の発想になかった表現だと、好評価する声が寄せられています。