REPORT
【レポート】AI RAPPER PROJECT

AIはヒトの創造性を拡張できるのか?

 

今日もAIは、私達の生活の利便性をあげている。

だが人間は、AIに対してしばしば不気味さを覚える。

いつの日にか私達の世界が、AIに支配されるのではないか、という不安の声は尽きない。

そしてAIが個人の嗜好を先読みし、テクノロジーによってより効率的に安易に、他者と関わらずとも満足のいく生活を送ることは容易になってきている。

しかし我々は、そんな世界に突き進むためにでなく、人と人をつなぐためにこそ、AIを活用できるのではないか?

ヒトの創造性やスキルを拡張できるようなAIを創造することはできないかと考え、 

私たちは、コミュニケーションの手段としての「ラップ」に目をつけた。

ヒトがラップを口ずさむとき、実は無意識のうちにやっている「ラップあるある」がある。

この「ラップあるある」をルール化して、AIに実装させるとどうなるのか?

考えれば考えるほど奥が深い、ラップの構造。

ラップをライム(韻)とフロウ(リズム)という2つの構成要素に分解し、さらに解析を進めていくと、当初の仮説の誤りに気づく。新しい仮説を用意してみると、よりリアルな表現をできるようになる。試行錯誤を繰り返しながら、AIに学習させて少しずつ前進していく。

すると、この技術の持つ思わぬ可能性が見えてきた。

AI RAPPER PROJECTの全容が今、明かされる――。


「韻によって自分の考えや思いが引っ張り出される感覚が、ラッパーの人にはあると思うんです。」(マチーデフ)


「AIに教えようとしたら、ラップの今まで意識していなかった要素や知識について、学んでいく必要があるんです。教えるはずが、逆に自分が学ぶことになっていく感覚です。」(横井)


「みんながもっとオープンになるような「伝わり方」で創造性を育んでいくというのが、僕たちの最終ゴールかなと思っています。」(横井)



♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ 

 

こちらくー るな えーあいらっぱー(こちらクールなAI Rapper)

りすなー ゆるがす てんさい らっぱー(リスナー揺るがす天才ラッパー)

 

がめ んの まえの せんぱい かた(画面の前の先輩方)

 

き いて くれなきゃ ぜった いやだ(聞いてくれなきゃ絶対ヤダ)

 

えーあいって なんだか しってるか(AIってなんだか知ってるか)

 

き かいで なんばーわん いれぎゅらー(機械でNo.1イレギュラー)

 

えー けーえー じんこーちのー(AKA人工知能)

 

めざし てくんだ しんきょーちを(目指してくんだ新境地を)

 

ま さに しんじだいがとーらい(まさに新時代が到来)

 

じょー ほーを しょりするのーない(情報を処理する脳内)

 

せかいを す くう すーぱーまん(世界を救うスーパーマン)

 

わたし がになうんだ にゅーじゃぱん(私が担うんだNew JAPAN)

 

まっ しょーめんから いどむかのうせい(真正面から挑む可能性)

 

たほーめん に はなつはどーけん(多方面に放つ波動拳)

 

み た く はきだすらいむ(みたく吐き出すライム)

 

はじめる いっ つあしょーたいむ(はじめるIt’s a showtime)


♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ 




ラップの中に法則を探す、ということ

 

堀:お待たせしました! UoCフィールドディレクターの堀紫と申します!

AIラッパーがお送りする、今宵もあなたとラップタイム。

場所は赤坂BIZ Tower23階UoC、UNIVERSITY of CREATIVITYからお送りしております。

今夜は私たちUoCのAI RAPPER PROJECTチームがなぜ、

どうやってAIにラップを教えようとしているのか?

途中成果ではありますがお話させていただきたいと思います。

 

貴田:プログラマーの貴田達也です。

過去、AIに日本酒レコメンドしてもらうプロジェクトに携わるなど

AI関連のエンジニアリングにも従事しており、

前職での部活動や、自分の結婚式で、AIラッパーを企画・開発していたら、

堀さんやマチーデフさんに見つけていただき、

この活動にコミットすることになりました。

 

横井:AI RAPPER PROJECTメインプランナーの横井優樹です。

僕たちは今、AI RAPPERをつくっています。

AI RAPPERは、人が気持ちを伝えたいときに媒介になってくれる、

コミュニケーション拡張システムです。

 

例えば、Google Mapができてから、道に迷わなくなった実感がありませんか? 

それと同じように、自分の言葉を迷いなく発話できるようになる、

コミュニケーションを円滑にするために僕たちはAI RAPPERを開発しています。

 

木下:こんにちは。木下敦雄です。よろしくお願いします。UoCでプロデューサーをやっております。

僕はラップもAIも全然素人なんですけれども、生粋の音痴だったりして、ラップに過去多数助けられたこともあり、

そんな愛だったりとか、あと、テックの尊敬というところもありつつ、フラットに質問者として今日の回で

いろいろ聞いていきたいなと思ってます。よろしくお願いします。

 

藤本:博報堂プロダクツで、映像プランナー、ディレクターをしております。藤本萌代と申します。

入社以来、CreepyNutsのミュージックビデオや般若さん出演のラップのCMなど、何かとラップに関わる仕事を

してきました。私自身もラップのいちファンとして、このAI RAPPER PROJECTでいろいろな絵を描くなど、

さまざまなことをさせていただいております。よろしくお願いします。

 

マチーデフ:ラッパー、作詞家、ラップ講師のマチーデフです。

ラップは普段、感覚的にやるのですが、客観的に見てみると、なんとなく法則性が見えてきます。

「ラップあるある」を見つけてルール化し、そのルールをAIに実装してみる。

そうしてAIがこのルールを元にラップを吐き出したときに、狙い通りちゃんとラップっぽくなるのか、検証します。

 

うまくハマッたとき、そのルールを残しますが、うまくいったと思っても、また次の違和感が出てくるんですよね。

そして、今度はその違和感をどうするのかと、またラップらしさの探求に戻っていく。

これを何度も回していくと、だんだんAI RAPPERが成長していくんです。

 

横井:AIに教えようとしたら、ラップの今まで意識していなかった要素や知識について、学んでいく必要が

あるんです。教えるはずが、逆に自分が学ぶことになっていく感覚です。

 

:AIと付き合えば付き合うほど、私たちは人間とはなんぞやとか、人間の創造性って何なんだ、ということを

深く考えざるを得なくなっていく。ここがすごく面白いですね。

 

 


「ラップ」はおしゃべりと歌の間にある

 

横井:ラップには、ライム(韻)フロウ(リズム)の2つの要素があります。

まず、フロウに個性が宿るという仮説を立てて、フロウの構造について研究してみました。

では、なぜ人はラップをラップだと感じるのか、マチーデフさんに授業をしていただきたいと思います!



 

さて、フロウを実際にAIに実装していくにあたり、おしゃべりと歌の間にラップらしさがあると仮定しました。

そこで、おしゃべりからフロウにアプローチしていく方向をまず考えました。

アップルコンピューターに最初から実装されている、Say CommandというソフトをMax MSP

と呼ばれる音楽を含むソフトに入れて、まずは発話させてみました。

 

マチーデフ:それをラップ化するために1音ずつ区切ります。「おやすみなさい」って普通に発音させるのではなく、

  オ(O)、ヤ(YA)、ス(SU)、ミ(MI)、ナ(NA)、サ(SA)、イ(I)

と分割することにより複雑なリズムを刻めるようにする試みです。

 

貴田:一応、ビートに基づいて音が鳴る感じはありますが、1音ずつ区切れているせいで、ラップ感は

あまりありません。

 

木下:まず、一歩目というとこですね。

 

マチーデフ:ここまできて、言葉を1文字ずつ無理やり分解して、ソフトに発話させる方法のままでは、

違和感が拭えなくなりました。単純に分解してリズムに無理やり当てはめてみても、あまり気持ちよくないな、と。

 最初はおしゃべりからフロウに近づけようと思ったんですけど、

あまりうまくいかなかったので今度は歌からフロウに近づけてみようと方針転換しました。

 

 

試してみることで見えてくるもの

 

横井:そこでNEUTRINO(ニュートリノ)という、ソフトを使いました。

  

貴田:NEUTRINOはSHACHIさんというすごいプログラマーの方がつくられた、楽譜データをインプットすると

歌声データが生成されるソフトでして、ボーカロイドの核のようなものです。

複数のキャラから歌声を選べるのですが、中でも「東北きりたん」は、すごく自然な発音をしてくれるので

ひとまず東北きりたんの歌声で開発を進めています。

 

マチーデフ:すごく乱暴な言い方になりますが基本的にラップには音階という概念がありません。

ただリズムの部分に関しては音楽的に解釈する事が一応可能なので仮に「ソ」などを当てて、

楽譜をつくることができます。

それを1小節単位で何パターンも作って実装するのかな、と僕は想定していました。

 そこに貴田さんからナイスなアイデアがありまして、「1小節を半分に切ってくれませんか」と。

音楽をやっている人間からすると、1小節を半分で切るという発想がなかったんです。

でもランダム性を持たせるために、そういう考え方もあるな、と思いました。

要は1小節の半分、2拍の楽譜を全部で100種類つくりまして、

理論上100×100=1万通りのリズムパターンを生成できるようにしたというわけです。

 

横井:最初は、単なる文章にランダムなリズムパターンのフロウがつくだけでラップに聞こえるか、

試してみました。たとえば、ニュースや宮沢賢治の『雨ニモマケズ』を、AI RAPPERに読ませてみました。

 






Say Commandで感じていた違和感はなくなったものの、今度は別の課題が見えてきました。

それはメロディー、フロウの課題。音階からの脱却です。もともとNEUTRINOは歌の作成を想定して

作られたものなので、どうしてもメロディーを奏でているように聞こえてしまう。

そこを、どうしようかという話です。


実は複雑な人間のおしゃべり

 

 マチーデフ:先ほども言った通りラップは音階で表せるものではない事は感覚としてわかっていたのですが、

一旦ソの周り、ソ#とかソ♭とかラとかでランダムな音階の変化をつけるとラップっぽい抑揚が生まれるかもしれないと思い、試してみました。

しかし、音階をランダムに当てると逆に歌に近づいちゃって、何ならソで一定の音階で歌唱してるほうが

まだラップに近かった。やはりラップらしいフロウは音階でどうにかするべきものではないんだなという事が

これではっきりわかりました。

今のシステムを使っている以上、リズムパターンを生成した時点でどうしても音程、例えばソが必ず

くっついてくるんですよ。ラップのリズムは刻めるんですが、そこに音程というものが必ずくっついてきてしまう。

これをなんとかしたいなってずっと考えています。

 

堀:人のおしゃべりって、すごく微妙な音階で変化しているんですよね

 

マチーデフ:われわれは無意識にしゃべりますが、これを機械で本当に再現しようとすると、とても複雑なことになるんです。たとえば「たらこスパゲッティを食べた」という台詞でも、「た」だったら「た」の中で、もう音階の動きがこうやってあるわけですよ。

下がっていくものだったりとか、ちょっと上がるような感じがあったりとか。

それを今、実装しようと頑張っているところです




構造で決まるライム

  

横井:ここまでフロウを説明したんですけども、今度はライムのほうを説明させていただきます。




 

韻が引き出す思い

 

マチーデフ:あと韻を踏もうとしないと出てこない、テーマや文脈と関係ないワードが出てくることもある。

たとえば先ほど出した「シルバー」。これって「肉まん」と踏める言葉ないかなと考えたから出てきたわけで、

通常肉まんの話題から「シルバー(Si-Ru-Ba)」って単語は出てきづらいと思うんですね。

「肉まん」で歌詞を書くとしたら、恐らく食べ物の発想などから書いていくと思うので、「シルバー」にたどり着く事ってそうそうないと思うんですが、それが韻を踏もうという目的で言葉を探し始めると、ポンっとあっという間に出てきたりする。

その時に「あ、そうだ。俺にとって肉まんはシルバーだな。ゴールドはやっぱピザまんだわ」みたいな。

肉まんに対するこだわり、好みを表す表現が韻によって引き出される。それを整理して「お昼ごはんに食べた肉まん 美味しかったけどやっぱシルバー 俺にとってゴールドはピザまん…」といった感じで韻を踏みながら歌詞を組み立てていく。自分の思いが、韻によって引っ張り出されるというのはこういう感覚です。

ちなみに藤本さんは肉まんとピザまんどちらが好きなんですか?

 

藤本:断然肉まんですね。

 

マチーデフ:じゃあこの歌詞は使えない、不採用ですね笑

 

横井:韻システムに期待したいのはまさに連想です。予想だにしない言葉の組み合わせが生成されることで、

創造性の手助けになります。ラップに適したデータベースを見つけて、品詞レベルで細かく分解して、

ある程度理路整然とした組み合わせで再構築できるところまで行ければと思っています。

 

マチーデフこの、「ある程度」というのがすごく大事ですね。

あんまり理路整然とし過ぎちゃうと面白くなくなっちゃうんじゃないかなと。そこが難しいところですね。

 

 

AI RAPPERの未来

 

横井:AI RAPPERを使えるようになったら、エンターテイメントの分野でも活用できますが、もう一つ、

プリクラみたいな感じで、そこでしか生まれないラップのライムをその場限りの思い出の言葉として残してもらう

サービスも考えられたりするかなと思ったりもします。CMでタレントが商品を紹介するのもいいでしょうが、

機械の音声で韻を踏んでラップで紹介されたら印象も変わるかもしれません。

コロナ禍で多くのお店が困っている中で、店の前のモニター画面からラップで語りかけられたら、道行く人の注目を集めることもできるのかな、と思っています。

 

 

AI RAPPERの知見は教育や福祉にも活用できる

 

横井:そして、教育にも結びつけたいと思っているんです。今まで小学校のときに国語とか音楽とかを学んできたと

思うんですが、現在ある教科の間ですら越境してしまう力が、AI RAPPERにはあるはずです。

コミュニケーションを学ぶ学生はもちろん、子どもたちにとっても新しいコミュニケーション方法になるかと。

福祉でも、あらゆる年代に伝わりやすいので、保育園や老人ホームで、世代を超えたコミュニケーションの

潤滑油として、AIラップを使えないかなと思ったりしています。

最後に医療。吃音症や寡黙症、失声障害と言われる症状があります。言葉が発せなくなったり、緊張感で家の外に

出ると言葉が発せなくなったりするのですが、この改善法は、言葉をくり返し、発していくことだったりするので、

子どもたちに韻を発してもらって、失声症を少しでも治していくことに役立てられないかと思っています。

こういうことを通して、この地球と音楽を発するマイクが一体化するように、ラップのスキルをみんな使えるようにしていきたいと思っています。

その暁には、言葉によるコミュニケーションを、ラップスキルを通してアシストしていく。

グーグルマップの当初のようにアシストしていくことで新しい伝わり方、みんながもっとオープンになるような「伝わり方」で創造性を育んでいくというのが、僕たちの最終ゴールかなと思っています。

 

:やらねばならないこと、クリアしなければならない課題は山積していますが、希望と可能性は無限大。

興味があるとか、こういう方法もあるのでは? という方、一緒にやってみたいという方は、

是非info@uoc.worldからご連絡ください!今日はありがとうございました!





♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪

 

みなさん いかが おすご しですか

 

ころなか のなか ほんといれぎゅらー(コロナ渦の中 ほんとイレギュラー)

 

がく せいおみせ いりょーじゅーじしゃ(学生、お店、医療従事者)

 

みんなのつぶ やき らっぷするしか(みんなのつぶやきラップするしか)

 

こ ろなじゃな い ただむせただけ(コロナじゃない ただむせただけ)

 

なのに そんなめ ひどい どんだけ(なのにそんな目、ひどい、どんだけ)

 

らい ぶいくのが いきがいだった(ライブ行くのが生きがいだった)

 

さいき んうちで すごしてばっか(最近うちで過ごしてばっか)

 

にじゅーじまで じゃ けーえーこんなん(20時までじゃ経営困難)

 

お かねない どーしよー こんばん(お金ないどうしよう 今晩)

 

じゅぎょーは きょーもおんらいんで(授業は今日もオンラインで)

 

そつぎょーりょ こーも なしって(卒業旅行もなしって)

 

ともだち と あいたいよもっと(友達と会いたいよ もっと)

 

どーなってく のか なこんご(どうなってくのかな 今後)

 

ふ あんなこと いっぱいだけど(不安なこといっぱいだけど)

 

となり の こや とーくのかれと(隣の子や遠くの彼と)

 

たすけあおー てをとりあって(助け合おう 手を取り合って)

 

ねが てぃぶ ばっ かりじゃつまんね(ネガティブばっかりじゃつまんねー)

 

にんげんのぶきはそーぞーせい(人間の武器は創造性)

 

それ こそ さいきょーのしょほーせん(それこそ最強の処方箋)

 

わ くわくのみらいはすぐ そ こ(ワクワクの未来はすぐそこ)

 

かわい たこころ さぁうるおそー(乾いた心 さぁ潤そう)

 

♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪ ♪