学問の地平から
教員が語る、研究の最前線
第6回 データサイエンス学
本学の教員は、教育者であると同時に、第一線で活躍する研究者でもあります。本企画では、多彩な教員陣へのインタビューをもとに、最新の研究と各分野の魅力を紹介していきます。
第6回 データサイエンス学データサイエンス学部 データサイエンス学科 中西崇文 准教授
人間は何を感じ、どう表現するかをデータを通じて解明
nakanishi_name
Profile
筑波大学大学院システム情報工学研究科にて博士(工学)の学位取得。2006年より情報通信研究機構 研究員、2014年より国際大学グローバル・コミュニケーション・センター(GLOCOM)准教授・主任研究員、2018年より武蔵野大学工学部数理工学科准教授を経て、2019年現職。  現在、国際大学グローバル・コミュニケーション・センター(GLOCOM)主任研究員、デジタルハリウッド大学大学院客員教授でもある。音楽ユニット「タイアップ」のメンバーとしても活動中 。
私たちは、買い物をする時には「いいな」と感じたものを選び、悲しい映画を見ると深く心を動かされます。人間の行動にさまざまな影響を与える“感性”。人間の感性に沿ってコンピュータが動くようになれば、社会にはこれまでにない新たな価値が生まれる可能性があります。
人間の感性とデータサイエンスを結び、AIを駆使して言葉や音楽のデータから感性を抽出、表現する手法を生み出そうとする、データサイエンス学部の中西崇文准教授の研究を紹介します。
「感性」をキーワードに取り組む3つの研究
「データサイエンス」とは何か
-データで分かった「稼ぎの良いタクシー」の特徴-

突然ですが、みなさんに質問です。街中を走りながら乗客を探す「流し」のタクシーの運転手さんは、どんな乗客が多いと、売上がアップすると思いますか?
1人でも多く乗せた方がいいでしょうか? それとも、料金が高額になる長距離の乗客を乗せた方が効率的に売上を伸ばせるでしょうか?
私は5年前、データサイエンスによって、この問いの答えを見つける研究を行いました。1カ月間、東京都内の「流し」の運転手さんを対象に、乗客を乗せた場所と降ろした場所の記録を取り、そのデータを分析して売上が上がる「コツ」を見つけ出す研究です。
タクシーを利用する時、私たちはなんとなく、近くまでだと申し訳なさを感じたり、長距離で支払いが高額になると「良いお客さん」になった気分を味わったりします。ところが、この研究の結果、イメージとは逆のことが分かりました。遠くへ行く乗客を乗せた運転手さんは売上が落ち、近距離の乗客をたくさん乗せた運転手さんの方が売上が良かったのです。
-従来の科学とデータサイエンスの違い-
これまでの科学は、人間が頭の中でルールや法則、いわゆる「モデル」を作ってきました。ですから、「オームの法則」「シュレーディンガー方程式」というように、有名な法則や公式には作った人の名前がついています。データは、そのモデルが正しいかどうかを検証するために使われてきました。
一方、データサイエンスは、タクシーの研究のように、まずデータがあり、統計や人工知能を使ってそのデータを分析し、モデルを作り出します。それが、これまでの科学と大きく異なる点です。つまり、データサイエンスは、これまで人間が想像していなかったような、新しいルールや事実を導き出す可能性を持っているのです。
nakanishi_pic01

nakanishi_pic02

中西准教授の著書

言葉と感性―重要な言葉をAIで抽出
私の研究のキーワードは「感性」。特に、言葉や音楽に関係する3つの研究に取り組んでいます。
一つ目は、感性と言葉に関する研究です。人間が複雑なことを考え、複雑な感情を抱くことができるのは、言葉を持っているからです。大学時代、人間にとって非常に重要な「言葉」をベクトルに変換し、文脈や状況に応じて意味を動的に計算する「意味の数学モデル」に魅了され、このモデルを考案した筑波大学の北川高嗣教授、慶應義塾大学の清木康教授に師事しました。以来、なるべく人間の感性に近い形で音楽や画像を印象を表す言葉に変換する手法、言葉を用いて音楽、画像、人間の表情などをシームレスにつなぐ感性メディア変換などを研究してきました。
現在は、これまでの研究を背景に、テキストマイニングの新たな手法に関する研究を行っています。黒板メーカー大手の株式会社サカワとの共同研究で生まれた授業AIアシスタントの「Josyu」は、重要な言葉をAIがリアルタイムで判定するテキストマイニング方式を実現したものです。
Josyuは、教師が話す言葉を音声認識でテキスト化し、さらに、その中でも今重要なのはどの言葉なのかを判定して、黒板に表示させます。重要度は、前後の言葉との関係性を計算して導き出しています。こうしたシステムを利用すれば、教師の負担を減らすことができ、教わる学生の側にとってもより楽しい授業になるのではないかと期待しています。
言葉の意味や響きからAIが自動作曲
最近、データとAIなどの技術を活用して創造性を発揮する研究が盛んに行われています。私が岡田龍太郎助教、筑波大学の北川教授とともに取り組む、印象を表す言葉から曲を生成する自動作曲システムの研究も、その一つです。
このシステムは、入力された言葉の印象に合わせた曲をコンピュータが自動的に作るというものです。曲は、言葉の「意味」が持つ印象だけでなく、言葉の「音の響き」が持つ印象からも作ることができます。ですから、辞書的な意味を持たない言葉、たとえば人の名前を入力しても曲はできます。また、同じ言葉でも、入力するたびにできる曲は異なります。一つの言葉の印象から人間が作ることができる曲の数には、おそらく限りがありますが、このシステムには“ネタ切れ”がありません。
この研究の出発点は、大学時代に取り組んでいた、音楽や画像のデータの印象を表す言葉に変換する研究にあります。音楽の特徴を拾って言葉に変換できるのであれば、反対に、言葉の特徴から音楽を生成することもできるのではないか。そんな「逆」の発想から生まれた研究です。
nakanishi_pic03

言葉の音の響きからAIが作曲したものを表示している様子

感情の移り変わりを波として分析
現在最も着目している研究が、感性の時系列的変化「Kansei Transition」の研究です。
これまで私が取り組んできた感性に関する研究は、どれも、人間の“ある瞬間”の感情を切り取って扱っているものです。しかし人の感情は、1日の中でも、楽しかったり、落ち込んだり、緊張したり、さまざまに揺れ動きます。そこで、感情や思考の時系列的遷移を「波」としてとらえ、分析することができないか、という考えの下、研究を進めています。
感性の動きを波としてとらえることができると、音声分析などで従来から用いられてきた信号処理の手法を使って分析することが可能になります。波を比較して類似性を判断する方法も、信号処理の世界では長く研究されていますから、感性を波としてとらえることができれば、人間が「あの人とはなんだか波長が合うな」と感じる時と同じような感性の測り方が、データの世界でもできるようになってくるかもしれません。
現状のAIは、その瞬間の事象を分析したり、少し先の未来を予測したりすることに長けていますが、長期間の変遷の分析はまだ苦手分野です。今後は、ロングスパンでの変遷や壮大な歴史を分析できるようなアルゴリズムを作っていくことも大事なのではないかと考えています。
nakanishi_pic04