挑め、情報⼯学の⼒先⽣が解説!社会の⾝近な問題

Q.2

自分好みのプレイリストはどうやって作られる?

 さまざまなアーティストの音楽を聴き放題で楽しむことができる定額制音楽配信サービス。年々利用者が広がっています。聴けば聴くほどAIがユーザーの好みを学習しておすすめの曲を提示するほか、各ユーザーの好みに合わせて高度にパーソナライズされたプレイリストを構築するサービスなどもあり、新しい音楽との出合いにつながっています。インターネット上でショッピングをしたときに、おすすめ商品や関連商品が表示されるのと似たようなシステムです。こうした「レコメンドシステム」はどのような仕組みになっているのでしょうか。ここには統計学やアルゴリズムの知識を使って、大量のデータから何らかの相関性を導き出し、活用する技術が使われています。

この課題に答えるのは

亀谷 由隆准教授

データ分析をさまざまな分野に応用

音楽レビュー文を元に好みの曲を推薦
 今やレコメンドシステムは至るところに存在していて、音楽に限らず本や服、不動産物件や友人など、私たちはあらゆるところで「おすすめ」されています。その仕組みは比較的シンプルなもので、購買行動履歴や購入した商品の内容、年齢や性別などの情報を利用して、ユーザーが商品を購入しそうかどうかを予測するものですが、ここで使われるのが機械学習の手法です。
 予測には例えば「アイテムベース協調フィルタリング」と「ユーザーベース協調フィルタリング」という2通りの方法が考えられます。アイテムベース協調フィルタリングは、現在閲覧している商品と似ている商品をデータベースから探してその商品を推薦するもので、世界を代表する大手インターネット通販企業はこちらを利用しているといわれています。
 それに対してユーザーベース協調フィルタリングというのは、過去に同じような購買履歴を持つ人や同じような属性の人をデータベースから見つけ、その人たちが購入した商品を推薦するシステムです。どちらもシンプルなシステムではありますが、膨大な量の情報を処理する必要があります。
 私の研究室では、こうした手法を使って音楽の推薦システムを構築しており、その判断材料として、音楽出版社が提供している楽曲コメントなどのCDデータベースを使用しています。今やYouTubeなどで気軽に音楽を楽しめる時代ですが、私が学生の頃はレコード屋のPOPコメントを一つ一つチェックしながら、「これはどんなアルバムだろう」と想像してレコードを買っていました。そうした経験から、推薦コメント、レビュー文を使って、おすすめの曲を推薦できるのではないかと考えたのです。
 このシステムでは、ユーザーが好きな曲を入力すると約5万曲の情報が収容されているデータベースのレビューを参照し、同じワードで解説されている曲や似た印象の曲を探し出して推薦します。その際、歌詞に重きを置くか、音楽に重きを置くかをまず設定し、歌詞の内容やムードもしくは、メロディの印象やテンポが似ている曲を判断して、推薦するようになっています。今はいくつかの曲を推薦するだけですが、プレイリストを生成して、複数の曲を意味のあるストーリーとして推薦し、価値ある音楽体験を提供できればと考えています。
ビッグデータ分析を医療分野に応用

 データ分析は、さまざまな場面で応用が考えられる領域です。例えば学生の中には、データ分析をキーワードに統計的手法を使ってスポーツのデータ分析をしている学生や、データの大きな集まりの中から互いに似たデータのグループを見つける「クラスタ分析」という手法を活用して商店街来訪者の行動を解析して商店街の活性化に役立てようと研究を進めている学生がいます。
 私自身は現在、ビッグデータ分析を活用したパターン発見の手法を医療分野に応用しようという研究を進めています。近年、複数の医療機関や診療科で多岐にわたる処方がなされた結果、副作用を起こしてしまう多剤服用(ポリファーマシー)が問題視されるようになってきました。その副作用の症状が新たな病状と誤認され、さらに薬剤が処方される「処方カスケード」という事態も発生しています。薬の組み合わせによっては低血圧症になってふらつきや転倒を引き起こし、寝たきりに至ることもあるそうです。そこで国立長寿医療研究センターと共同で、薬剤の組み合わせと低血圧症を発症するパターンを導き出そうと、これまでの症例データの分析を進めています。薬剤師が処方見直しを行うことでポリファーマシーを防ぎ、医薬品の適正使用に寄与していきたいと考えています。