ie通信IE Newsletterie通讯

“他们是如何知道你喜欢什么商品的?”——专访龟谷由隆准教授

知识工程研究室 / 龟谷由隆 准教授

“他们是如何知道你喜欢什么商品的?”——专访龟谷由隆准教授
在拥有大量商品的购物网站、视频流媒体服务和音乐流媒体平台上,用户使用得越多,系统推荐的商品或内容似乎越符合个人口味。那么,这究竟是如何实现的呢?这些“推荐系统”通过分析大量数据,基于用户的选择,找出相关性,从而推荐符合用户兴趣的商品或内容。这是一种什么样的技术?亀谷由隆准教授为我们详细解答了这一问题。

 

基于音乐评论推荐符合喜好的歌曲

如今,推荐系统几乎随处可见,不仅用于音乐推荐,还能为书籍、服装、房地产甚至朋友关系提供个性化建议。其运作原理相对简单,通过分析用户的购买记录、已购商品的特征以及年龄、性别等信息,利用机器学习技术预测用户可能对哪些商品感兴趣。
在这一预测过程中,常用的两种方法是“基于物品的协同过滤”和“基于用户的协同过滤”。基于物品的协同过滤通过数据库匹配出与用户当前浏览商品相似的商品,并进行推荐。据悉,全球领先的电商公司也在广泛使用这一技术。

相较之下,基于用户的协同过滤则通过数据库找到具有相似购买记录或属性的用户,并推荐这些用户购买过的商品。尽管这两种推荐系统的原理相对简单,但它们需要处理大量的信息。
在我的研究室中,我们利用这些方法构建了音乐推荐系统。我们使用音乐出版商提供的CD数据库中的乐曲评论作为判断依据。如今,像YouTube这样的平台让人们可以轻松欣赏音乐,但在我学生时代,我会在唱片店逐一阅读POP(Point of Purchase, 即售点广告)评论,想象专辑的内容,再决定是否购买。这段经历启发了我,或许可以通过推荐评论和评论文本来推荐合适的歌曲。

在这个系统中,用户可以输入自己喜欢的歌曲,系统将参考包含约5万首歌曲信息的数据库中的评论,寻找使用相同词汇描述或印象相似的歌曲。用户还可以选择优先推荐歌词或音乐,系统则根据歌词的内容与氛围,或旋律的印象与节奏,推荐相似的歌曲。目前,系统只能推荐几首歌曲,但未来我们希望能够生成播放列表,通过讲述有意义的故事推荐多首歌曲,为用户带来更丰富的音乐体验。


将大数据分析应用于医疗领域

数据分析可以广泛应用于多个领域。例如,一些学生利用统计方法分析体育数据,另一些学生则通过“聚类分析”方法,从大量数据中识别相似的数据群体,以分析购物区访客的行为,帮助促进商业街区的活跃度。
目前,我正在研究将大数据分析中的模式发现技术应用于医疗领域。近年来,由于多个医疗机构和科室开具的药物种类繁多,从而导致副作用的多重用药(Polypharmacy)问题引起了广泛关注。这种副作用的症状有时会被误认为是新的病症,导致进一步开具药物,这种情况被称为“处方级联”。某些药物组合可能会引发低血压,从而导致头晕、跌倒,甚至长期卧床。
为解决这一问题,我们与国立长寿医疗研究中心合作,分析过往病例数据,试图找出可能导致低血压的药物组合模式。通过让药剂师重新审查处方,我们希望能预防多重用药现象,并推动药物的合理使用。

【采访日期】2021年2月13日