时间:8月17日10:00
地点:办公楼202会议室
主持人:禹晓辉
Title: Human-in-the-loop Data Management
Abstract:
在数据管理的各个环节,人力都起到至关重要的作用。比如:人可以作为数据产生者来生成数据,人可以作为数据科学家来分析数据,人可以作为数据处理器来标注数据,人也可以作为数据消费者来受益于数据。如何在这些环节中更有效的利用人力,已经成为数据库研究近几年的一个重要方向。本次讲座将针对人力的两大缺点:成本高和速度慢,提供两个系统解决方案。 第一个系统(http://sampleclean.org/)将近似查询处理和数据清洗相结合,以此来减少数据科学家分析数据的人力成本。第二个系统(http://amplab.github.io/ampcrowd)利用混合机器学习和分布式系统技术,来加快标注数据的人工速度。讲座的最后会对这一研究方向的未来进行展望。
Bio:
王健楠是加拿大西蒙.弗雷泽(Simon Fraser)大学计算机学院助理教授。主要研究领域:数据库系统,人力计算,数据科学。美国加州大学伯克利分校 AMPLab 实验室博士后 (2013-2015),清华大学计算机系博士 (2008-2013),哈尔滨工业大学计算机系学士 (2004-2008)。最近获得的奖项包括:SIGMOD 2016最近演示论文奖,CCF优秀博士学位论文奖 (2013),Google博士生奖研金(2011)。https://www.cs.sfu.ca/~jnwang/