8月14日(本周五)19:00,我们将邀请浙江大学计算机学院况琨老师分享观测数据下因果推断的相关工作。况琨老师2019年获得清华大学计算机科学与技术专业博士学位,2017-2018在斯坦福大学访问。主要研究方向包括因果推断、稳定学习、可解释性机器学习以及AI在法律和医疗的应用。在数据挖掘和机器学习领域发表20余篇顶级会议和期刊文章。
因果关系问题存在于医疗健康、经济、政治、数字营销诸多领域。比如,对于某种特定疾病,一种新药物是否比以前的药物有更好的效果;新的营销策略是否帮助提升了某种商品的销量?这些问题都可以通过因果推断来解决。
因果推断的黄金准则是采用随机实验,比如A/B测试。然而,完整的随机试验通常代价很大甚至不可实现。因此,如何利用观测数据进行因果推理显得尤为重要和紧迫。
在本次报告中,我们首先分享大数据场景中进行因果推断的最新挑战,包括
为解决这些挑战,我们分别提出了:
Data-Driven Variable Decomposition (D2VD) 算法;Decomposed Representation Counterfactual Regression (DeR-CFR) 模型;Differentiated Confounder Balancing (DCB) 算法;以及Generative Adversarial De-confounding (GAD) 算法。我们提出的算法在观测数据下因果推理比现有算法更精准和鲁棒。
|