微信邦

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 400|回复: 0

开源公告| 腾讯分布式数据科学组件

[复制链接]
发表于 2023-9-15 11:26:30 | 显示全部楼层 |阅读模式
Fast-Causal-Inference是腾讯微信研发,采用SQL交互的,基于分布式向量化的统计分析、因果推断计算库。解决已有统计模型库(R/Python)在大数据下的性能瓶颈, 提供百亿级数据秒级执行的Causal inference能力。同时通过SQL语言降低统计模型使用门槛,易用于生产环境中。


项目主要优势

1、提供海量数据秒级执行的Causal inference能力  
基于向量化OLAP执行引擎ClickHouse/StarRocks,速度上更益于极致化用户体验


2、极简的SQL使用方式
SQLGateway WebServer通过SQL语言降低统计模型使用门槛,并在上层提供极简的SQL使用方式,透明做引擎相关的SQL展开和优化


3、提供基础算子、高阶算子的因果推断能力, 及上层的应用封装
支持 ttest, OLS, Lasso, Tree-based model, matching, bootstrap, DML等



首个版本已经支持如下feature

基础因果推断工具
1、基于deltamethod的ttest,支持CUPED
2、OLS,亿行数据,亚秒级

进阶因果推断工具
1、以OLS为基础的 IV,WLS,以及其他GLS,DID,合成控制,CUPED,mediation正在孵化
2、uplift:千万数据分钟级别运算
3、bootstrap/permutation等数据模拟框架,解决没有显示解的方差估计问题


项目应用

已经支持了微信视频号、微信搜一搜等微信内部多个业务


项目开源地址


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

微信邦网联系QQ|Archiver|手机版|小黑屋|鲁公网安备 37082802000167号|微信邦 ( 鲁ICP备19043418号-5 )

GMT+8, 2024-12-22 11:30 , Processed in 0.056583 second(s), 17 queries .

Powered by Discuz! X3.4

© 2001-2013 Wxuse Inc. | Style by ytl QQ:1400069288

快速回复 返回顶部 返回列表