GitHub 热门项目:业力

2026-06-12 1 阅读 GitHub Trending
GitHub 项目:业力 仓库地址:https://github.com/CyrilFeng/karma 星级:1006 | 作者:CyrilFeng 项目描述:新数据洞察方式 =================================================== 自述文件内容:
许可证

Karma是一种全新的数据分析方式,用一句话来说就是**执行的大脑图**,多年前我曾向Sean Ellis(生长黑客之父)介绍了Karma的设计,他认为,Karma的模型是最好的企业数据分析方法。Karma有助于确定要进行实验的领域,也有助于从实验中得到结论。 Karma 将大量释放数据工程师和产品的工作,我们曾将一些数据看板类的工作投入大量前期研发资源。而业务演进本身则逐渐缓慢。数据固然重要,但投入大量资源则缩小本末倒置,我们要求需要这样的工具释放产能。 业力完成了现有数据分析能力缺失的一环,与一些传统人群分析系统不同的是,传统分析聚焦于某些特定的人群,基于该人群运用各种分析手段得出结论。但这些分析没有建立相互之间的联系,也缺乏针对业务的语义,比如业务想知道一个活动真的带来了留资的提升吗,发布的短信/推送带来了多少曝光,这些用户后续第n天的行为如何?参与某活动之前X天和之后X天用户的成交UV和GMV、核销、客单价如何变化等等。 Karma 的数据控制权和解释权交还给业务,最后采用嫁接方式得到口头结论,业务说了算。这是我认为 Karma 最重要的特点,让业务探索问题和决策。
### 配置数据源 点击左上角,进入数据源配置窗口,点击右上角新增图标 这里定义在数据源中配置的内容是一段SQL,这个SQL原则上是单表查询即 ``SQL 从 your_table 中选择 col1,col2,col3... ```` 这样结构简单。比如: ``SQL 选择 任务ID, exe_id, 品牌, 用户代码 uid 来自 ods_tmall_prod.task_sale_1h_a 哪里 日期时间 = '最新' 和品牌 = '${brand}' 和任务id = ${taskid} ```` 越简单越好。Karma 基本上是基于 Trino 实现的,所以这里的 SQL 也是 Trino 的语法。 <表> 这里***编码为英文,**名称**随意 **类型**目前支持用户和销售,即你的SQL是用来分析用户还是销售。 Karma会自动获取SQL中的字段,把它们解析到下面的**字段**模块,你可以配置字段的名称,也可以不配置。这个名称用于结果的展示。 配置**字段类型**,这里主要是顺序分隔文本和数字。 在SQL中,你可以用${变量}这样的格式表示变量,Karma会自动采集SQL中的变量,把它们解析到下面的**参数**模块,你可以配置变量的名称、类型、以及格式(主要用于日期类型,如yyyyMMddHH) 我们还需要在SQL中选择一个字段,添加的别名为**uid(unique id)**,这个字段实际上就是类似外键的作用,就像上面的例子中我们选择user_code为uid,Karma将基于这个uid和其他数据源配置的SQL构建起来。用户id、车辆id、消息id等都可以作为uid。 上面的例子中,我们配置了一个数据源,这个数据源暴露出2个变量brand和taskid,它们将在后面发挥重要作用。以此类推,我们配置好其他可能用到的数据源,确定对应的uid字段。 ### 弱势分析流 <表> 选中左边的【用户】选项,在黑色面板上任意位置单击,即可创建节点。 此时在面板右侧可以编辑节点的信息,最重要的【数据源】,单击【数据源】右侧的【...】按钮,在弹出的面板中左侧的对应行,即可绑定数据源。 此时上面配置的brand和taskid都是【SQL参数配置】中被带出来了,根据需要进行配置。 下方的【聚合参数配置