GitHub 热门项目：业力

2026-06-12 1 阅读 GitHub Trending

GitHub 项目：业力仓库地址：https://github.com/CyrilFeng/karma 星级：1006 | 作者：CyrilFeng 项目描述：新数据洞察方式 =================================================== 自述文件内容：

Karma是一种全新的数据分析方式，用一句话来说就是**执行的大脑图**，多年前我曾向Sean Ellis（生长黑客之父）介绍了Karma的设计，他认为，Karma的模型是最好的企业数据分析方法。Karma有助于确定要进行实验的领域，也有助于从实验中得到结论。 Karma 将大量释放数据工程师和产品的工作，我们曾将一些数据看板类的工作投入大量前期研发资源。而业务演进本身则逐渐缓慢。数据固然重要，但投入大量资源则缩小本末倒置，我们要求需要这样的工具释放产能。业力完成了现有数据分析能力缺失的一环，与一些传统人群分析系统不同的是，传统分析聚焦于某些特定的人群，基于该人群运用各种分析手段得出结论。但这些分析没有建立相互之间的联系，也缺乏针对业务的语义，比如业务想知道一个活动真的带来了留资的提升吗，发布的短信/推送带来了多少曝光，这些用户后续第n天的行为如何？参与某活动之前X天和之后X天用户的成交UV和GMV、核销、客单价如何变化等等。 Karma 的数据控制权和解释权交还给业务，最后采用嫁接方式得到口头结论，业务说了算。这是我认为 Karma 最重要的特点，让业务探索问题和决策。

### 配置数据源点击左上角，进入数据源配置窗口，点击右上角新增图标

这里定义在数据源中配置的内容是一段SQL，这个SQL原则上是单表查询即 ``SQL 从 your_table 中选择 col1,col2,col3... ```` 这样结构简单。比如： ``SQL 选择任务ID， exe_id, 品牌, 用户代码 uid 来自 ods_tmall_prod.task_sale_1h_a 哪里日期时间 = '最新' 和品牌 = '${brand}' 和任务id = ${taskid} ```` 越简单越好。Karma 基本上是基于 Trino 实现的，所以这里的 SQL 也是 Trino 的语法。 <表>

这里***编码为英文，**名称**随意 **类型**目前支持用户和销售，即你的SQL是用来分析用户还是销售。 Karma会自动获取SQL中的字段，把它们解析到下面的**字段**模块，你可以配置字段的名称，也可以不配置。这个名称用于结果的展示。配置**字段类型**，这里主要是顺序分隔文本和数字。在SQL中，你可以用${变量}这样的格式表示变量，Karma会自动采集SQL中的变量，把它们解析到下面的**参数**模块，你可以配置变量的名称、类型、以及格式（主要用于日期类型，如yyyyMMddHH）我们还需要在SQL中选择一个字段，添加的别名为**uid（unique id）**，这个字段实际上就是类似外键的作用，就像上面的例子中我们选择user_code为uid，Karma将基于这个uid和其他数据源配置的SQL构建起来。用户id、车辆id、消息id等都可以作为uid。上面的例子中，我们配置了一个数据源，这个数据源暴露出2个变量brand和taskid，它们将在后面发挥重要作用。以此类推，我们配置好其他可能用到的数据源，确定对应的uid字段。 ### 弱势分析流 <表>

选中左边的【用户】选项，在黑色面板上任意位置单击，即可创建节点。

此时在面板右侧可以编辑节点的信息，最重要的【数据源】，单击【数据源】右侧的【...】按钮，在弹出的面板中左侧的对应行，即可绑定数据源。

此时上面配置的brand和taskid都是【SQL参数配置】中被带出来了，根据需要进行配置。下方的【聚合参数配置

← 返回开源推荐