三大引擎,一个智能数据平台
Coomia 将 Flink 原生管线、Palantir 级本体和 AI Agent 超级团队融为一体 —— 从原始数据到可执行的业务决策,私有化部署,告别 Airbyte + dbt + Dagster 的工具链拼装。
基于 Apache Flink 的 AI 驱动管线编排与全生命周期治理 —— 从一键数据库接入到生产级批流一体、真实血缘、契约优先的质量保障。
CREATE TABLE dwd_orders_enriched ( order_id STRING, customer_id STRING, amount DECIMAL(18,2), dt DATE, PRIMARY KEY (order_id) NOT ENFORCED ) WITH ( 'connector' = 'doris', 'table.identifier' = 'dwd.orders_enriched' ); INSERT INTO dwd_orders_enriched SELECT o.id, o.customer_id, o.amount, DATE(o.created_at) FROM bronze_orders o LEFT JOIN bronze_customers c ON o.customer_id = c.id;
AI 驱动的管线构建器
用自然语言描述数据流,Coomia 自动生成生产级 Flink SQL 与 Doris DDL,内置 Bronze → Silver → Gold 分层,批流一体 — 分钟级交付,而非数天。
一键数据库接入
指向 MySQL / PostgreSQL / Doris / ClickHouse 数据库,Coomia 扫描 Schema、识别关系、草稿实体类型、部署 CDC 管线 —— 一个流程全部完成。
数据质量引擎
AI 自动生成质量规则,30+ 规则类型,集成 Great Expectations。统计剖析、异常检测、PII 识别,实时质量评分。
真实数据血缘
血缘来自真实的 Flink 作业和 Doris 查询 —— 非 Mock。列级追踪,变更前可视化影响分析。
数据合约与 Schema 漂移检测
合约优先代码生成,确保 Schema 先行、代码后行。自动检测 Schema 漂移,破坏性变更告警,AI 生成修复方案。
资产目录与数据画像
URN 统一标识的资产目录,跨 Flink、Doris 与本体层多源同步。列级数据画像:分布直方图、空值率、PII 识别。
数据服务发布
一键将 SELECT 查询转换为 REST API,支持动态参数、版本管理、限流、缓存和访问控制。
管道模板市场
预制行业模板 (ERP/CRM/电商),一键即用。优化建议引擎自动扫描性能瓶颈,生成改进建议。
Palantir Foundry 级本体系统 — 16 大模块覆盖对象类型、动作、规则、决策、世界、向量搜索、匹配函数和 AI 增强生成。
对象类型管理
定义 ObjectType Schema,包含属性、关系和规则。以 Doris VARIANT JSON 存储,完整版本控制,变更自动传播到下游。
对象浏览器
实例增删改查、语义搜索、过滤、关系图谱可视化和时间线视图。交互式浏览领域模型,全上下文呈现。
动作执行引擎
5 种纯数据操作 (CREATE/MODIFY/DELETE OBJECT/LINK),事务执行支持。原子化执行确保复杂多步操作的数据一致性。
规则引擎与自动化
YAML 业务规则 + Rete 网络推理。TRIGGER_DECISION 触发器、派生属性计算、事件→规则→推荐→执行的闭环链条。
决策工作室
交互式场景推演,规则评估、方案生成、影响评估和执行。AI 辅助推荐,附带可解释的置信度评分。
世界管理与 What-if
基于 Nessie 的分支场景管理。Before/After 分屏对比、影响传播动画、多方案并列评估。
事件驱动架构
基于 Kafka 的实时事件处理,支持生命周期转换。事件→规则→推荐→确认→执行的完整自动化管道。
Agent 运行时
DecisionAgent、QueryAgent、OntologyAssistant,4 类 Agent 能力。AI Agent 理解本体并自主执行动作。
向量查询与图遍历
HNSW 向量嵌入搜索实现语义相似度。多跳图遍历与关系网络聚合分析。
6 种匹配函数
向量匹配、属性匹配、能力匹配、团队匹配、风险匹配和时间匹配 — 跨任意维度精准找到目标对象。
函数运行时
用户自定义 Python 函数,沙箱化执行。派生属性计算,完全隔离、版本管理和性能监控。
OAG:本体增强生成
基于本体的结构化 RAG。Prompt 模板、决策解释生成、引用追踪 — AI 回答以真实业务对象为依据。
五大专业 AI Agent 组成超级团队 — 自然语言洞察、自动仪表盘、根因分析、预测、因果分析和 5 种高级分析模型。
Analytics Agent
自然语言→SQL,本体感知的语义理解。聚合、分布、TopN 查询,动态图表、置信度评分和洞察注释。
Dashboard Agent
AI 自动生成交互式仪表盘,智能选择图表类型和优化布局。本体感知,支持对象穿透跳转到 Object Explorer。
DQ Agent
自动化数据质量规则生成,30+ 规则类型,集成 Great Expectations。质量报告、异常告警和趋势监控。
RCA Agent
根因分析,异常指标追踪与影响链路可视化。因果分析画布,事件回溯与时间线回放。
Forecasting Agent
时序预测,置信区间估算与长期趋势预测。预测曲线与可视化置信区间带。
6 种结构化渲染器
表格、卡片、图表、指标、时间线和表单渲染器。CopilotKit 集成,实时流式回答和多轮对话上下文。
漏斗与留存分析
多步转化漏斗,精准定位流失。留存热力图、同期群对比和流失曲线 — 基于 Doris WINDOW_FUNNEL 和 RETENTION。
路径与间隔分析
事件序列 Sankey 流量图(正向/逆向路径)。两事件时间差分布,箱线图与百分位瓶颈识别。
归因分析
5 种归因模型(首触、末触、线性、时间衰减、位置)。多触点贡献度量化与渠道效能评估。
模式发现引擎
向量聚类、图模式识别、时序趋势识别和跨维关联发现。AI 主动发现你未曾注意到的洞察。
本体锚定 Copilot
页面上下文自动注入、对话执行 Action、实体自动链接。Copilot 理解你正在查看的内容并相应行动。
公共能力
支撑每个模块的企业级基础设施。
项目管理
多组织、多项目工作空间,基于角色的访问控制 (Admin/Developer/Viewer),完整资源隔离。
Git 风格数据版本管理
基于 Nessie 的数据分支。零复制克隆、原子化合并、Merge Request 工作流,代码+数据 diff。
RBAC 权限控制
World、项目和字段级别的细粒度权限。支持 SSO、SAML、OIDC,数据分类与脱敏策略。
审计与合规
完整的操作历史记录,不可篡改。查询审计日志、访问追踪、使用统计和合规证明。
多租户隔离
三级隔离:Org → Project → Branch。数据、计算和访问边界在每一层强制执行。
业务术语表
术语定义、同义词管理、资产关联和审核工作流。跨平台统一业务词汇表。