博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
大数据仓库对业务数据的几个基本要求
阅读量:4706 次
发布时间:2019-06-10

本文共 362 字,大约阅读时间需要 1 分钟。

大数据仓库对业务数据的几个基本要求

  1. 同步业务数据时,需要主键和业务更新时间
  2. 日志型数据需要有日志发生时间
  3. 业务数据发送到消息队列,需要带上主键和业务更新时间
  4. 同一个业务输出不同的数据时候,需要对输出的数据负责,保证提供的数据的字段、含义等统一、清晰
  5. 数据需要有对接人、负责人,对以上问题进行跟进维护。

如果业务数据没有主键,则在数据汇总时无法对数据进行排重和更新;如果没有业务更新时间,当数据量很大的时候,无法进行增量同步

为了保证业务的实时发现问题、跟进问题、解决问题,对数据的处理要求:

  1. 实时数据1分钟写
  2. 实时数据查询粒度:1分钟、5分钟、10分钟、15分钟、20分钟、30分钟、1小时...
  3. 离线数据 T+1

转载于:https://www.cnblogs.com/myblog1900/p/10070544.html

你可能感兴趣的文章
贝叶斯分类器
查看>>
<img>标签
查看>>
android:intent flags
查看>>
Vue疑难杂症
查看>>
spring boot 错误处理之深度历险
查看>>
Linux--Centos7开机启动 mysql5.7.19
查看>>
2018-2019-1 20165220 《信息安全系统设计基础》第6周学习总结
查看>>
Java 获取汉字串首字母并大写和获取汉字的全拼,英文字符不变
查看>>
《构建之法》前三章的读后感
查看>>
12306
查看>>
Python的工具包[0] -> numpy科学计算 -> numpy 库及使用总结
查看>>
python newbie——PE No.9
查看>>
20165218 实验一 Java开发环境的熟悉
查看>>
map标签的详细使用参数
查看>>
MySQL对于有大量重复数据表的处理方法
查看>>
Android应用开发学习笔记之多线程与Handler消息处理机制
查看>>
ubuntu 设置环境变量
查看>>
JSTL详解(一)
查看>>
Manacher 算法
查看>>
Linux磁盘及文件系统(三)Linux文件系统
查看>>