-
腾讯“神盾-联邦计算”平台——数据合作的春天
导语:大数据及人工智能飞速发展的今天,法律法规和信任问题严重阻碍了企业之间的数据流通,数据孤岛问题像一只无形的手挡在了企业之间,因为缺乏有价值的数据合作,各行业...
Narutoguo 2023-01-02434 0 0 -
基于Alluxio优化大数据计算存储分离架构的最佳实践
近年来,随着大数据规模的增长,以及大数据应用的发展,大数据技术的架构也在持续演进。早期的技术架构是计算资源和存储资源高度融合,计算和存储资源一体化存在以下明显的...
sundyxiong 2023-01-02422 0 0 -
秒级去重:ClickHouse在腾讯海量游戏营销活动分析中的应用
导语 | 腾讯内部每日都需要对海量的游戏营销活动数据做效果分析,而活动参与人数的去重一直是一项难点。本文将为大家介绍腾讯游戏营销活动分析系统——奕星,在去重服务...
腾讯云大数据 2023-01-02421 0 0 -
Hive全库数据迁移方案
考虑到多数场景是迁移整个Hive数据库,该篇文章只介绍迁移的第二种,即元数据及Hive数据全量迁移。
岳涛 2023-01-02422 0 0 -
基于Kerberos认证的大数据权限解决方案
Kerberos是由麻省理工(MIT)开发,对三方进行验证鉴权的服务安全管理系统。该系统很好的体现了西方三权分立的思想,其名字也很形象,来源于希腊神话地狱三个脑...
岳涛 2023-01-02421 0 0 -
基于Kerberos+Ldap复合认证的大数据权限
关于Kerberos与Ldap两个方案,此处就不再赘述,分别参考我的另外两篇文章:
岳涛 2023-01-02443 0 0 -
基于Sentry的大数据权限解决方案
Apache Sentry 是Cloudera公司发布的一个Hadoop开源组件,截止目前还是Apache的孵化项目,它提供了细粒度级、基于角色的授权以及多租户...
岳涛 2023-01-02414 0 0 -
HBASE BufferedMutator 批量写入使用举例与源码解析
BufferedMutator主要用来异步批量的将数据写入一个hbase表,就像Htable一样。通过Connection获取一个实例。
大鹅 2023-01-02425 0 0 -
腾讯云EMR基于YARN针对云原生容器化的优化与实践
导语 | 传统HADOOP生态系统使用YARN管理/调度计算资源,该系统⼀般具有明显的资源使⽤周期。实时计算集群资源消耗主要在⽩天,而数据报表型业务则安排在离线...
腾讯云大数据 2023-01-02418 0 0 -
高吞吐实时事务数仓方案调研 flink kudu+impala hbase等
腾讯云数据仓库PostgreSql TDSQL,PingCAP的TiDB,阿里的OceanBase,华为云DWS,都是HTAP的业内常用数仓,可以一站式解决需求...
大鹅 2023-01-02421 0 0