-
Map Reduce和流处理
Map/Reduce,简而言之,map()和reduce()是在集群式设备上用来做大规模数据处理的方法。
大数据弄潮儿 2023-01-03427 0 0 -
揭秘:“撩”大数据的正确姿势
话说当下技术圈的朋友,一起聚个会聊个天,如果不会点大数据的知识,感觉都融入不了圈子,为了以后聚会时让你有聊有料,接下来就跟随我的讲述,一起与大数据混个脸熟吧,不...
宜信技术学院 2023-01-02432 0 0 -
Druid源码阅读(一):Druid Hadoop-based ingestion实现
Apache Druid是一款开源时序OLAP数据库,支持流数据摄入和批数据摄入两种数据写入方式,其中批数据摄入又包括Native batch和Hadoop-b...
随风 2023-01-02444 0 0 -
通过 Serverless Regsitry 快速开发与部署一个 WordCount 实例
在学习 MapReduce 的过程中,不少人接触的第一个项目就是单词计数。单词计数通过两个函数 Map 和 Reduce,可以快速地统计出文本文件中每个单词出现...
腾讯云serverless团队 2023-01-02423 0 0 -
秒级去重:ClickHouse在腾讯海量游戏营销活动分析中的应用
导语 | 腾讯内部每日都需要对海量的游戏营销活动数据做效果分析,而活动参与人数的去重一直是一项难点。本文将为大家介绍腾讯游戏营销活动分析系统——奕星,在去重服务...
腾讯云大数据 2023-01-02436 0 0 -
Alluxio集群搭建并整合MapReduce/Hive/Spark
Alluxio是世界上第一个虚拟的分布式存储系统,以内存速度统一了数据访问。它为计算框架和存储系统构建了桥梁,使应用程序能够通过一个公共接口连接到许多存储系统。...
岳涛 2023-01-02429 0 0 -
「Hive进阶篇」万字长文超详述hive企业级优化
原创推文链接:https://mp.weixin.qq.com/s/GHwYVEwAS8WgNBLb14NC4A
大数据阶梯之路 2023-01-02430 0 0 -
go-zero 成长之路—微服务电商实战系列(七、并发处理工具MapReduce的使用)
大家都知道:go-zero的api服务需要通过api文件进行定义。其中返回值的类型定义中并没有支持time.Time的类型。
GoLang成长之路 2023-01-02433 0 0 -
Flink入门——DataSet Api编程指南
Apache Flink 是一个兼顾高吞吐、低延迟、高性能的分布式处理框架。在实时计算崛起的今天,Flink正在飞速发展。由于性能的优势和兼顾批处理,流处理的特...
小马哥学JAVA 2023-01-02436 0 0 -
Python基础(十九):函数加强
把函数作为参数传入 ,这样的函数称为高阶函数,高阶函数是函数式编程的体现。函数式编程就是指这种高度抽象的编程范式。
Lansonli 2023-01-02437 0 0