house.zhang 的文章
  • 线上ES集群提高读写能力的大致方案

    业务在使用ES集群读取ES数据,如果同时向ES集群写任务时,会遇到RT涨的情况,会出现一些抖动,尤其是在计算框架大量增加并发度像ES集群写的情况下会出现抖动,目...

    house.zhang 2023-01-02
    440 0 0
  • Java Hive UDTF 将WKT格式的Geomotry转换成GeoJSON

    WKT(Well-known text)是一种文本标记语言,用于表示矢量几何对象、空间参照系统及空间参照系统之间的转换。它的二进制表示方式,亦即WKB(well...

    house.zhang 2023-01-02
    435 0 0
  • Flink on K8s 企业生产化实践

    为了解决公司模型&特征迭代的系统性问题,提升算法开发与迭代效率,部门立项了特征平台项目。特征平台旨在解决数据存储分散、口径重复、提取复杂、链路过长等问题,在大数...

    house.zhang 2023-01-02
    432 0 0
  • 在线学习FTRL介绍及基于Flink实现在线学习流程

    目前互联网已经进入了AI驱动业务发展的阶段,传统的机器学习开发流程基本是以下步骤:数据收集->特征工程->模型训练->模型评估-> 并在线上使用训练的有效模型进...

    house.zhang 2023-01-02
    436 0 0
  • 浅谈AI机器学习及实践总结

    机器学习是一种从数据生成规则、发现模型,来帮助我们预测、判断、分组和解决问题的技术。(机器学习是一种从数据中生产函数,而不是程序员直接编写函数的技术)

    house.zhang 2023-01-02
    431 0 0
  • 大数据AI Notebook产品介绍和对比

    大数据数据需要查询分析可视化工具,AI数据挖掘和探索也需要相关可视化编辑工具,开源产品主要有两个一个是Zeppelin notebook 一个是jupyter ...

    house.zhang 2023-01-02
    426 0 0
  • 大数据Ambari自定义服务详细介绍

    四年多前,入职一家大厂大数据部门主要工作就是从ambari集成大数据组件服务开始做起,当时需要把机器学习平台集成到大数据平台,当时把ambari进行了大量的修改...

    house.zhang 2023-01-02
    423 0 0