【hive-面试题1(京东)之HiveSql --- 难度:入门初级】此文章归类为:[ "hive", "数据仓库", "hadoop", "大数据", "sql" ]。 第1题 有如下的用户访问数据
原创 周杰伦 7个月前 阅读: 146 阅读时长: 9分钟
【数据仓库-一文了解和区分数据中台、数据平台、数据湖、数据仓库】此文章归类为:[ "数据仓库" ]。 在当今数字化时代,数据已经成为推动科技发展和商业创新的关键要素之一。数据中台、数据平台、数据湖和数据仓库是构建现代数据架构的重要组成部分。然而,这些概念之间往往容易混淆。本文将深入介绍并区分这些概念,通过生动的例
原创 周杰伦 7个月前 阅读: 162 阅读时长: 9分钟
【算法-大数据主要组件HDFS Iceberg Hadoop spark介绍】此文章归类为:[ "算法", "深度优先", "spark", "hadoop", "大数据" ]。 HDFS
原创 周杰伦 7个月前 阅读: 183 阅读时长: 9分钟
【Android安全- Python OpenCV 过点击式和滑动式图形验证码的校验】此文章归类为:Android安全。 Python OpenCV 过点击式和滑动式图形验证码的校验 背景 最近在给一个app抓包的时候发现App在特定时间会弹出验证码,验证之后会给一个token,需要携带token才能发起能正常请求。 文章源码地址:点击查看 验
原创 周杰伦 8个月前 阅读: 211 阅读时长: 9分钟
【学习-StarRocks学习笔记】此文章归类为:[ "学习", "笔记", "r语言", "开发语言" ]。 介绍场景建表明细模型聚合模型更新模型主键模型 介绍 StarR
原创 周杰伦 8个月前 阅读: 192 阅读时长: 9分钟
【hive-【Hive】HIVE运行卡死没反应】此文章归类为:[ "hive", "数据仓库", "hadoop", "大数据" ]。 Hive运行卡死 再次强调 hive:小兄弟
原创 周杰伦 8个月前 阅读: 166 阅读时长: 5分钟
【编程技术-【工具】DataX 数据同步工具】此文章归类为:编程技术。 简介 DataX 是阿里云 DataWorks数据集成 的开源版本,在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX 实现了
原创 周杰伦 8个月前 阅读: 154 阅读时长: 9分钟
【flume-Flume超级无敌详细讲解】此文章归类为:[ "flume", "大数据" ]。 简介 概述 Flume本身是由Cloudera公司开发的后来贡献给了Apache的一套针对日志进行收集(collecting)、汇聚(aggregating)和传输(moving)的分布式机制。 图-1 Flume图标 Flume本身提供了较为
原创 周杰伦 8个月前 阅读: 178 阅读时长: 9分钟
【hive-Hive自定义GenericUDF函数】此文章归类为:[ "hive", "数据仓库", "hadoop", "硬件架构", "大数据" ]。 Hive自定义GenericUDF函数 当
原创 周杰伦 8个月前 阅读: 158 阅读时长: 9分钟
【架构-怎么建设数据中台?详解数据中台架构内的三大平台】此文章归类为:["架构"]。 一、什么是数据中台? 要知道“中台”是什么,就得先了解“前台”和“后台”。 前台,就是我们日常使用的过程中可以直接看到和感知到的东西,比如你打开某东app买了个3080显卡,在这个过程中你看到的页面以及搜索、点击详情之类的交互操作都属于前台。 后台,就是支撑这些展示的算法、数据、流程等,这些是看不