标签:大数据
目录大数据面试题HadoopHadoop的特点HDFS面试重点1.HDFS的架构2.HDFS的读写流程3.HDFS中,文件为什么以block块的方式存储4.小文件过多有什么危害,你知道的解决办法有哪些hdfs小文件带来危害解决方案5.在NameNode HA中,会出现脑裂问题吗?怎么解决脑裂6.简
本篇主要介绍了一种使用Rust语言编写的查询引擎——DataFusion,其使用了基于Arrow格式的内存模型,结合Rust语言本身的优势,达成了非常优秀的性能指标 DataFusion是一个查询引擎而非数据库,因此其本身不具备存储数据的能力。但正因为不依赖底层存储的格式,使其成为了一个灵活可
目录hive入门到精通hive部署启动Hadoop检查MySQL是否启动成功安装hivehive-env.shhive-site.xml需要修改的位置提炼如下:上传 MySQL 连接驱动 jar 包到 hive 安装目录的lib目录下:guava版本冲突配置环境变量初始化hive的元数据库远程模式
摘要:5月16日,“数智深耕 让美好发生 2023华为云城市峰会广州站”成功举行。 5月16日,“数智深耕 让美好发生 2023华为云城市峰会广州站”成功举行。大会聚集了众多城市管理者、产业领袖、企业家和媒体,共同探讨工业数字化发展新趋势,共谋工业数字化发展之路。华为公司副总裁、华为云中国区总裁张
Redis 是一个内存数据结构存储系统,它被广泛用于缓存、队列、实时分析等多种应用场景中,目前已经成为 Key-value 数据存储系统中的佼佼者,根据 DB-Engine 网站提供的最新数据,Redis 在 Key-value stores 类别中排名第一,在整体数据库类别中排名第六,有着非常高
1.Greenplum数据库中segment故障检测 1.1概述 Greenplum数据库服务器(Postgres)有一个子进程,该子进程为ftsprobe,主要作用是处理故障检测。 ftsprobe 监视Greenplum数据库阵列,它以可以配置的间隔连接并扫描所有segment和数据库进程。
本文首发于公众号:Hunter后端 原文链接:es笔记一之es安装与介绍 首先介绍一下 es,全名为 Elasticsearch,它定义上不是一种数据库,是一种搜索引擎。 我们可以把海量数据都放到 es 里然后提供搜索操作,但是 MySQL 也同样可以提供搜索,为什么要用 es 呢? 一个是因
本文首发于公众号:Hunter后端 原文链接:es笔记二之基础查询 这一篇笔记介绍 es 的基础查询。 基础查询包括很多,比如排序,类似数据库 limit 的操作,like 操作,与或非等,对于这些操作,我会在介绍他们的用法之后加上对应的数据库 sql 便于理解。 注意: 下面的操作都在 ki
ChunJun 是⼀款稳定、易⽤、⾼效、批流⼀体的数据集成框架,基于计算引擎 Flink 实现多种异构数据源之间的数据同步与计算。ChunJun 可以把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从⽽为企业提供全⾯的数据共享,目前已在上千家公司部署且稳定运⾏。 在之前,我们曾经为大家
本文首发于公众号:Hunter后端 原文链接:es笔记三之term,match,match_phrase 等查询方法介绍 首先介绍一下在 es 里有两种存储字符串的字段类型,一个是 keyword,一个是 text。 keyword 在存储数据的时候是作为一个整体存储的,不会对其进行分词处理
上一讲我们安装 etcd 服务端,这一讲我们来一起学学如何使用 etcd 客户端常见的命令。文章内容来源于参考资料,如若侵权,请联系删除,谢谢。 etcd可通过客户端命令行工具 etcdctl 对etcd进行请求操作 # 帮助命令,会列出所有的命令和选项,在记不太清命令的时候,可以使用 etc
本文首发于公众号:Hunter后端 原文链接:es笔记四之中文分词插件安装与使用 前面我们介绍的操作及演示都是基于英语单词的分词,但我们大部分使用的肯定都是中文,所以如果需要使用分词的操作肯定也是需要使用中分分词。 这里我们介绍一下如何安装中文分词插件。 在介绍安装之前,我们可以先来测试一下没
摘要:本文详细梳理分析了DWS服务面临软硬件故障场景和对应的修复原理,希望借此能够让你对DWS的集群故障修复有个全面深入的了解。 本文分享自华为云社区《GaussDB(DWS)故障修复系统性介绍》,作者: 闻鲜生。 DWS是一个分布式架构的MPP集群,物理部署上涉及数百数千台主机和对应的磁盘,以及
浅浅的记录下Redis安装、主从、哨兵、集群。搭建笔记 一.Redis下载安装 系统环境  redis版本:7.0.11  linux版本:CentOS Linux release 8.2.2004 (Core) 官网下载地址:https://redis.io/download/ 一些安装命令,按
《1万多条司法资格考试题库ACCESS版》搜集了大量司法资格考试试题,包括试卷一、试卷二、试卷三、试卷四等科目。同类的数据库有《9万多条执业医师资格考试题库ACCESS数据库》、《6万多条会计从业资格考试题库ACCESS版》、《近7万多条证券从业资格考试题库ACCESS版》、《1万多条一级建造师资
这是从一个中药大全查询系统中破解提取出来的中药验方大全,整理出了数以万计的各家经方、时方、验方以及秘方的用药方剂组成,用法用量以及每组方剂的功效性能、主治应用等。有了这样一套完善的医学资料你可以节省很多查阅资料的时间可以更方便快捷的查阅你需要的信息。   --------------------
虽然已经有很多诗词类的数据库,最近又再次找了一下古诗词类的数据,又发现了一些,可是真的是各有各的优点,各有各的特色,之后不再重找诗词类的数据了。 今天这个诗词鉴赏数据也不错,有分类TAG,也有译文、注释、品析、朝代,但是又有些不足,详见下面说明: 朝代记录统计:金朝(15)、近代(8)、两汉(1
本文首发于公众号:Hunter后端 原文链接:es笔记六之聚合操作之指标聚合 聚合操作,在 es 中的聚合可以分为大概四种聚合: bucketing(桶聚合) mertic(指标聚合) matrix(矩阵聚合) pipeline(管道聚合) bucket 类似于分类分组,按照某个 key 将符