IT学院

22

03月

ABAP单元测试最佳实践

　　　本文包含了我在开发项目中经历过的实用的ABAP单元测试指导方针。我把它们安排成为问答的风格，欢迎任何人添加更多的Q&A's，以完成这个列表。在我的项目中，只使用传统的ABAP report。所以很不幸我不能使用ABAP单元测试了，是吗？有个好消息：

22

03月

hadoop安装

Linux环境步骤：(root用户密码为123456) 1. 使用useradd hadoop添加用户 2. 使用passwd hadoop设置用户密码，密码为abc123_ 3. 给用户赋予使用sudo命令的权限。 4. chmod u+w /etc/sudoers 6. vim /etc/sud

22

03月

我的Spark SQL单元测试实践

最近加入一个Spark项目，作为临时的开发人员协助进行开发工作。该项目中不存在测试的概念，开发人员按需求进行编码工作后，直接向生产系统部署，再由需求的提出者在生产系统检验程序运行结果的正确性。在这种原始的工作方式下，产品经理和开发人员总是在生产系统验证自己的需求、代码。可以想见，各种直接交给用户的错

22

03月

什么是大数据？初步认识大数据（2）

企业数据资产　　有了大数据的光环，有了从数据中挖掘商业价值的方法和工具之后，那些原本存放在服务器上平淡无奇的陈年旧数一夜之间身价倍增。按照世界经济论坛报告的看法，“大数据为新财富，价值堪比石油"。《大数据时代》一书的作者维克托则乐观地预测，数据列人企业资产负债表只是时间问题。　　本质上，任何企业

21

03月

ES 09 - Elasticsearch使用分析器分析索引 + 定制分析器

目录 1 索引分析1.1 分析器的组成 1.2 倒排索引核心原理-normalization 2 ES的默认分析器 3 修改分词器 4 定制分词器4.1 向索引中添加自定义的分词器

21

03月

cloudera manager 安装配置

前面cloudera manager 环境准备和安装我参考的是： https://blog.csdn.net/m0_38017084/article/details/82218559 这篇博客，写的非常的详细。我这主要写几个我安装完毕之后遇到的几个问题。 1

21

03月

MIT-6.824 lab1-MapReduce

概述本lab将用go完成一个MapReduce框架，完成后将大大加深对MapReduce的理解。 Part I: Map/Reduce input and output 这部分需要我们实现common_map.go中的doMap()和common_reduce.go中的doReduce()两个函数

21

03月

什么是大数据？初步认识大数据

大数据是什么？　　首先提一个问题：“大数据"是一项专门的技术吗？有的人可能会以为大数据是一项专门的技术，其实不是。“大数据"这三个字只是一门市场语言（Marketing Language），其背后是硬件、数据库、操作系统、I-ladoop等一系列技术的综合应用。大数据导论 &

19

03月

spark上的一些常用命令（一）

1. 加速跑 spark-sql --name uername --num-executors 21 --driver-memory 8G --executor-memory 8G 2. 上传数据建表 create tab

17

03月

关于apriori算法的一个简单的例子

　　apriori算法是关联规则挖掘中很基础也很经典的一个算法，我认为很多教程出现大堆的公式不是很适合一个初学者理解。因此，本文列举一个简单的例子来演示下apriori算法的整个步骤。　　下面这个表格是代表一个事务数据库D，其中最小支持度为50%，最小置信度为70%，求事务数据库中的频繁

17

03月

数据挖掘算法——Apriori算法

Apriori算法首先，Apriori算法是关联规则挖掘中很基础也很经典的一个算法。转载来自：链接：https://www.jianshu.com/p/26d61b83492e 所以做如下补充：关联规则：形如X→Y的蕴涵式，其中， X和Y分别称为关联规则的先导(

17

03月

GoldData学习实例-采集官网新闻数据

概述在本节中，我们将讲述抓取政府官网地方新闻。并将抓取的新闻数据融入到以下两张数据表news_site和news中。 news_site（新闻来源）字段类型说明id bigint 主键，自动增长 name

16

03月

在hue平台上使用oozie工作流调度

　　在实习期间，公司使用的hue平台做的数仓，下面就简单介绍一下hue的一些使用的注意事项，主要是工作流的使用和调度进入hue首页：　　 Workflow是工作流，Schedule是调度工作流的，如设置工作流何时跑，周期是多久，等等，下面

16

03月

新入坑大数据的小白有困惑

希望各位前辈、大佬能给与一些指点，万分感谢！！！！！！我是刚入职大数据工作的小白，对大数据的相关知识只能算是有了一个简单的了解，也找了一份大数据的工作（目前还未入职）。我的困惑是我的大数据之路该往哪个方向走？？？？？在接下来的路上还需要学习那些东西？？？？希望各位

14

03月

克隆虚拟机及配置yum源的步骤及讲解（Hadoop基础）

1、克隆虚拟机　　　　找一台需要克隆的虚拟机但虚拟机必须在关机下进行，（建议将前期Linux环境配置完成）　　　　在VMware中右键虚拟机找到克隆的选项。　　　　　　　　点击克隆　　　　　　　　可以克隆他的快照（提前做快

13

03月

基于ubuntu16.04伪分布式安装hadoop2.9.1以及hive2.3.1

一、安装ubuntu操作系统参考：https://www.cnblogs.com/Alier/p/6337151.html 二、下载hadoop以及hive hadoop：https://hadoop.apache.org/releases.html hiv

12

03月

使用Python的Mock库进行PySpark单元测试

测试是软件开发中的基础，它经常被数据开发者忽视，但是它很重要。在本文中会展示如何使用Python的uniittest.mock库，对一段PySpark代码进行测试。笔者会从数据科学家的视角来进行工作，这意味着本文将不会深入某些软件开发的细节。本文链接：https://www.cnblog

12

03月

一个专门下载全球气象站数据的网站（包括中国700多个站）

我只是搬运工。。。 1.我也下载了，好像不能超过500M每次，100个站。下了也不会看。有没有高手能介绍下专门下载某个省的所有气象站气温资料的方法，从而计算出每个站每月的平均气温。。格式为txt。2 http://www.esrl.noaa.gov/psd/data/gridded/rea

12

03月

Hadoop的HDFS和MapReduce的安装（三台伪分布式集群）

一、创建虚拟机　　1、从网上下载一个Centos6.X的镜像（http://vault.centos.org/）　　2、安装一台虚拟机配置如下：cpu1个、内存1G、磁盘分配20G（看个人配置和需求，本人配置有点低所以参数有点低）　　3、虚拟机安装建议去挑战min

11

03月

HBase表的基本结构和常用命令行操作

一、HBase表的基本结构　　1.概述：　　　平时常见的MySQL、Oracle数据库都是传统型关系数据库，它们都是按行查询、按行存储；而HBase为非关系型数据库，它是按列存储的的。　　　在HBase插入数据时，先输入数据的格式为rowkey => inf

热门标签

redis 大数据大数据技术文章

官方群

服务时间：

https://imgs.itxueyuan.com/advPicture/adv-1662379508-4007-pic.jpeg