菜鸟笔记
提升您的技术认知

菜鸟教程-ag真人游戏

在工作中往hive插入数据过程中发现的一些坑

菜鸟阅读 : 1576

前言:近期在工作中往hive插入数据的过程中,发现了一些坑,它们也许是hive提倡的比关系数据库更加自由的体现(同一时候引来一些问题)。也许是一些bug。总而言之,这些都须要使用hive的it人员需要额外注意,希望大家注意。 一、数据导入的...

hive建表语句详解--create table

菜鸟阅读 : 4969

创建表的三种方法 hive创建表的方式(默认路径/user/hive/warehouse,也可以location指定,主要针对external表) 1、使用create命令创建一个新表,带分区 create table `mydb.dept...

短时傅里叶分析:spectrogram函数

菜鸟阅读 : 695

1.spectrogram参数简介 功能:使用短时傅里叶变换得到信号的频谱图。 语法: [s,f,t,p]=spectrogram(x,window,noverlap,nfft,fs) [s,f,t,p]=spectrogram(x,win...

我所理解的快速傅里叶变换(fft)

菜鸟阅读 : 816

1.历史放在最前头 首先fft是离散傅立叶变换(dft)的快速算法,那么说到fft,我们自然要先讲清楚傅立叶变换。先来看看傅立叶变换是从哪里来的? 傅立叶是一位法国数学家和物理学家的名字,英语原名是jean baptiste joseph ...

awk -f 分隔符 awk命令使用

菜鸟阅读 : 942

awk命令是alfred aho, peter weinberger, brian kernighan三位作者联合开发的,用于linux/unix中处理数据和产生报告。awk命令功能十分强大,可根据需要抓取、截取指定的列或行。 首先在/mn...

centos查看实时网络带宽占用情况方法

菜鸟阅读 : 443

1, linux中查看网卡流量工具有iptraf、iftop以及nethogs等,iftop可以用来监控网卡的实时流量(可以指定网段)、反向解析ip、显示端口信息等。       centos安装if...

nutch和solr建立搜索引擎基础(单机版)

菜鸟阅读 : 469

nutch和solr建立搜索引擎基础(单机版) nutch[1] 是一个开源java实现的搜索引擎,它提供了我们运行自己的搜索引擎所需的全部工具,包括全文搜索和web爬虫。 solr[2]是一个基于lucene的全文搜索服务器,它对外提供类...

sklearn之数据预处理——standardscaler

菜鸟阅读 : 458

为什么要进行归一化? 机器学习模型被互联网行业广泛应用,一般做机器学习应用的时候大部分时间是花费在特征处理上,其中很关键的一步就是对特征数据进行归一化,为什么要归一化呢?维基百科给出的解释: 归一化后加快了梯度下降求最优解的速度; 如果机器...

向量和矩阵的点乘和叉乘

菜鸟阅读 : 1738

向量 定义:向量是由n个实数组成的一行n列或n行一列的的数组。 点乘:又叫做点积、内积、数量积、标量积,向量a[a1,a2,...,an]和向量b[b1,b2b...,bn]点乘的结果是一个标量,记作a.b; 几何解释:a.b = |a| ...

代码质量管控的四个阶段

菜鸟阅读 : 438

前言:         质量、功能和进度,是一个软件项目的三根支柱,但在现实项目中,当质量和其它两项产生冲突时,往往是作为被牺牲的对象。团队对于质量的态度主要停...

网站地图