-
27、Power Query-日期与时间数据处理实例(图书室借书统计)
所属栏目:[大数据] 日期:2020-12-31 热度:115
本节要点:Power Query-日期与时间数据处理实例(图书室借书统计) 承接上一节的需求,我们引入切片器的功能,对图书室的借书以及归还情况进行查询和筛选,效果图如下: 对“借书状态”和“归还状态”进行筛选,亦可同时筛[详细]
-
25、Power Query-日期与时间数据处理
所属栏目:[大数据] 日期:2020-12-31 热度:51
本节知识点:Power Query-日期与时间数据处理 日期与时间数据处理功能位置(同样在“转换”和“添加列”菜单中都存在): 这里重点讲解一下某些知识点。 比如年限:意思是当前系统日期减去选中列的日期,结果以“天时分秒毫秒”方式显示。 月份下面的“一[详细]
-
媒体|郑宇:用大数据预测雾霾是如何做到的?
所属栏目:[大数据] 日期:2020-12-31 热度:97
副标题#e# (本文由澎湃新闻授权转载。) ? 全球范围里,有超过半数的人类居住在城市之中,城市化的进程也从未停止过。面对越来越庞大的城市,许多事情已经超出了控制:拥堵的交通,严重的空气污染,让人烦躁的噪音等等。 ? 没有人真正了解城市中到底发生了[详细]
-
(26进制大数相加)hdu 2100 Lovekey
所属栏目:[大数据] 日期:2020-12-31 热度:77
Lovekey Problem Description XYZ-26进制数是一个每位都是大写字母的数字。 A、B、C、…、X、Y、Z 分别依次代表一个0 ~ 25 的数字,一个 n 位的26进制数转化成是10进制的规则如下A0A1A2A3…An-1 的每一位代表的数字为a0a1a2a3…an-1 ,则该XYZ-26进制数的1[详细]
-
如何利用图像识别、语音识别、文本挖掘做好鉴黄?
所属栏目:[大数据] 日期:2020-12-31 热度:143
人工智能鉴黄市场竞争愈发激烈,目前图普科技、阿里绿网、腾讯万象优图等团队已占据大量市场份额,在此环境下,不少公司试图通过提供更全面的服务从这片红海中分一杯羹。 那么更全面的定制服务体现在哪些地方?雷锋网(公众号:雷锋网)特地采访了极限元 CEO[详细]
-
打包带走!史上最全的大数据分析和制作工具
所属栏目:[大数据] 日期:2020-12-31 热度:110
副标题#e# 来源:数之联大数据(ID:unionbigdata) 工欲善其事,必先利其器。 作为在大数据领域摸爬滚打叱咤风云的伙计们,也应当有一些实用工具来辅助工作日常。下面是小编精心整理的一些经检测非常实用的工具及网站,呈给大家~~ 数据可视化工具 说到数据[详细]
-
[bigdata-027] 最好用的 python+mysql的包:pymysql
所属栏目:[大数据] 日期:2020-12-31 热度:170
pip3 install pymysql import? pymysqlconn = pymysql.connect(host='127.0.0.1',port=3306,user='root',passwd='tiger88',db='spider_phone',charset='utf8')c = conn.cursor()c.execute('select * from phone_info limit 1;')r = c.fetchone()print(r)pr[详细]
-
数据可视化:手把手打造BI
所属栏目:[大数据] 日期:2020-12-31 热度:133
副标题#e# 本文是 如何七周成为数据分析师 的第六篇教程,如果想要了解写作初衷,可以先行阅读七周指南。温馨提示:如果您已经熟悉BI,大可不必再看这篇文章,或只挑选部分。 我们上一篇数据可视化:教你打造升职加薪的报表教大家如何制作清晰美观的报表以[详细]
-
下一代大数据处理平台Apache Beam成为Apache顶级项目
所属栏目:[大数据] 日期:2020-12-31 热度:52
副标题#e# Apache软件基金会在2017年01月10正式宣布Apache Beam从孵化项目毕业,成为Apache的顶级项目 Apache Beam(原名Google DataFlow)是Google在2016年2月份贡献给Apache基金会的Apache孵化项目,被认为是继MapReduce,GFS和BigQuery等之后,Google在大[详细]
-
26、Power Query-日期与时间数据处理实例(统计出某年各月各周的
所属栏目:[大数据] 日期:2020-12-31 热度:150
本节重点:Power Query-日期与时间数据处理实例(统计出某年各月各周的借书人数) 需求如下: 上图所示,根据左侧的数据源,统计出2016年各月各周的借书人数(效果如右侧所示)。 分析:很明显,这个需求是对日期的一个操作,其实仅需要用到左侧的第一列即[详细]
-
[bigdata-028]apache nifi 从mysql导出数据到hbase
所属栏目:[大数据] 日期:2020-12-31 热度:107
0.在hbase节点,启动thrift服务 hbase-daemon.sh start thrift 1. 在本机启动nif ./bin/nifi.sh start 2. 在浏览器输入http://localhost:8080/nifi,看到nifi的界面 3. 拖一个processor ExecuteSQL到界面 ??? 3.1 在processor上点击右键,选择configure,[详细]
-
pyhive 连接 Hive 时错误
所属栏目:[大数据] 日期:2020-12-26 热度:169
一、User: xx is not allowed to impersonate xxx' 解决办法:修改 core-site.xml 文件,加入下面的内容后重启 hadoop。 property namehadoop.proxyuser.xx.hosts/name value*/value/propertyproperty namehadoop.proxyuser.xx.groups/name value*/value/p[详细]
-
分布式基础通信协议:paxos、totem 和 gossip(转载)
所属栏目:[大数据] 日期:2020-12-26 热度:73
背景: 在分布式中,最难解决的一个问题就是多个节点间数据同步问题。为了解决这样的问题,涌现出了各种奇思妙想。只有在解决了如何进行信息同步的基础之上才衍生出形形色色的应用。这里开始介绍几种分布式通信协议。 简单即有效——totem协议: totem协议[详细]
-
Hive 导入 parquet 格式数据
所属栏目:[大数据] 日期:2020-12-26 热度:54
Hive 导入 parquet 数据步骤如下: 查看 parquet 文件的格式 构造建表语句 倒入数据 一、查看 parquet 内容和结构 下载地址 社区工具 GitHub 地址 命令 查看结构: java -jar parquet-tools-1.6.0rc3-SNAPSHOT.jar schema -d activity.201711171437.0.parq[详细]
-
Presto 常用配置及操作
所属栏目:[大数据] 日期:2020-12-26 热度:119
一、介绍 Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。 Presto的设计和编写完全是为了解决像Facebook这样规模的商业数据仓库的交互式分析和处理速度的问题。 推荐阅读 Presto实现原理和美团的使用实践 二、安装 2.[详细]
-
大数据的技术生态概述(转载)
所属栏目:[大数据] 日期:2020-12-26 热度:162
副标题#e# 如何用形象的比喻描述大数据的技术生态?Hadoop、Hive、Spark 之间是什么关系? 大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗[详细]
-
九种常见的数据分析模型
所属栏目:[大数据] 日期:2020-12-26 热度:95
副标题#e# 1. 漏斗分析模型 漏斗分析是一套流程式数据分析,它能够科学反映用户行为状态以及从起点到终点各阶段用户转化率情况的重要分析模型。 运营人员可以通过观察不同属性的用户群体(如新注册用户与老客户、不同渠道来源的客户)各环节转化率,各流程[详细]
-
大数据领域常用技术栈
所属栏目:[大数据] 日期:2020-12-26 热度:94
副标题#e# 提起大数据,不得不提由IBM提出的关于大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性),而对于大数据领域的从业人员的日常工作也与这5V密切相关。大数据技术在过去的几十年中取得[详细]
-
Databricks说的Lakehouse是什么?
所属栏目:[大数据] 日期:2020-12-26 热度:165
副标题#e# ? 在过去的几年里,Lakehouse作为一种新的数据管理范式,已独立出现在Databricks的许多用户和应用案例中。在这篇文章中,我们将阐述这种新范式以及它相对于之前方案的优势。 数据仓库在决策支持和商业智能应用方面有着悠久的历史。自20世纪80年代[详细]
-
《Speed-BI云平台-基于Excel数据源的技巧应用:区域销售收入分析
所属栏目:[大数据] 日期:2020-12-26 热度:193
对于刚接触speed-BI的朋友们,一些看似很简单很琐碎的动作,当没有小窍门和智能化的操作就会使得工作量变大,时间耗起来真要命。本次课就将围绕speed-BI常用的功能进行串讲,还有特别的小技巧一并教授,成为speed-BI的技巧王! ? 课程应用: 本次课程以销[详细]
-
[bigdata-042]从头搭建 spring+mvc+boot+tomcat
所属栏目:[大数据] 日期:2020-12-26 热度:111
副标题#e# 1. 需求 1.1 在spring.io下载一个spring mvc的demo,能运行成功。 1.2 按照自己的理解,重写这个例子,并做适当修改,运行成功。 1.3 将这个例子打包成war包,放到tomcat运行成功。 2. 在spring.ip下载spring mvc并运行 2.1 spring的例子在 http:[详细]
-
[bigdata-044] CDH的官方文档部分翻译(未整理且未完成)
所属栏目:[大数据] 日期:2020-12-26 热度:109
1. cloudera官网 http://www.cloudera.com/ 2. cloudera文档 http://www.cloudera.com/documentation.html 3. 文档分为三个部分 ? 3.1 cloudera enterprise: cdh,cloudera manger,search,impala,spark。 ? 3.2 cloudera director: 安装指南,配置,以及使[详细]
-
慧眼云:基于云计算和大数据分析的主动防御实践
所属栏目:[大数据] 日期:2020-12-26 热度:148
http://www.csdn.net/article/1970-01-01/2825623 不论IT如何变迁,网络安全始终是不过时的话题。但不同环境的网络安全有不同的内涵,当前全产业转型“互联网+”,云计算、大数据和移动互联网技术的普及应用,极大地改变了IT架构,网络边界越来越模糊,同[详细]
-
[bigdata-045] redis故障处理 #34;Can#39;t save in backg
所属栏目:[大数据] 日期:2020-12-26 热度:164
发现官网出错了。经过检查,发现连接不到redis。检查redis的log,发现错误 Can't save in background: fork: Cannot allocate memory 搜索相关资料,这里说的比较详细 http://www.cnblogs.com/qq78292959/p/3994341.html http://blog.csdn.net/zqz_zqz/art[详细]
-
[bigdata-046] eclipse+spring开发web然后部署到tomcat
所属栏目:[大数据] 日期:2020-12-26 热度:90
1. 用eclipse开发spring,需要使用相关的ide 2. spring官网的ide https://spring.io/tools/eclipse 3. spring的tool suite https://spring.io/tools/sts 这个是专用开发spring的。 选择 https://spring.io/tools/sts/all 这里的linux64版本。 4. 在eclipse[详细]

浙公网安备 33038102330456号