• 最新文章
  • 基础必修
  • 编程语言

从0开始学大数据(25)我能从大厂的大数据开发实践中学到什么?

软件编程大体上可以分成两种,一种是编写的程序直接供最终用户使用,针对用户需求进行开发,可以说绝大多数工程师开发的绝大多数程序都属于这一种;还有一种是编写的程序供其他工程师使用,大到全球通用的各种编程语言、编程框架、虚拟机、大数据系统,小到公司内部,甚至团队内部自己开发的各种工具、框架,以及应用系统内的非业务模块,都是属于这一种。 一般说来,后一种编程因为输出的程序要给其他工程师使用,接受专业同行的
从0开始学大数据(25)我能从大厂的大数据开发实践中学到什么?

从0开始学大数据(24)从大数据性能测试工具Dew看如何快速开发大数据系统

我们在Spark 性能优化案例分析这一期中,通过对大量的 Spark 服务器的性能数据进行可视化分析,发现了 Spark 在程序代码和运行环境中的各种性能问题,并做了相应优化,使 Spark 运行效率得到了极大提升。 很多同学也在问,这些可视化的性能数据从何而来呢?如何在图中将性能指标和任务进度结合起来,可以一目了然看清应用在不同运行阶段的资源使用状况呢?事实上,当时为了进行Spark 性能优化,
从0开始学大数据(24)从大数据性能测试工具Dew看如何快速开发大数据系统

从0开始学大数据(23)大数据基准测试可以带来什么好处?

2012 年的时候,Hadoop 已经日趋成熟,Intel 的大数据团队也正准备寻找新的技术研究方向。当时,我们对比测试了多个新出来的大数据技术产品,最终选择了 Spark 重点跟进参与。现在看来,这是一个明智的决定,作出这个决定是基于大数据基准测试,而使用的对比测试工具就是我今天要讲的大数据基准测试工具 HiBench。 大数据作为一个生态体系,不但有各种直接进行大数据处理的平台和框架,比如 H
从0开始学大数据(23)大数据基准测试可以带来什么好处?

从0开始学大数据(22)从阿里内部产品看海量数据处理系统的设计(下):架构与创新

上一期,Doris 提出了目前阿里巴巴海量 KV 存储方面的问题,给出了 Doris 的业务价值、设计目标和技术指标。但是 Doris 项目组还必须证明自己有已经经过论证的架构技术方案,可以实现前面设定的目标,立项后可以迅速启动执行,不需要再去摸索尝试,风险可以把控。 因此,PPT 后面的内容主要就是阐述Doris 的架构方案和创新设计。 Doris 是一种支持 Key、Value 数据结构的分布
从0开始学大数据(22)从阿里内部产品看海量数据处理系统的设计(下):架构与创新

从0开始学大数据(21)从阿里内部产品看海量数据处理系统的设计(上):Doris的立项

从今天开始,我会分两期内容来讨论阿里巴巴的一个海量数据处理系统的设计,这个系统的名字叫 Doris,它是阿里巴巴的一个内部产品。前面专栏曾经提到过,2010 年前后是各种 NoSQL 系统爆发的一个时期,各种开源 NoSQL 在这个时期发布出来,当时阿里巴巴也开发了自己的 NoSQL 系统 Doris。 Doris 的设计目标是支持海量的 KV 结构的数据存储,访问速度和可靠性要高于当时主流的 N
从0开始学大数据(21)从阿里内部产品看海量数据处理系统的设计(上):Doris的立项

从0开始学大数据(20)Spark的性能优化案例分析(下)

上一期,我讲了软件性能优化必须经过进行性能测试,并在了解软件架构和技术的基础上进行。今天,我们通过几个 Spark 性能优化的案例,看一看所讲的性能优化原则如何落地。如果你忘记了性能优化的原则,可以返回上一期复习一下。 基于软件性能优化原则和 Spark 的特点,Spark 性能优化可以分解为下面几步。 性能测试,观察 Spark 性能特性和资源(CPU、Memory、Disk、Net)利用情况。
从0开始学大数据(20)Spark的性能优化案例分析(下)

从0开始学大数据(19)Spark的性能优化案例分析(上)

我们知道,现在最主流的大数据技术几乎都是开源的产品,不管是 Hadoop 这样的大数据存储与计算产品,还是 Hive、Spark SQL 这样的大数据仓库,又或者 Storm、Flink 这样的大数据流计算产品,还有 Mahout、MLlib 这样的大数据机器学习算法库,它们都来自开源社区。所以,我们在使用大数据、学习大数据的过程中肯定少不了要和开源社区打交道。 我在 Intel 工作期间主要工作
从0开始学大数据(19)Spark的性能优化案例分析(上)

深入c语言和程序运行原理(32)程序如何与操作系统交互?(完结)

  在上一讲中我曾提到,你可以将操作系统内核暴露的“系统调用”也作为 API 的一种具体表现形式,因为调用者可以通过这些接口来使用内核提供的某种能力,但是却无需了解它们的内部实现细节。在之前的课程中,我也多次提到过有关系统调用的内容。那么,系统调用究竟是什么?它与我们编写的应用程序函数有何不同?通常情况下它又是怎样实现的呢?这一讲,我们就来看看这些问题的答案。 什么是系统调用? 不知道你
深入c语言和程序运行原理(32)程序如何与操作系统交互?(完结)