Spark Summit 2013 演讲稿
SparkR - R 的 Spark前端
[PPT] 深入浅出 Spark (@CrazyJvm)
系列文章:Apache Spark 源码走读(@徽沪一郎)
Spark Summit 2014 幻灯片 & 视频
Spark GraphX 在淘宝的实践(黄明、吴炜)
Spark Internals (@JerryLead)
内存计算技术哪家强?Spark vs HANA (@吴朱华)
Spark 技术解析及其在百度的应用实践 (仲浩)
[译] Spark 论文《大型集群上的快速和通用数据处理架构》(修正版)
Spark SQL 1.3.0 概览 (@连城404)
[译] Spark 编程指南(Python 版) (@cholerae)
[译] 怎样利用 Spark Streaming 和 Hadoop 实现近实时的会话连接 (Tao Meng)
Spark 性能调优 (田毅)
《Apache Spark 设计与实现》 (JerryLead)
Spark 与 Flink:对比与分析 (卢亿雷 & 彭远波)
SequoiaDB Connector for Apache Spark (Tao Wang)
Spark PySpark 数据类型的转换原理:Writable Converter
Spark 如何解决常见的 Top N 问题
Spark SQL 编程指南(Python)
Spark Streaming 源码解析系列
基于 Spark 的机器学习经验
[译] Spark 操作指南
Spark 中实现基础的 PageRank
Spark MLlib 实现的广告点击预测:Gradient-Boosted Trees
Spark MLlib 实现的中文文本分类 Native Bayes
将 Spark 中的文本转换为 Parquet 以提升性能
Spark Streaming 实践和优化
《Spark 官方文档》集群模式概览
Spark 在美团的实践
Spark 入门实例指南
Spark 在金融领域的应用:日内走势预测
这些年,你不能错过的 Spark 学习资源
搭建 IPython + Notebook + Spark 开发环境
基于 Spark 的文本情感分析
Spark Streaming 使用 Kafka 保证数据零丢失
使用 ML Pipeline 构建机器学习工作流
打开 Spark 的正确姿势
Spark Streaming + Elasticsearch 构建 App 异常监控平台
搭建 Spark 源码研读和代码调试的开发环境
Spark 中进行聚合时的特殊场景