manong/category/SPARK.md at master · nemoTyrant/manong · GitHub

Spark Summit 2013 演讲稿
 SparkR - R 的 Spark前端
 [PPT] 深入浅出 Spark (@CrazyJvm)
系列文章：Apache Spark 源码走读（@徽沪一郎）
Spark Summit 2014 幻灯片 & 视频
 Spark GraphX 在淘宝的实践（黄明、吴炜）
Spark Internals (@JerryLead)
内存计算技术哪家强？Spark vs HANA (@吴朱华)
Spark 技术解析及其在百度的应用实践 (仲浩)
[译] Spark 论文《大型集群上的快速和通用数据处理架构》（修正版）
Spark SQL 1.3.0 概览 (@连城404)
[译] Spark 编程指南（Python 版） (@cholerae)
[译] 怎样利用 Spark Streaming 和 Hadoop 实现近实时的会话连接 (Tao Meng)
Spark 性能调优 (田毅)
《Apache Spark 设计与实现》 (JerryLead)
Spark 与 Flink：对比与分析 (卢亿雷 & 彭远波)
SequoiaDB Connector for Apache Spark (Tao Wang)
Spark PySpark 数据类型的转换原理：Writable Converter
Spark 如何解决常见的 Top N 问题
 Spark SQL 编程指南（Python）
Spark Streaming 源码解析系列
 基于 Spark 的机器学习经验
 [译] Spark 操作指南
 Spark 中实现基础的 PageRank
Spark MLlib 实现的广告点击预测：Gradient-Boosted Trees
Spark MLlib 实现的中文文本分类 Native Bayes
将 Spark 中的文本转换为 Parquet 以提升性能
 Spark Streaming 实践和优化
 《Spark 官方文档》集群模式概览
 Spark 在美团的实践
 Spark 入门实例指南
 Spark 在金融领域的应用：日内走势预测
 这些年，你不能错过的 Spark 学习资源
 搭建 IPython + Notebook + Spark 开发环境
 基于 Spark 的文本情感分析
 Spark Streaming 使用 Kafka 保证数据零丢失
 使用 ML Pipeline 构建机器学习工作流
 打开 Spark 的正确姿势
 Spark Streaming + Elasticsearch 构建 App 异常监控平台
 搭建 Spark 源码研读和代码调试的开发环境
 Spark 中进行聚合时的特殊场景