1.日志采集
2. 分布式,集群
3.zookeeper,docker,linux
4.机器学习,是建模和算法
5.tensrflow,jupyter
6.日志采集flume,kafka
7.机器学习kaggle,---deep learning 神经网络,图像识别
8.人工智能----包括----机器学习----包括deep learning
9.hadoop本质,跑批量数据--block 128M,小文件用oss。强调并行,不是并发
10.mib,sprak中使用python ---爬虫算法,
11.hadoop--仅批处理,storm仅流处理,spark混合
、