因为dataFrame.write().parquet("path"),path只是一个路径。追加模式(APPEND)表示网同一个文件夹下追加,不考虑path是否存在。
我们是否还需要另外一个新的数据处理引擎?当我第一次听到flink的时候这是我是非常怀疑的。在大数据领域,现在已经不缺少数据处理框架了,但是没有一个框架能够完全满足不同的处理需求。自从Apachespark出现后,貌似已经成为当今把大部分的问题