聚合一般需要分成两个阶段进行,第一个阶段中增加Hash-semi aggregate有机会很大的减少两个阶段间的shuffle数据量。计算每个买家订单数量,SELECT Buyer, COUNT(*) FROM Orders GROUP BY Buyer;,如果平均每个买家有三条订单,那么上述优化在最好的情况下shuffle数据量会是未优化前的多少?( )