本文介绍了基于Impala构建实时用户行为分析引擎的方法。用户行为分析是基于用户行为的五大要素(参与者、时间、地点、行为方式和具体行为)进行的数据分析。用户行为分析可以用于产品改进、业务决策等。用户行为分析的需求特点包括时间轴、大量维度、维度取值分散、分析灵活性要求高、实时响应、查询频率较低等。在选择查询引擎时,需要考虑其灵活性和速度。本文选择了Impala作为查询引擎,因为它具有基于MPP的查询引擎、较高的查询效率等优点。基于Impala的系统架构需要与数据节点同机混部以提高查询效率。