看到豆瓣上有网友提了
这个问题,看到回答的人不多,忍不住写了下面的内容。
工作中最常用到的统计方法有哪些?根据我自己的经验给举些例子。
1.通过一部分用户样本预估整体的用户情况。比如,你的网站用户有200万注册用户,你要征询他们对于网站改进的意见,你需要给他们发邮件问卷。但由于种种限制,你不能每个用户都发,而且你收到的有效问卷只有1500多份。你要明确一下,你收集到得1500多份问卷到底多大程度上可以带代表200万的整体。这时候,你要预估误差范围(margin of error)。如果你征集到的有效有碰巧有52%的支持方案改进,你能说多一半的人都支持么?当然不能,因为你的误差范围可能就有2.5%左右。当然误差的范围和你选定的置信度相关(Confidence Level),这里由于时间的限制我就不细说了。
2.根据用户的行为和特征对用户进行细分。这里需要用到聚类的概念,通过相似性的计算,来将行为和特征相近的个体用户归为一类。比较常用的归类算法,比如K-均值法。例如,你做一个B2B的电子商务网站。你会考虑用哪些标准来划分用户比较好,如厂家的规模,产品所属的行业,还是他的商业模式(生产厂家、外贸公司、批发商、零售商)等等。
3.网站设计与商业目标的相关性分析。网站都会经常做改进,如果你有都有相关的历史记录可以分析出哪些设计的改进提高的用户的活跃度或者转化率。通过相关性分析,你可以知道哪些设计的改进对于用户的活跃度或者转化率更大;你还可以知道哪些设计元素的改进可以互相促进商业目标的完成,哪些则不起作用,或者反作用。(当以,这些分析都基于你已经剔除了运营和推广活动对你造成的干扰)
4.网站整体用户体验的度量。面对每天几十上百的网站数据的各种指标,相信有相当一部分人包括老板们都看不懂。据说google的各种指标有2000多个。这些数据指标对于用户体验的衡量到底有多大意义,也许没有一个人可以完全说清楚。这时候,网站需要一个类似股票大盘指数的指标来衡量网站整体用户体验,及其变化趋势。这需要对数据进行长期的跟踪,统计,相关性比较才能完成。