当前位置: 首页 > 数据分析师 > 数据分析师实战技能 > 数据分析师数据分析 > 批量数据采集过程中方差的计算

批量数据采集过程中方差的计算

发布时间:2020年09月28日 20:12:57 来源: 点击量:459

【摘要】批量数据采集过程中方差的计算最近项目用需要判断开始数据是否稳定,即采集到的数据是否符合期望,我用方差来判断采集到的数据是否稳定。有

批量数据采集过程中方差的计算

最近项目用需要判断开始数据是否稳定,即采集到的数据是否符合期望,我用方差来判断采集到的数据是否稳定。有两种判断方法:第一种是数据不断的进来,我累积的进行方差计算;第二钟是利用滑动窗口的思想,数据个数达到窗口大小时计算方差值,采用循环数组的模式来实现此功能。

第一种实现方法就是采用迭代式的思想进行方差计算。我实在网上看到一位大神的博客中有对此方法的描述,他用matlab代码进行了说明,,我用C语言实现了;下面附上代码:
[cpp] view plain copy

    double GetVariance(uint64_t value)  
    {  
        static uint8_t cnt = 0;  
        static double Var = 0;  
        static double Esp = 0;  
        double TempValue = 0;  
          
        cnt = cnt + 1;  
        if(cnt == 1)  
        {  
            Var = 0;  
            Esp = value;  
            return Var;  
        }  
        TempValue = value - Esp;  
        Esp = (value + Esp*(cnt - 1))/cnt;   
        Var = Var + TempValue*(value - Esp);  
        return (Var/cnt);  
    } 
这样在程序中不断调用该函数即可迭代式的计算出方差,而不需要知道数据的个数。
第二种方法是采用滑动窗口的思想,这里需要说明一下,我做的时候有两种情况,一种是窗口不动,数据不断前移,FIFO,这种实现起来最简单;还有一种情况是窗口向前移动,这种实现起来就比较复杂了,我用单步调试好多次,才搞清楚之间的区别。
(1)窗口不动,数据前移:

[cpp] view plain copy

    double Function(uint16_t value)  
    {  
        static uint8_t cnt=0;  
        static uint8_t len=7;  
        static uint16_t sample[7]={0};  
        uint8_t i=0;  
        double var;  
        if(cnt < len)  
        {  
            sample[cnt++] = value;  
            return 0;  
        }  
        else  
        {  
            for(;i+1<cnt;i++)  
            {  
                sample[i]=sample[i+1];  
            }  
            sample[i]=value;  
            var=Variance(sample,7);  
    }  
    }  
其中 Variance()是我写的计算方差函数,这样就实现了滑动计算数据方差值。
(2)窗口前移,这种实现数据的滑动,设定好窗口大小后,按照FIFO原则,数据不断进入出去,但是这种实现数据滑动后对计算方差增加了难度,这里只说出如何实现窗口向前滑动的代码:
[cpp] view plain copy

    void Function(uint16_t value)  
    {  
        static uint8_t cnt=0;  
        static uint8_t len=7;  
        static uint8_t index=0;  
        static int order[7]={0};  
        static int sample[7]={0};  
        uint8_t i=0;  
          
        sample[index] = value;  
        if(cnt < len)  
        {  
            cnt++;  
        }  
        else  
        {  
            for(i=0;i<cnt;i++)  
            {  
                if(order[i] == index)  
                break;  
            }  
            for(;i+1<cnt;i++)  
            {  
                order[i]=order[i+1];  
            }  
        }  
          
        order[cnt-1] = index;  
        index=(1+index)%len;  
    }  


最后把计算方差的函数Varanice()代码列出来:
[cpp] view plain copy

    double Variance(uint16_t data[], uint8_t n)  
    {  
        double mean = 0, divisor;  
        uint16_t sum = 0,Varian = 0;  
        uint8_t i;  
      
        for(i=0;i<n;i++)  
        {  
            sum = sum + data[i];  
        }  
        mean = sum/n;  
        for(i=0;i<n;i++)  
        {  
            Varian = Varian + pow(data[i]-mean,2);  
        }  
          
        /*程序中divisor是自由度,20是小样本判断的一个标准。如果是小样本的话,约束较大,
            自由度就要减一;如果是大样本的话,自由度为样本个数。*/  
        if(n<20)  
        {  
            divisor = n-1;  
        }     
        else  
        {  
            divisor = n;  
        }  
        return (Varian/divisor);  
          
    } 
以上代码如有错误还望指正,共同进步

分享到: 编辑:wangmin

就业培训申请领取
您的姓名
您的电话
意向课程
点击领取

环球青藤

官方QQ

扫描上方二维码或点击一键加群,免费领取大礼包,加群暗号:青藤。 一键加群

绑定手机号

应《中华人民共和国网络安全法》加强实名认证机制要求,同时为更加全面的体验产品服务,烦请您绑定手机号.

预约成功

本直播为付费学员的直播课节

请您购买课程后再预约

环球青藤移动课堂APP 直播、听课。职达未来!

安卓版

下载

iPhone版

下载
环球青藤官方微信服务平台

刷题看课 APP下载

免费直播 一键购课

代报名等人工服务

课程咨询 学员服务 公众号

扫描关注微信公众号

APP

扫描下载APP

返回顶部