9-2-c-带权中位数

题目:

说明如何利用一个线性时间的中位数算法(如9.3节中的SELECT),来在最坏情况下O(n)时间内求出n个数的带权中位数

思考:

step1:利用SELECT中寻找中值的中值的算法,找到主元

step2:用主元把数组分为三段,即A[1..q-1] < A[q] < A[q+1..r]

step3:计算A[1..q-1]=0.5的权值和,是否满足题目中的公式

step4:若满足,A[q]就是所求的数

step5:若不满足,就继续递归使用本算法进行递归查找。偏大就找前半段,偏小就找后半段

代码:

#include <iostream>
using namespace std;

struct node
{
    int value;
    double weight;
};
void Print(node *A, int len)
{
    int i;
    for(i = 1; i <= len; i++)
        cout<<A[i].value<<' ';
    cout<<endl;
    for(i = 1; i <= len; i++)
        cout<<A[i].weight<<' ';
    cout<<endl;
}
/*************最坏情况线性时间的选择**************************************************/
//已经出现很多次了,不解释
int Partition(node *A, int p, int r)
{
    int i = p-1, j;
    for(j = p; j < r; j++)
    {
        if(A[j].value <= A[r].value)
        {
            i++;
            swap(A[i], A[j]);
        }
    }
    swap(A[i+1], A[r]);
    return i+1;
}
node Select(node *A, int p, int r, int i);
//对每一组从start到end进行插入排序,并返回中值
//插入排序很简单,不解释
node Insert(node *A, int start, int end, int k)
{
    int i, j;
    for(i = 2; i <= end; i++)
    {
        node t = A[i];
        for(j = i; j >= start; j--)
        {
            if(j == start)
                A[j] = t;
            else if(A[j-1].value > t.value)
                A[j] = A[j-1];
            else
            {
                A[j] = t;
                break;
            }
        }
    }
    return A[start+k-1];
}
//根据文中的算法,找到中值的中值
node Find(node *A, int p, int r)
{
    int i, j = 0;
    int start, end, len = r - p + 1;
    node *B = new node[len/5+1];
    //每5个元素一组,长度为start到end,对每一组进行插入排序,并返回中值
    for(i = 1; i <= len; i++)
    {
        if(i % 5 == 1)
            start = i+p-1;
        if(i % 5 == 0 || i == len)
        {
            j++;
            end = i+p-1;
            //对每一组从start到end进行插入排序,并返回中值,如果是最后一组,组中元素个数可能少于5
            node ret = Insert(A, start, end, (end-start)/2+1);
            //把每一组的中值挑出来形成一个新的数组
            B[j] = ret;    
        }
    }
    //对这个数组以递归调用Select()的方式寻找中值
    node ret = Select(B, 1, j, (j+1)/2);
    //delete []B;
    return ret;
}
//以f为主元的划分
int Partition2(node *A, int p, int r, node f)
{
    int i;
    //找到f的位置并让它与A[r]交换
    for(i = p; i < r; i++)
    {
        if(A[i].value == f.value)
        {
            swap(A[i], A[r]);
            break;
        }
    }
    return Partition(A, p, r);
}
//寻找数组A[p..r]中的第i大的元素,i是从1开始计数,不是从p开始
node Select(node *A, int p, int r, int i)
{
    //如果数组中只有一个元素,则直接返回
    if(p == r)
        return A[p];
    //根据文中的算法,找到中值的中值
    node f = Find(A, p, r);
    //以这个中值为主元的划分,返回中值在整个数组A[1..len]的位置
    //因为主元是数组中的某个元素,划分好是这样的,A[p..q-1] <= f < A[q+1..r]
    int q = Partition2(A, p, r, f);
    //转换为中值在在数组A[p..r]中的位置
    int k = q - p + 1;
    //与所寻找的元素相比较
    if(i == k)
        return A[q];
    else if(i < k)
        return Select(A, p, q-1, i);
    else
        //如果主元是数组中的某个元素,后面一半要这样写
        return Select(A, q+1, r, i-k);
        //但是如果主元不是数组中的个某个元素,后面一半要改成Select(A, q, r, i-k+1)
}
//寻找数组A[p..r]中的第i大的元素,i是从1开始计数,不是从p开始
node Select2(node *A, int p, int r, double i)
{
    //如果数组中只有一个元素,则直接返回
    if(p == r)
        return A[p];
    //根据文中的算法,找到中值的中值
    node f = Find(A, p, r);
    //以这个中值为主元的划分,返回中值在整个数组A[1..len]的位置
    //因为主元是数组中的某个元素,划分好是这样的,A[p..q-1] <= f < A[q+1..r]
    int q = Partition2(A, p, r, f);
    //转换为中值在在数组A[p..r]中的位置
    int k = q - p + 1;
    //与所寻找的元素相比较
    double w = 0;
    for(int j = p; j <= k; j++)
        w += A[j].weight;
    if(w-A[k].weight < i && w >= i)
        return A[q];
    else if(w-A[k].weight >= i)
        return Select2(A, p, q-1, i);
    else
        //如果主元是数组中的某个元素,后面一半要这样写
        return Select2(A, q+1, r, i-w);
        //但是如果主元不是数组中的个某个元素,后面一半要改成Select(A, q, r, i-k+1)
}
int main()
{
    int n, sum = 0, i;
    cin>>n;
    node *A = new node[n+1];
    int *B = new int[n+1];
    //生成随机数据
    for(i = 1; i <= n; i++)
    {
        A[i].value = rand() % 100;
        do{B[i] = rand() % 100;}while(B[i]==0);
        sum = sum + B[i];
    }
    //将权值规格化
    for(i = 1; i <= n; i++)
        A[i].weight = (double)B[i]/sum;
    //打印生成的数据
    Print(A, n);
    //求带权中位数
    cout<<Select2(A, 1, n, 0.5).value<<endl;
    return 0;
}

Last updated