9-2-c-带权中位数
题目:
说明如何利用一个线性时间的中位数算法(如9.3节中的SELECT),来在最坏情况下O(n)时间内求出n个数的带权中位数
思考:
step1:利用SELECT中寻找中值的中值的算法,找到主元
step2:用主元把数组分为三段,即A[1..q-1] < A[q] < A[q+1..r]
step3:计算A[1..q-1]=0.5的权值和,是否满足题目中的公式
step4:若满足,A[q]就是所求的数
step5:若不满足,就继续递归使用本算法进行递归查找。偏大就找前半段,偏小就找后半段
代码:
#include <iostream>
using namespace std;
struct node
{
int value;
double weight;
};
void Print(node *A, int len)
{
int i;
for(i = 1; i <= len; i++)
cout<<A[i].value<<' ';
cout<<endl;
for(i = 1; i <= len; i++)
cout<<A[i].weight<<' ';
cout<<endl;
}
/*************最坏情况线性时间的选择**************************************************/
//已经出现很多次了,不解释
int Partition(node *A, int p, int r)
{
int i = p-1, j;
for(j = p; j < r; j++)
{
if(A[j].value <= A[r].value)
{
i++;
swap(A[i], A[j]);
}
}
swap(A[i+1], A[r]);
return i+1;
}
node Select(node *A, int p, int r, int i);
//对每一组从start到end进行插入排序,并返回中值
//插入排序很简单,不解释
node Insert(node *A, int start, int end, int k)
{
int i, j;
for(i = 2; i <= end; i++)
{
node t = A[i];
for(j = i; j >= start; j--)
{
if(j == start)
A[j] = t;
else if(A[j-1].value > t.value)
A[j] = A[j-1];
else
{
A[j] = t;
break;
}
}
}
return A[start+k-1];
}
//根据文中的算法,找到中值的中值
node Find(node *A, int p, int r)
{
int i, j = 0;
int start, end, len = r - p + 1;
node *B = new node[len/5+1];
//每5个元素一组,长度为start到end,对每一组进行插入排序,并返回中值
for(i = 1; i <= len; i++)
{
if(i % 5 == 1)
start = i+p-1;
if(i % 5 == 0 || i == len)
{
j++;
end = i+p-1;
//对每一组从start到end进行插入排序,并返回中值,如果是最后一组,组中元素个数可能少于5
node ret = Insert(A, start, end, (end-start)/2+1);
//把每一组的中值挑出来形成一个新的数组
B[j] = ret;
}
}
//对这个数组以递归调用Select()的方式寻找中值
node ret = Select(B, 1, j, (j+1)/2);
//delete []B;
return ret;
}
//以f为主元的划分
int Partition2(node *A, int p, int r, node f)
{
int i;
//找到f的位置并让它与A[r]交换
for(i = p; i < r; i++)
{
if(A[i].value == f.value)
{
swap(A[i], A[r]);
break;
}
}
return Partition(A, p, r);
}
//寻找数组A[p..r]中的第i大的元素,i是从1开始计数,不是从p开始
node Select(node *A, int p, int r, int i)
{
//如果数组中只有一个元素,则直接返回
if(p == r)
return A[p];
//根据文中的算法,找到中值的中值
node f = Find(A, p, r);
//以这个中值为主元的划分,返回中值在整个数组A[1..len]的位置
//因为主元是数组中的某个元素,划分好是这样的,A[p..q-1] <= f < A[q+1..r]
int q = Partition2(A, p, r, f);
//转换为中值在在数组A[p..r]中的位置
int k = q - p + 1;
//与所寻找的元素相比较
if(i == k)
return A[q];
else if(i < k)
return Select(A, p, q-1, i);
else
//如果主元是数组中的某个元素,后面一半要这样写
return Select(A, q+1, r, i-k);
//但是如果主元不是数组中的个某个元素,后面一半要改成Select(A, q, r, i-k+1)
}
//寻找数组A[p..r]中的第i大的元素,i是从1开始计数,不是从p开始
node Select2(node *A, int p, int r, double i)
{
//如果数组中只有一个元素,则直接返回
if(p == r)
return A[p];
//根据文中的算法,找到中值的中值
node f = Find(A, p, r);
//以这个中值为主元的划分,返回中值在整个数组A[1..len]的位置
//因为主元是数组中的某个元素,划分好是这样的,A[p..q-1] <= f < A[q+1..r]
int q = Partition2(A, p, r, f);
//转换为中值在在数组A[p..r]中的位置
int k = q - p + 1;
//与所寻找的元素相比较
double w = 0;
for(int j = p; j <= k; j++)
w += A[j].weight;
if(w-A[k].weight < i && w >= i)
return A[q];
else if(w-A[k].weight >= i)
return Select2(A, p, q-1, i);
else
//如果主元是数组中的某个元素,后面一半要这样写
return Select2(A, q+1, r, i-w);
//但是如果主元不是数组中的个某个元素,后面一半要改成Select(A, q, r, i-k+1)
}
int main()
{
int n, sum = 0, i;
cin>>n;
node *A = new node[n+1];
int *B = new int[n+1];
//生成随机数据
for(i = 1; i <= n; i++)
{
A[i].value = rand() % 100;
do{B[i] = rand() % 100;}while(B[i]==0);
sum = sum + B[i];
}
//将权值规格化
for(i = 1; i <= n; i++)
A[i].weight = (double)B[i]/sum;
//打印生成的数据
Print(A, n);
//求带权中位数
cout<<Select2(A, 1, n, 0.5).value<<endl;
return 0;
}
Last updated