上图转自新浪微博:“阿里代码库有几亿行代码,但其中有很多功能重复的代码,比如单单快排就被重写了几百遍。请设计一个程序,能够将代码库中所有功能重复的代码找出。各位大佬有啥想法,我当时就懵了,然后就挂了。。。”
这里我们把问题简化一下:首先假设两个功能模块如果接受同样的输入,总是给出同样的输出,则它们就是功能重复的;其次我们把每个模块的输出都简化为一个整数(在 int 范围内)。于是我们可以设计一系列输入,检查所有功能模块的对应输出,从而查出功能重复的代码。你的任务就是设计并实现这个简化问题的解决方案。
输入格式:
输入在第一行中给出 2 个正整数,依次为 N(≤104)和 M(≤102),对应功能模块的个数和系列测试输入的个数。
随后 N 行,每行给出一个功能模块的 M 个对应输出,数字间以空格分隔。
输出格式:
首先在第一行输出不同功能的个数 K。随后 K 行,每行给出具有这个功能的模块的个数,以及这个功能的对应输出。数字间以 1 个空格分隔,行首尾不得有多余空格。输出首先按模块个数非递增顺序,如果有并列,则按输出序列的递增序给出。
注:所谓数列 { A1, …, AM } 比 { B1, …, BM } 大,是指存在 1≤i<M,使得 A1=B1,…,Ai=Bi 成立,且 Ai+1>Bi+1。
输入样例:
7 3
35 28 74
-1 -1 22
28 74 35
-1 -1 22
11 66 0
35 28 74
35 28 74
输出样例:
4
3 35 28 74
2 -1 -1 22
1 11 66 0
1 28 74 35
思路
用结构体存储每一个模块, 将其排序后遍历, 这样相同的就在一起, 若当前模块和上一个位置的模块相同, 则将其个数+1, 若不同则加入到答案结构体数组b中。
最后再对b数组进行一次排序即可。
刚开始用的是指针数组来做, 最后排序时总是出现数据错乱的问题, 查了一下才想起来结构体默认对指针是浅拷贝, 深拷贝需要自己实现一个函数, 于是直接用STL的array数组替换掉指针数组, 数组之间的比较也方便了许多。
代码
#include <iostream>
#include <cstring>
#include <algorithm>
#include <string>
#include <cmath>
#include <map>
#include <array>
using namespace std;
const int N = 110, M = 1e4 + 10;
struct Model {
int cnt;
array<int, N> w;
bool operator == (const Model &W) const {
return w == W.w;
};
bool operator < (const Model &W) const {
if(cnt != W.cnt) return cnt > W.cnt;
return w < W.w;
};
void operator = (const Model &W) {
cnt = W.cnt;
w = W.w;
};
}a[M], b[M];
int main()
{
int n,m;
cin >> n >> m;
for(int i = 0; i < n;i ++)
{
for(int j = 0; j < m; j++)
{
int t ;
cin >> t;
a[i].w[j] = t;
}
}
sort(a, a + n);
int tt = 0;
b[0] = a[0];
b[0].cnt = 1;
for(int i = 1; i < n;i ++)
{
if(a[i] == b[tt]) b[tt].cnt++;
else
{
b[++tt] = a[i];
b[tt].cnt = 1;
}
}
sort(b, b + tt + 1);
cout << tt + 1 << endl;
for(int i = 0; i <= tt; i++)
{
cout << b[i].cnt;
for(int j = 0; j < m; j++)
cout << " " << b[i].w[j];
if(i != tt) cout << endl;
}
return 0;
}