PermuTree (Hard Version)
E2-PermuTree (Hard Version) Codeforces Round 890 (Div. 2) supported by Constructor Institute
给定一棵 n 个节点的有根的树,每个节点有一个点权 ai,a 是一个 1..n 的排列。定义 f(a) 为 ai<lca(ai,aj)<aj 的计数,问对于所有排列,f(a) 最大为多少?
Easy Version: n≤5000
Hard Version: n≤1000000
Easy Version 思路
Easy Version
一般地,如果树不是一棵二叉树,那么对于所有节点,将其所有子树分成两部分,使得两部分的乘积尽可能大,即求做优的二叉树划分。这里我们需要对每个点使用背包解决,时间复杂度 O(n2)。
Easy Version 代码
先简单过一遍 Easy Version
#ifdef ONLINE_JUDGE #define TEST 1 #else
#define LOCAL 1 #endif #ifndef LOCAL #define TEST 1 #endif #include <bits/stdc++.h> #define int int64_t #ifdef TEST #pragma GCC optimize(3, "Ofast", "inline") #define endl '\n' #endif #ifdef LOCAL #define endl " **\n" #endif #define tomax(x, y) x = max(x, (y)) #define tomin(x, y) x = min(x, (y)) using namespace std; #ifdef TEST const int MAX = 5005; #else #ifdef LOCAL const int MAX = 105; #endif #endif const int INF = 0x3f3f3f3f3f3f3f3fll; const int MOD = 1000000007; int call_count = 0;
vector<int> edge[MAX]; int sons[MAX]; bool dp[MAX]; int res = 0;
void dfs(int x) { for (int y : edge[x]) { dfs(y); } sons[x] = 1; memset(dp, 0, sizeof(dp)); dp[0] = true; for (int y : edge[x]) { sons[x] += sons[y]; for (int j = MAX - 1; j >= sons[y]; j--) { if (dp[j - sons[y]]) dp[j] = true; } } int max_ = 0; for (int j = 0; j < MAX; j++) { if (dp[j]) { tomax(max_, j * (sons[x] - 1 - j)); } } res += max_; }
void solve() { int n; cin >> n; for (int i = 2; i <= n; i++) { int x; cin >> x; edge[x].push_back(i); } dfs(1); cout << res << endl; }
int32_t main() { #ifdef TEST cin.tie(0); cout.tie(0); ios::sync_with_stdio(false); #endif #ifdef LOCAL freopen("in.txt", "r", stdin); clock_t start_time = clock(); #endif cout << fixed << setprecision(2);
int t = 1; while (t--) solve();
#ifdef LOCAL cout << "Used " << call_count << " Function Calls." << endl; cout << "Used " << (int)(clock() - start_time) << " Microseconds of Time." << endl; #endif return 0; }
对于 Hard Version
,要求都考虑到三种优化才能得到正确的时间复杂度,时间复杂度 O(32nn)。
结论: 对于一个体积为 V 背包,如果保证所有 N 件物品价值求和不超过 A,可以证明使用二进制优化的时间复杂度最坏为 O(VA)。
证明: 首先考虑三个极端,物品变化对时间复杂度的影响一定介于这些极端之间。(更严谨的证明我也不会)
- 如果背包内所有物品体积和价值均相同,二进制优化完全生效,时间复杂度为 O(Vlog2min(N,A))。
- 如果背包内所有物品体积均不同,二进制优化完全失效,但这样的物品数一定不超过 2A。因为为得到数量尽可能多的物品,所有物品价值为 1,物品体积分别为 1..x,必须满足 ∑1xi≤A。时间复杂度为 O(V2A)。
- 如果背包内所有物品价值均不同,与上一条同理,时间复杂度为 O(V2A)。
推论: 对于一个体积为 V 布尔背包,如果保证所有 N 件物品体积求和不超过 A,使用二进制优化的时间复杂度最坏为 O(VA)。
推论: 对于一个体积为 V 背包,如果保证所有 N 件物品价值求和不超过 N,使用二进制优化的时间复杂度最坏为 O(VN)。
为更好隐藏题目意图,A 的取值通常为 N,如本题。
布尔背包的 bitset 优化
布尔背包的定义是,我们并不关心背包的最大价值,只关心背包的特定体积是否可以取到,因此布尔背包的状态转移方程为 dp[i][j]=dp[i−1][j−v[i]] ∣ dp[i−1][j]。bitset 优化背包的时间复杂度为 O(32NV)。
| bool dp[MAX]; dp[0] = true; for (int i = 0; i < n; i++) { for (int j = V; j >= v[i]; j--) { dp[j] |= dp[j - v[i]]; } }
bitset 优化:
| bitset<MAX> dp; dp[0] = true; for (int i = 0; i < n; i++) { dp |= dp << v[i]; }
首先我们来说明为什么必需这步剪枝。对于题目所给的背包问题的优化,我们通过上面讲到的二进制优化和 bitset 优化似乎已经可以得到正确的时间复杂度 O(32nn),但是需要注意的是,我们之前所做的优化都仅仅是对于树上一个节点的优化。我们设节点 u 的子节点(不含孙节点)个数为 su,对应背包元素个数;子孙节点个数为 tu,对应背包体积。则对于该节点时间复杂度为 O(32tusu),总体时间复杂度为 O(∑u32tusu),假设树为链状,依然可以达到 n2。
但是为什么 Easy Version 的时间是正的
在 Easy Version 中,对于每个节点的时间复杂度为 O(tusu),总体时间 ∑utusu≤∑unsu≤n2,我们当然也可以很大方的为每个节点做个体积为 n 的背包。
这样做的正确性在于,对于优化后的解法,时间取决于 ∑utu,树的深度越深,∑utu 趋大。为了使树尽可能深,每个节点需拥有尽可能少的儿子,对于每个节点,最坏的情况是,拥有三个儿子,其中两个相同重,一个重量为 1,如图:
这棵树可以近似的看作一棵满二叉树,那么可以保证 ∑utu≤nlog2n。而在 ∑utu≈nlog2n 的情况下,总时间复杂度 O(∑u32tusu) 中 su 又一定是常数级别,这与限和背包的二进制优化相似,总时间复杂度一定介于 O(32nlog2n) 与 O(32nn) 之间。
敲代码的过程也学到了一些,比如如何开动态大小的 bitset。
#ifdef ONLINE_JUDGE #define TEST 1 #else
#define LOCAL 1 #endif #ifndef LOCAL #define TEST 1 #endif #include <bits/stdc++.h> #define int int64_t #ifdef TEST #pragma GCC optimize(3, "Ofast", "inline") #define endl '\n' #endif #ifdef LOCAL #define endl " **\n" #endif #define tomax(x, y) x = max(x, (y)) #define tomin(x, y) x = min(x, (y)) using namespace std; #ifdef TEST const int MAX = 1000005; #else #ifdef LOCAL const int MAX = 105; #endif #endif const int INF = 0x3f3f3f3f3f3f3f3fll; const int MOD = 1000000007; int call_count = 0;
vector<int> edge[MAX]; int sons[MAX]; int v[MAX]; bool dp[MAX]; int res = 0;
template <size_t len = 1> void bitset_(int sons) { if (len < sons) { bitset_<min(len * 2, (size_t)MAX)>(sons); return; }
bitset<len + 1> dp; dp[0] = true; for (int i = 1; i <= sons; i++) for (int __ = 0; __ < v[i]; __++) dp |= dp << i;
int max_ = 0; for (int i = 1; i <= sons; i++) if (dp[i]) tomax(max_, i * (sons - i));
res += max_; }
void dfs(int x) { sons[x] = 1; if (edge[x].size() == 0) return;
for (int y : edge[x]) { dfs(y); sons[x] += sons[y]; }
sort(edge[x].begin(), edge[x].end(), [&](int x, int y) -> bool { return sons[x] < sons[y]; }); int n = edge[x].size(), max_ = sons[edge[x][n - 1]]; if (max_ * 2 >= sons[x] - 1) { res += max_ * (sons[x] - 1 - max_); return; }
memset(v, 0, sizeof(int) * sons[x]); for (int y : edge[x]) { v[sons[y]]++; } for (int i = 1; i <= sons[x] - 1; i++) { if (v[i] > 2) { int delta = (v[i] - 1) / 2; v[i * 2] += delta; v[i] -= delta * 2; } }
bitset_(sons[x] - 1); }
void solve() { int n; cin >> n; for (int i = 2; i <= n; i++) { int x; cin >> x; edge[x].push_back(i); } dfs(1); cout << res << endl; }
int32_t main() { #ifdef TEST cin.tie(0); cout.tie(0); ios::sync_with_stdio(false); #endif #ifdef LOCAL freopen("in.txt", "r", stdin); clock_t start_time = clock(); #endif cout << fixed << setprecision(2);
int t = 1; while (t--) solve();
#ifdef LOCAL cout << "Used " << call_count << " Function Calls." << endl; cout << "Used " << (int)(clock() - start_time) << " Microseconds of Time." << endl; #endif return 0; }