📘
Introduction_to_Algorithms
  • Introduction
  • 第6章:堆排序
    • 练习题
    • 思考题
      • 6-3 Young
  • 第7章:快速排序
    • 练习题
    • 思考题
      • 7-6 对区间的模糊排序
  • 第8章:线性时间排序
    • 练习题
      • 8.3-4 O(n)时间内对[0..n^-1]之间的n个数排序
    • 思考题
      • 8-3 排序不同长度的数据项
  • 第9章 排序和顺序统计学算法导论
    • 练习题
      • 9.1-1
      • 9.3-3 快速排序-最坏时间O(nlgn)
      • 9.3-6 nlgk时间求k分位数
      • 9.3-8 求两个数组的中位数
    • 思考题
      • 9-2-c-带权中位数
  • 第10章:栈和队列
    • 10.1 栈和队列
      • 练习题
      • 10.1-2 用一个数组实现两个栈
      • 10.1-5 双端队列
    • 10.2 链表
      • 练习题
      • 10.2-5 环形链表实现字典操作INSERT、DELETE、SEARCH
    • 10.3 指针和对象实现
      • 练习题
      • 10.3-4 紧凑的多重数组
    • 思考题
  • 第11章 散列表
  • [第12章]
    • [笔记和代码]
      • 12-2 基数树
  • 第14章
    • 笔记和代码
      • 14.3-6 MIN GAP
  • 第15章:动态规划
    • 练习题
    • 思考题
      • 15-2 整齐打印
      • 15-3 编辑距离
  • 第20章:斐波那契堆
    • 练习题
    • 思考题
  • ACM解题报告
    • 1043 八数码问题
    • 1053 Entropy
    • 1114 Piggy-Bank 完全背包
    • 1133 catalan数二维变种
    • 1166 敌兵布阵
    • 1281 棋盘游戏 二分匹配与增广链
    • 1394 Minimum Inversion Number
    • 1394 用线段树求逆序数
    • 1787 欧拉函数之在线算法
    • 2438 三分查找
    • 2473 Junk-Mail Filter 并查集的删除
    • 2824 欧拉公式之打表算法
    • 2855 Fibonacci Check-up 矩阵的应用
    • 2642 Stars 二维树状数组
    • 2888 二维RMQ
    • 3033 分组背包之每组至少选一
    • 3307 A^B = C mod D,已知A,C,D,求解B
    • 3465 Life is a Line 用归并排序求逆序数
    • 3483 A Very Simple Problem 数论+矩阵的应用
    • 3518 后缀数组
    • 3579 中国剩余定理(ACM/不互质的情况)
    • 后缀数组
    • B-树
    • 排序算法总结
Powered by GitBook
On this page
  • 题目概述
  • 思考
  • (1)初始化
  • (2)递推
  • (3)反推
  • (4)最后的操作kill
  • 代码
  • DNA对齐问题
  • 原题
  • 思考题
  1. 第15章:动态规划
  2. 思考题

15-3 编辑距离

Previous15-2 整齐打印Next第20章:斐波那契堆

Last updated 4 years ago

题目概述

有六种操作,分别是复制(copy)、替换(replace)、删除(delete)、插入(insert)、交换(twiddle)、消灭(kill)。 将这六种操作任意组合(可以重复或者没有)得到一个操作序列。 操作序列的输入是一个字符串,操作的输出是另一个字符串。 例如字符串algorithm,经过以下操作序列,得到字符串altruistic。 一个字符串src,变成另一个字符串dst,可以很多种方法。 题目要求对于给定的src和dst,找到一种最优的操作序列,包含最少的操作个数,使src变成dst。输出这个操作序列。操作序列中操作的个数就是src到dst的编辑距离。

下面具体解释这六种操作的内容即i和j的含义: i是src的下标,j是dst的下标。操作开始前,i = j = 0。 令x为任意的字符 copy: dst[j] = src[i], i++, j++ replace: dst[j] = x, i++, j++ delete: i++ insert: dst[j] = x, j++ twiddle: dst[j] = src[i+1], dst[j+1] = src[i], i += 2, j += 2 kill: 消灭src中剩下的字符。如果执行这个操作,则它必是最的操作。

思考

对于DP问题,首先要想清楚的是初始化过递推。题目中i和j的递增给了很好的提示。 定义c[i,j]为src的子串src[0,i]变化为dst的子串dst[0,j]的过程的编辑距离。 那么c[src.length(), dst.length()]即src到dst的编辑距离。 这里只是希望操作的个数最少,在操作个数相同的情况下,用什么操作是没有差别的,即每个操作的代价是一样的,即cost(operation) = 1

(1)初始化

c[0,0]=0
c[i,0] = i * cost(delete)
c[0,j] = j * cost(insert)

(2)递推

令c[i, j] = a,根据每个operation的规则,有以下推理

copy: dst[j] = src[i], i++, j++ ==> c[i+1, j+1] = a + cost(copy)
replace: dst[j] = x, i++, j++  ==> c[i+1, j+1] = a + cost(replace)
delete: i++ ==>  c[i+1, j] = a + cost(delete) 
insert: dst[j] = x, j++  ==> c[i, j+1] = a + cost(insert)
twiddle: dst[j] = src[i+1], dst[j+1] = src[i], i += 2, j += 2  ==> c[i+2, j+2] = a + cost(twiddle)
kill: 消灭src中剩下的字符。如果执行这个操作,则它必是最的操作。

(3)反推

(4)最后的操作kill

c[i][j] = MIN(c[m,n], MIN(c[i,n]+cost(kill))), 其中0<=i<m

代码

DNA对齐问题

DNA对齐问题可以看作是带权值的编辑距离问题。 在编辑距离问题中,所有的操作都看作是一样,即cost(operation) = 1 现在把其中一操作加上权值,求最小值改成求最大值,就是DNA对齐问题了。

copy : 1
replace : -1
insert : -2
delete : 去掉
twiddle : 去掉
kill : 去掉

原题

思考题

以上推理是基于现在的结果预测后面的结果。 然后现在的结果并不能决定后面的结果,但现在的结果一定来自于前面的结果。 因此要转换思考方向,将递推进行反推,这一步是DP的难点。

源代码
算法导论-15-1-双调欧几里得旅行商问题
算法导论-15-2-整齐打印
算法导论-15-3-编辑距离
算法导论-15-4-计划一个公司聚会
算法导论-15-6-在棋盘上移动
算法导论-15-7-达到最高效益的调度