博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
华为OJ 计算字符串的距离
阅读量:4298 次
发布时间:2019-05-27

本文共 2389 字,大约阅读时间需要 7 分钟。

题目:

描述

Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家Levenshtein提出的,故又叫Levenshtein Distance。
Ex:
字符串A:abcdefg
字符串B: abcdef
通过增加或是删掉字符”g”的方式达到目的。这两种方案都需要一次操作。把这个操作所需要的次数定义为两个字符串的距离。
要求:
给定任意两个字符串,写出一个算法计算它们的编辑距离。

请实现如下接口

/* 功能:计算两个字符串的距离
* 输入:字符串A和字符串B
* 输出:无
* 返回:如果成功计算出字符串的距离,否则返回-1
*/
public static int calStringDistance (String charA, String charB)
{
return 0;
}

知识点 字符串

运行时间限制 10M
内存限制 128
输入
输入两个字符串
输出
得到计算结果
样例输入 abcdefg abcdef
样例输出 1

解答:缕清思路,分析清楚对于每一对相应的字符,到底有几种处理方式,然后使用递归来实现。

注:要是字符进行交换的话,属于2步操作。
如果有两个字符串A和B,如果它们的第一个字符是相同的,只要计算A[2,…,lenA]和B[2,…,lenB]的距离。如果它们的第一个字符是不相同的,那么可以进行如下的操作。
1. 删除A的第一个字符,然后计算A[2,…,lenA]和B[1,…,lenB]的距离;
2. 删除B的第一个字符,然后计算A[1,…,lenA]和B[2,…,lenB]的距离;
3. 修改A的第一个字符为B的第一个字符,然后计算A[2,…,lenA]和B[2,…,lenB]的距离;
4. 修改B的第一个字符为A的第一个字符,然后计算A[2,…,lenA]和B[2,…,lenB]的距离;
5. 增加A的第一个字符到B第一个字符之前,然后计算A[2,…,lenA]和B[1,…,lenB]的距离;
6. 增加B的第一个字符到A第一个字符之前,然后计算A[1,…,lenA]和B[2,…,lenB]的距离。
从上面的分析可以看出,如果A和B的第一个字符不相同,那么可以不管之后会变成什么样,就可以把上面的6个操作合并成下面3个。
1. 一步操作之后,计算A[2,…,lenA]和B[1,…,lenB]的距离;
2. 一步操作之后,计算A[1,…,lenA]和B[2,…,lenB]的距离;
3. 一步操作之后,计算A[2,…,lenA]和B[2,…,lenB]的距离。

下面是java代码的实现:

import java.util.Scanner;public class Other {    public static int getMin(int a, int b, int c)    {        return a < b ? (a < c ? a : c) : (b < c ? b : c);    }     public static int calculateDistance(int pa, int pb, int lenA, int lenB, final char[] A, final char[] B)    {        if(pa >= lenA)        {            if(pb >= lenB) { return 0; }            else { return lenB - pb; }        }        if(pb >= lenB)        {            if(pa >= lenA) { return 0; }            else { return lenA - pa; }        }        if(A[pa] == B[pb])        {            return calculateDistance(pa + 1, pb + 1, lenA, lenB, A, B);        }        else        {            int d1 = calculateDistance(pa, pb + 1, lenA, lenB, A, B);            int d2 = calculateDistance(pa + 1, pb, lenA, lenB, A, B);            int d3 = calculateDistance(pa + 1, pb + 1, lenA, lenB, A, B);            return 1 + getMin(d1, d2, d3);        }    }    public static void main(String[] args) {        Scanner scanner = new Scanner(System.in);        String str1 = scanner.next();        String str2 = scanner.next();        int sum = calculateDistance(0, 0, str1.length(), str2.length(), str1.toCharArray(), str2.toCharArray());        System.out.println(sum);    }}

参考:

转载地址:http://msnws.baihongyu.com/

你可能感兴趣的文章
resize接口实现之-------双线性插值法解读
查看>>
字符识别之----------resize后增加二值化操作,提高字符识别正确率
查看>>
win10下CUDA和CUDNN的安装(超详细)!亲测有效!
查看>>
openalpr截取出的字符识别结果
查看>>
针对字符4识别为X问题的原因
查看>>
排查问题
查看>>
排查问题2
查看>>
海思模型bin模型的使用步骤和注意点
查看>>
问题来了
查看>>
德国车牌识别
查看>>
减少特征,OTUS二值化处理后效果
查看>>
德国车牌识别结果,,
查看>>
Dland_2_test-修改后--------------------------------特征点440 + 16个
查看>>
Dland_1_test-修改后--------------粗外围+粗网格------------------特征点440 + 40+ 16个
查看>>
Dland_2_test-修改后-------13特征+粗外围+粗网格特征------------------特征点440 + 16+56个
查看>>
通过Apache反向代理实现微信服务器80端口访问
查看>>
使用python-aiohttp搭建微信公众平台
查看>>
使用python-aiohttp爬取网易云音乐
查看>>
使用python-aiohttp爬取今日头条
查看>>
从github下载WDK项目的坑
查看>>