masyarakat

Belajar

Perpustakaan Alatan

Alat AI

Masa lapang

Melayu

Rumah > pembangunan bahagian belakang > tutorial php > similar_text算相似性时归一化时的疑义

similar_text算相似性时归一化时的疑义

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Lepaskan： 2016-06-13 13:14:58

asal

1073 orang telah melayarinya

similar_text算相似性时归一化时的疑问
我在算两个字符串的长度时，发现归一化时好像此函数采取的方式不一样。
第一次，我试了两个不一样长的字符串，算其编辑距离：
echo "levenshtein计算：\n";echo levenshtein("seller_id","selr_id");echo "\n";
得到的结果是：2

再用同样的两个字符串，用PHP的similar_text函数来求其相似性
echo "similar_text计算：\n";similar_text("seller_id","selr_id",$percent);
echo $percent;
出现在相似性是：87.5
把2这个距离归一化时，正好符合公式：1-（编辑距离/(两个字符串的长度之和)）

第二次，我试了两个一样长度的字符串，分别算其编辑距离和相似性
similar_text("abcd","1234",$percent);echo $percent;echo "\n";
echo levenshtein("abcd","1234");
得到的值分别为：4和0
正好符合公式：1-（编辑距离/(任一个字符串的长度)）

我的问题是：为什么对两个不一样长的字符串求相似性时，分母是两个字符串的长度之和呢？
我在网上找了些pdf文档看，对编辑距离归一化时，其分母是最长的那个字符串的长度呢。

------解决方案--------------------
应该说 similar_text 函数的设计者，考虑的还是蛮周到的
当传入的两个串长度相同时，计算的相似度与理论上并无差异
当传入的两个串长度不同时，得到的相似度不像理论上的那么陡峭。也就是说被匹配的概率变大
当然如果你不希望这样的话可以自行计算，串都是你的，他也返回了已匹配的数量。计算一下并不困难

Label berkaitan：

echo nbsp quot text

Artikel sebelumnya： Thinkphp3.0中URL有关问题 Artikel seterusnya： cakephp运用事务

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel terbaru oleh pengarang

Apakah itu NullPointerException, dan bagaimana saya membetulkannya?

2024-10-22 09:46:29
Daripada Novis kepada Coder: Perjalanan Anda Bermula dengan Asas C

2024-10-13 13:53:41
Membuka Kunci Pembangunan Web dengan PHP: Panduan Pemula

2024-10-12 12:15:51
Demystifying C: Laluan Yang Jelas dan Mudah untuk Pengaturcara Baharu

2024-10-11 22:47:31
Buka Potensi Pengekodan Anda: Pengaturcaraan C untuk Pemula Mutlak

2024-10-11 19:36:51
Lepaskan Pengaturcara Dalaman Anda: C untuk Pemula Mutlak

2024-10-11 15:50:41
Automasi Kehidupan Anda dengan C: Skrip dan Alat untuk Pemula

2024-10-11 15:07:41
PHP Dipermudahkan: Langkah Pertama Anda dalam Pembangunan Web

2024-10-11 14:21:21
Bina Apa sahaja dengan Python: Panduan Pemula untuk Melancarkan Kreativiti Anda

2024-10-11 12:59:11
Kunci Pengekodan: Membuka Kunci Kuasa Python untuk Pemula

2024-10-11 12:17:31

Isu terkini

angular.js - Bagaimana untuk mendapatkan dua aksara "B" dan "D" dalam js sudut dalam json{B:["Beijing", "Baoding", "Baotou"], D:["Dalian", "Dandong"] }

daripada 1970-01-01 08:00:00

0

0

0

javascript - (_a = [""], _a.raw = [""],....);

daripada 1970-01-01 08:00:00

0

0

0

javascript - Bagaimanakah anda mentakrifkan "mahir", "mahir", "biasa", "umum" dan "pemahaman" PHP, Python dan Java?

daripada 1970-01-01 08:00:00

0

0

0

Manakah yang lebih cekap, $("#content .abc") atau $("#content").find(".abc")?

daripada 1970-01-01 08:00:00

0

0

0

Sijil telah tamat tempoh "error_code":"2034" Apakah ralatnya?

daripada 1970-01-01 08:00:00

0

0

0

Topik-topik yang berkaitan

Lagi>

Cadangan popular

Tutorial Popular

Lagi>

Tutorial berkaitan

Cadangan popular

Kursus terkini

Muat turun terkini

Lagi>

kesan web

Kod sumber laman web

Bahan laman web

Templat hujung hadapan