Mengalih keluar Aksara Tidak Diingini daripada SQL Server varchar Lajur
Data yang diimport daripada sumber luaran selalunya mengandungi aksara yang tidak dijangka atau bukan standard yang perlu dialih keluar daripada lajur varchar SQL Server. Artikel ini menunjukkan cara menangani perkara ini menggunakan kedua-dua fungsi C# dan SQL CLR.
Penyelesaian C# menggunakan Ungkapan Biasa
Enjin ekspresi biasa .NET menyediakan cara yang berkuasa untuk mengendalikan perkara ini. Kod C# berikut menggunakan Regex.Replace
untuk menghapuskan aksara yang tidak boleh dicetak:
<code class="language-csharp">Regex.Replace(inputString, @"[^\u0000-\u007F]", string.Empty);</code>
Fungsi SQL CLR untuk Kefungsian Dipertingkat
Memandangkan SQL Server tidak mempunyai sokongan ekspresi biasa asli, mencipta fungsi SQL CLR memperluaskan keupayaannya. Contoh di bawah, StackOverflowRegexReplace
, melakukan penggantian ungkapan biasa:
<code class="language-csharp">public static SqlString Replace(SqlString sqlInput, SqlString sqlPattern, SqlString sqlReplacement) { string input = (sqlInput.IsNull) ? string.Empty : sqlInput.Value; string pattern = (sqlPattern.IsNull) ? string.Empty : sqlPattern.Value; string replacement = (sqlReplacement.IsNull) ? string.Empty : sqlReplacement.Value; return new SqlString(Regex.Replace(input, pattern, replacement)); }</code>
Untuk menggunakan fungsi ini:
StackOverflow.dll
.CREATE ASSEMBLY
.CREATE FUNCTION
.Contoh Penggunaan:
<code class="language-sql">SELECT [dbo].[StackOverflowRegexReplace] ('Hello Kitty Essential Accessory Kit', '[^\u0000-\u007F]', '') -- Result: Hello Kitty Essential Accessory Kit</code>
Kaedah ini membersihkan aksara bukan standard secara berkesan daripada lajur varchar SQL Server anda, meningkatkan integriti data dan mencegah kemungkinan isu.
Atas ialah kandungan terperinci Bagaimana untuk Membersihkan Watak Aneh daripada SQL Server varchar Lajur Menggunakan C# dan SQL CLR?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!