從第三方資料來源(如CSV檔案)匯入資料時,常會在SQL Server VARCHAR欄位中遇到奇怪的字元(如Â),這是因為編碼方式不確定造成的常見問題。然而,無論是在資料庫層面還是程式碼層面,都有高效的方法來清理和移除這些字元。
由於SQL Server本身不支援正規表示式,因此您可以建立一個SQL CLR函數來利用.NET的正規表示式功能。具體步驟如下:
StackOverflow
,並貼上以下程式碼:<code class="language-csharp">public class StackOverflow { [SqlFunction(DataAccess = DataAccessKind.None, IsDeterministic = true, Name = "RegexReplace")] public static SqlString Replace(SqlString sqlInput, SqlString sqlPattern, SqlString sqlReplacement) { string input = (sqlInput.IsNull) ? string.Empty : sqlInput.Value; string pattern = (sqlPattern.IsNull) ? string.Empty : sqlPattern.Value; string replacement = (sqlReplacement.IsNull) ? string.Empty : sqlReplacement.Value; return new SqlString(Regex.Replace(input, pattern, replacement)); } }</code>
建置項目,並將產生的StackOverflow.dll
複製到您機器上的已知位置。
將程式集匯入SQL Server:
<code class="language-sql"> CREATE ASSEMBLY [StackOverflow] FROM 'path_to_StackOverflow.dll';</code>
建立SQL CLR函數:
<code class="language-sql"> CREATE FUNCTION [dbo].[StackOverflowRegexReplace] (@input NVARCHAR(MAX), @pattern NVARCHAR(MAX), @replacement NVARCHAR(MAX)) RETURNS NVARCHAR(4000) AS EXTERNAL NAME [StackOverflow].[StackOverflow].[Replace] GO</code>
建立函數後,您可以直接在T-SQL語句中使用它來快速有效地替換字元:
<code class="language-sql">SELECT [dbo].[StackOverflowRegexReplace] ('Hello Kitty Essential Accessory Kit', '[^\u0000-\u007F]', '')</code>
這將傳回字串"Hello Kitty Essential Accessory Kit",其中Â字元已移除。
如果您喜歡C#解決方案,可以使用Regex.Replace
方法執行相同的字元替換:
<code class="language-csharp">string input = "Hello Kitty Essential Accessory Kit"; string output = Regex.Replace(input, @"[^\u0000-\u007F]", string.Empty); Console.WriteLine(output); // "Hello Kitty Essential Accessory Kit"</code>
此方法提供了一種直接且可靠的方法來消除C#程式碼中的非拉丁字元。
以上是如何有效地從 SQL Server VARCHAR 欄位中刪除非拉丁字元(如 Â)?的詳細內容。更多資訊請關注PHP中文網其他相關文章!