產生隨機資料在資料科學領域非常重要。從建構神經網路預測、股市數據等來看,通常都會將日期當作參數之一。我們可能需要在兩個日期之間產生隨機數以進行統計分析。本文將展示如何產生兩個給定日期之間的 k 個隨機日期
日期時間是Python內建的處理時間的函式庫。另一方面,隨機模組有助於產生隨機數。因此,我們可以結合隨機和日期時間模組來產生兩個日期之間的隨機日期。
random.randint(start, end, k)
這裡的random指的是Python隨機函式庫。 randint 方法採用三個重要的開始、結束和 k(元素數量)。開始和結束指定了我們產生隨機數所需的數字範圍。 k定義了我們需要產生的數字的數量
在下面的範例中,我們建立了一個名為generate_random_dates 的函數,它將開始日期、結束日期和要產生的隨機日期的數量作為參數。對於 k 個隨機數,使用 random 模組。我們將此數字加到開始日期,但在結束日期範圍內。
import random from datetime import timedelta, datetime def generate_random_dates(start_date, end_date, k): random_dates = [] date_range = end_date - start_date for _ in range(k): random_days = random.randint(0, date_range.days) random_date = start_date + timedelta(days=random_days) random_dates.append(random_date) return random_dates start_date = datetime(2023, 5, 25) end_date = datetime(2023, 5, 31) random_dates = generate_random_dates(start_date, end_date, 5) print("The random dates generated are:") for index, date in enumerate(random_dates): print(f"{index+1}. {date.strftime('%Y-%m-%d')}")
The random dates generated are: 1. 2023-05-27 2. 2023-05-26 3. 2023-05-27 4. 2023-05-25 5. 2023-05-29
Python 中的雜湊函數會產生一個固定長度的字串字符,稱為雜湊值。我們可以使用雜湊函數來引入隨機性。哈希函數根據其輸入產生看似隨機的值。透過對 date_range 應用模運算,產生的雜湊值被限制為所需日期範圍內的一系列可能值。
hash(str(<some value>)) % <range of dates>
根據某些底層架構,雜湊函數可以取得字串並傳回雜湊值。 % 是模運算符,用於計算值的餘數。這可確保結果始終至少在所需的範圍內。
在下面的程式碼中,我們迭代了 k 次。我們使用雜湊函數來產生字串的雜湊值。接下來,我們對日期範圍進行模組操作,以確保資料位於特定的開始和結束日期內。我們將產生的隨機日期附加到名為 random_dates 的清單
from datetime import timedelta, datetime def generate_random_dates(start_date, end_date, k): random_dates = [] date_range = (end_date - start_date).days + 1 for _ in range(k): random_days = hash(str(_)) % date_range random_date = start_date + timedelta(days=random_days) random_dates.append(random_date) return random_dates # Example usage start_date = datetime(2023, 5, 25) end_date = datetime(2023, 5, 31) random_dates = generate_random_dates(start_date, end_date, 5) print("The random dates generated are:") for index, date in enumerate(random_dates): print(f"{index+1}. {date.strftime('%Y-%m-%d')}")
The random dates generated are: 1. 2023-05-28 2. 2023-05-28 3. 2023-05-25 4. 2023-05-27 5. 2023-05-28
Numpy 和 Pandas 是用於數學計算和資料分析的流行 Python 函式庫。 NumPy 庫有一個隨機方法,我們可以用它來產生隨機數。另一方面,我們可以使用 Pandas 庫來產生日期範圍。
numpy.random.randint(start, end , size=<size of the output array> , dtype=<data type of the elements>, other parameters.....)
隨機數是 NumPy 函式庫的一個模組。 randint 方法將開始和結束作為所需參數。它定義了我們查找隨機數字所需的數字範圍。 size 定義輸出陣列的大小,dtype 表示元素的資料類型。
在下面的程式碼中,我們建立了一個名為generate_random_dates的函數,它將開始日期、結束日期和天數作為參數,並以清單的形式傳回一系列隨機日期。我們使用 Pandas 函式庫來初始化日期,並使用 Numpy 函式庫來產生數字。
import numpy as np import pandas as pd def generate_random_dates(start_date, end_date, k): date_range = (end_date - start_date).days + 1 random_days = np.random.randint(date_range, size=k) random_dates = pd.to_datetime(start_date) + pd.to_timedelta(random_days, unit='d') return random_dates start_date = datetime(2021, 5, 25) end_date = datetime(2021, 5, 31) print("The random dates generated are:") random_dates = generate_random_dates(start_date, end_date, 5) for index,date in enumerate(random_dates): print(f"{index+1}. {date.strftime('%Y-%m-%d')}")
The random dates generated are: 1. 2021-05-26 2. 2021-05-27 3. 2021-05-27 4. 2021-05-25 5. 2021-05-27
Arrow 是一個 Python 函式庫。這提供了一種更好、更優化的方式來處理日期和時間。我們可以使用箭頭的 get 方法來取得日期格式的時間,並使用隨機庫來隨機取得開始日期和結束日期之間的 k 個數字。
arrow.get(date_string, format=<format of the date string> , tzinfo=<time zone information>)
箭頭代表Python的arrow模組。 date_string 表示我們需要解析的日期和時間字串。然而,它應該採用箭頭模組可以識別的格式。 format 定義 date_string 的格式。 tzinfo 提供時區資訊。
我們在下面的程式碼中使用了箭頭方法來產生隨機日期。我們定義了一個名為generate_random_dates的自訂函式。我們在函數內迭代了 k 次。我們對每次迭代使用統一方法來產生隨機日期。我們將日期轉移到隨機日期,以便隨機日期落在該範圍內。我們將日期附加到 random_dates 清單並傳回值。
import random import arrow def generate_random_dates(start_date, end_date, k): random_dates = [] date_range = (end_date - start_date).days for _ in range(k): random_days = random.uniform(0, date_range) random_date = start_date.shift(days=random_days) random_dates.append(random_date) return random_dates start_date = arrow.get('2023-01-01') end_date = arrow.get('2023-12-31') random_dates = generate_random_dates(start_date, end_date, 7) print("The random dates generated are:") for index,date in enumerate(random_dates): print(f"{index+1}. {date.strftime('%Y-%m-%d')}")
The random dates generated are: 1. 2023-02-05 2. 2023-10-17 3. 2023-10-08 4. 2023-04-18 5. 2023-04-02 6. 2023-08-22 7. 2023-01-01
在本文中,我們討論瞭如何使用不同的 Python 庫產生給定兩個日期之間的隨機日期。在不使用任何內建庫的情況下產生隨機日期是一項乏味的任務。因此,建議使用函式庫和方法來執行該任務。我們可以使用日期時間、Numpy pandas 等來產生隨機日期。這些程式碼不是方法等。
以上是如何使用Python產生兩個日期之間的k個隨機日期?的詳細內容。更多資訊請關注PHP中文網其他相關文章!