NumPy:高效率選擇每行特定列索引
資料選擇是資料分析中至關重要的操作。使用 NumPy 陣列時,從每行中選擇特定列可能是一項常見任務。這種選擇可以透過多種方法來完成,但是根據每行的索引清單選擇列需要更有效的方法。
使用布林數組直接選擇
如果您有一個布林數組來指示要選擇的列,則可以使用直接選擇來有效地提取所需的值。可以透過將索引清單與列範圍進行比較來建立布林數組。例如,給定問題中描述的矩陣X 和索引Y 列表,您可以建立布林數組b,如下所示:
<code class="python">import numpy as np X = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) Y = np.array([1, 0, 2]) b = np.arange(X.shape[1])[np.isin(np.arange(X.shape[1]), Y)]</code>
使用布林數組b,可以執行直接選擇:
<code class="python">result = X[np.arange(X.shape[0]), b]</code>
此方法提供了一種基於布林數組選擇特定列的快速方法。
替代方法
或者,您可以使用np.arange 和基於索引列表 Y 的直接選擇。這種方法涉及建立索引數組並相應地從矩陣X 中進行選擇:
<code class="python">result = X[np.arange(X.shape[0]), Y]</code>
結論
使用布林數組可以有效地在NumPy 中選擇每行的特定列索引。此方法提供基於索引清單的快速、直接的列選擇。對於大型資料數組,這種方法將比基於迭代的方法提供顯著的效能優勢。
以上是如何在 NumPy 中有效地選擇每行的特定列索引?的詳細內容。更多資訊請關注PHP中文網其他相關文章!