Python のシーケンススライスの添字問題の詳細な例-Python チュートリアル-php.cn

ホームページ

バックエンド開発

Python チュートリアル

Python のシーケンススライスの添字問題の詳細な例

黄舟

Jun 18, 2017 am 11:29 AM

python 添字についてスライス

この記事では、主に Python のシーケンススライスの添字付けに関する関連情報をサンプルコードを通じて詳しく紹介します。必要な方は以下を参照してください。。

はじめに

Python では、タプル、リスト、string のいずれであっても、スライスはよく使用される構文です。一般的な構文は次のとおりです。

sequence[ilow: ihigh :step] # ihigh、step は空にすることができます。わかりやすくするために、step の使用法は一時的に考慮から除外されますsequence[ilow:ihigh:step] # ihigh,step 可为空; 为了简短易懂, 暂时排除step的用法考虑

先来简单示范下用法

sequence = [1,2,3,4,5]
sequence [ilow:ihigh] # 从ilow开始到ihigh-1结束
sequence [ilow:]  # 从ilow开始直到末尾
sequence [:ihigh]  # 从头部开始直到ihigh结束
sequence [:]   # 复制整个列表

ログイン後にコピー

语法很简洁, 也很容易理解, 这种语法在我们日常使用中是简单又好用, 但我相信在我们使用这种切片语法时, 都会习惯性谨遵一些规则:

ilow, ihigh均小于 sequece的长度
ilow < ihigh

因为在大部分情况下, 只有遵循上面的规则, 才能得到我们预期的结果! 可是如果我不遵循呢? 切片会怎样?

不管我们在使用元组, 列表还是字符串, 当我们想取中一个元素时, 我们会用到如下语法:

sequence = [1,2,3,4,5]
print sequence[1] # 输出2
print sequence[2] # 输出3

ログイン後にコピー

上面出现的 1,2 我们姑且称之为下标, 不管是元组, 列表还是字符串, 我们都能通过下标来取出对应的值, 但是如果下标超过对象的长度, 那么将触发索引异常(IndexError)

sequence = [1,2,3,4,5]
print sequence[15] 

### 输出 ###
Traceback (most recent call last):
 File "test.py", line 2, in <module>
 print a[20]
IndexError: list index out of range

ログイン後にコピー

那么对于切片呢? 两种语法很相似, 假设我 ilow 和 ihigh分别是10和20, 那么结果是怎样呢

情景重现

# version: python2.7

a = [1, 2, 3, 5]
print a[10:20] # 结果会报异常吗?

ログイン後にコピー

看到10和20, 完全超出了序列a的长度, 由于前面的代码, 或者以前的经验, 我们总会觉得这样肯定也会导致一个IndexError,那我们开终端来试验下:

>>> a = [1, 2, 3, 5]
>>> print a[10:20]
[]

ログイン後にコピー

结果居然是: [], 这感觉有点意思.是只有列表才会这么, 字符串呢, 元组呢?

>>> s = &#39;23123123123&#39;
>>> print s[400:2000]
&#39;&#39;
>>> t = (1, 2, 3,4)
>>> print t[200: 1000]
()

ログイン後にコピー

结果都和列表的类似, 返回属于各自的空结果.

看到结果的我们眼泪掉下来, 不是返回一个IndexError, 而是直接返回空, 这让我们不禁想到, 其实语法相似, 背后的东西肯定还是不同的, 那我们下面一起来尝试去解释下这结果吧

原理分析

在揭开之前, 咱们要先搞清楚, python是怎样处理这个切片的, 可以通过dis模块来协助:

############# 切片 ################
[root@iZ23pynfq19Z ~]# cat test.py
a = [11,2,3,4]
print a[20:30]

#结果:
[root@iZ23pynfq19Z ~]# python -m dis test.py 
 1   0 LOAD_CONST    0 (11)
    3 LOAD_CONST    1 (2)
    6 LOAD_CONST    2 (3)
    9 LOAD_CONST    3 (4)
    12 BUILD_LIST    4
    15 STORE_NAME    0 (a)

 2   18 LOAD_NAME    0 (a)
    21 LOAD_CONST    4 (20)
    24 LOAD_CONST    5 (30)
    27 SLICE+3    
    28 PRINT_ITEM   
    29 PRINT_NEWLINE  
    30 LOAD_CONST    6 (None)
    33 RETURN_VALUE 

############# 单下标取值 ################
[root@gitlab ~]# cat test2.py
a = [11,2,3,4]
print a[20]

#结果:
[root@gitlab ~]# python -m dis test2.py
 1   0 LOAD_CONST    0 (11)
    3 LOAD_CONST    1 (2)
    6 LOAD_CONST    2 (3)
    9 LOAD_CONST    3 (4)
    12 BUILD_LIST    4
    15 STORE_NAME    0 (a)

 2   18 LOAD_NAME    0 (a)
    21 LOAD_CONST    4 (20)
    24 BINARY_SUBSCR  
    25 PRINT_ITEM   
    26 PRINT_NEWLINE  
    27 LOAD_CONST    5 (None)
    30 RETURN_VALUE

ログイン後にコピー

在这简单介绍下dis模块, 有经验的老司机都知道, python在解释脚本时, 也是存在一个编译的过程, 编译的结果就是我们经常看到的pyc文件, 这里面codeobject对象组成的字节码, 而dis就是将这些字节码用比较可观的方式展示出来, 让我们看到执行的过程, 下面是dis的输出列解释:

第一列是数字是原始源代码的行号。
第二列是字节码的偏移量：LOAD_CONST在第0行.以此类推。
第三列是字节码人类可读的名字。它们是为程序员所准备的
第四列表示指令的参数
第五列是计算后的实际参数

前面就不赘述了, 就是读常量存变量的过程, 最主要的区别就是: test.py 切片是使用了字节码 SLICE+3实现的, 而test2.py 单下标取值主要通过字节码BINARY_SUBSCR实现的,如同我们猜测的一样, 相似的语法却是截然不同的代码.因为我们要展开讨论的是切片(SLICE+3), 所以就不再展开BINARY_SUBSCR, 感兴趣的童鞋可以查看相关源码了解具体实现, 位置: python/object/ceval.c

那我们下面来展开讨论下 SLICE+3

/*取自: python2.7 python/ceval.c */

// 第一步: 
PyEval_EvalFrameEx(PyFrameObject *f, int throwflag)
{
  .... // 省略n行代码
  TARGET_WITH_IMPL_NOARG(SLICE, _slice)
  TARGET_WITH_IMPL_NOARG(SLICE_1, _slice)
  TARGET_WITH_IMPL_NOARG(SLICE_2, _slice)
  TARGET_WITH_IMPL_NOARG(SLICE_3, _slice)
  _slice:
  {
   if ((opcode-SLICE) & 2)
    w = POP();
   else
    w = NULL;
   if ((opcode-SLICE) & 1)
    v = POP();
   else
    v = NULL;
   u = TOP();
   x = apply_slice(u, v, w); // 取出v: ilow, w: ihigh, 然后调用apply_slice
   Py_DECREF(u);
   Py_XDECREF(v);
   Py_XDECREF(w);
   SET_TOP(x);
   if (x != NULL) DISPATCH();
   break;
  }

 .... // 省略n行代码
}

// 第二步:
apply_slice(PyObject *u, PyObject *v, PyObject *w) /* return u[v:w] */
{
 PyTypeObject *tp = u->ob_type;  
 PySequenceMethods *sq = tp->tp_as_sequence;

 if (sq && sq->sq_slice && ISINDEX(v) && ISINDEX(w)) { // v,w的类型检查,要整型/长整型对象
  Py_ssize_t ilow = 0, ihigh = PY_SSIZE_T_MAX;
  if (!_PyEval_SliceIndex(v, &ilow))    // 将v对象再做检查, 并将其值转换出来,存给ilow
   return NULL;
  if (!_PyEval_SliceIndex(w, &ihigh))    // 同上
   return NULL;
  return PySequence_GetSlice(u, ilow, ihigh);  // 获取u对象对应的切片函数
 }
 else {
  PyObject *slice = PySlice_New(v, w, NULL);
  if (slice != NULL) {
   PyObject *res = PyObject_GetItem(u, slice);
   Py_DECREF(slice);
   return res;
  }
  else
   return NULL;
 }

// 第三步:
PySequence_GetSlice(PyObject *s, Py_ssize_t i1, Py_ssize_t i2)
{
 PySequenceMethods *m;
 PyMappingMethods *mp;

 if (!s) return null_error();

 m = s->ob_type->tp_as_sequence;
 if (m && m->sq_slice) {
  if (i1 < 0 || i2 < 0) {
   if (m->sq_length) {
    // 先做个简单的初始化, 如果左右下表小于, 将其加上sequence长度使其归为0
    Py_ssize_t l = (*m->sq_length)(s);
    if (l < 0)
     return NULL;
    if (i1 < 0)
     i1 += l;
    if (i2 < 0)
     i2 += l;
   }
  }
  // 真正调用对象的sq_slice函数, 来执行切片的操作
  return m->sq_slice(s, i1, i2);
 } else if ((mp = s->ob_type->tp_as_mapping) && mp->mp_subscript) {
  PyObject *res;
  PyObject *slice = _PySlice_FromIndices(i1, i2);
  if (!slice)
   return NULL;
  res = mp->mp_subscript(s, slice);
  Py_DECREF(slice);
  return res;
 }

 return type_error("&#39;%.200s&#39; object is unsliceable", s);

ログイン後にコピー

虽然上面的代码有点长, 不过关键地方都已经注释出来, 而我们也只需要关注那些地方就足够了. 如上, 我们知道最终是要执行 m->sq_slice(s, i1, i2)

使用法を簡単に説明しましょう

// 字符串对象
StringObject.c: (ssizessizeargfunc)string_slice, /*sq_slice*/

// 列表对象
ListObject.c: (ssizessizeargfunc)list_slice,  /* sq_slice */

// 元组
TupleObject.c: (ssizessizeargfunc)tupleslice,  /* sq_slice */

ログイン後にコピー

構文は非常に簡潔で簡単です。この構文はシンプルで日常的に使いやすいですが、このスライス構文を使用するときは、習慣的にいくつかのルールに従うことになると思います。

ilow、ihigh はどちらもシーケンスの長さより小さいです

ilow < ihigh

🎜なぜなら、ほとんどの場合、上記のルールに従えば、期待した結果を得ることができます。しかし、従わなかったら、スライスはどうなるでしょうか? 🎜🎜 要素を取得したい場合は、次の構文を使用します: 🎜🎜🎜🎜

/* 取自ListObject.c */
static PyObject *
list_slice(PyListObject *a, Py_ssize_t ilow, Py_ssize_t ihigh)
{
 PyListObject *np;
 PyObject **src, **dest;
 Py_ssize_t i, len;
 if (ilow < 0)
  ilow = 0;
 else if (ilow > Py_SIZE(a))    // 如果ilow大于a长度, 那么重新赋值为a的长度
  ilow = Py_SIZE(a);
 if (ihigh < ilow)  
  ihigh = ilow;
 else if (ihigh > Py_SIZE(a))    // 如果ihigh大于a长度, 那么重新赋值为a的长度 
  ihigh = Py_SIZE(a);
 len = ihigh - ilow;
 np = (PyListObject *) PyList_New(len); // 创建一个ihigh - ilow的新列表对象
 if (np == NULL)
  return NULL;

 src = a->ob_item + ilow;
 dest = np->ob_item;
 for (i = 0; i < len; i++) {    // 将a处于该范围内的成员, 添加到新列表对象
  PyObject *v = src[i];
  Py_INCREF(v);
  dest[i] = v;
 }
 return (PyObject *)np;
}

ログイン後にコピー

🎜 上に表示される 1 と 2 を添字と呼びます。タプル、リスト、文字列のいずれであっても、添字を使用して対応する値を取得できます。オブジェクトの長さを超えると IndexError (IndexError) が発生します🎜🎜🎜🎜rrreee🎜 それでは、2 つの構文がそれぞれ 10 と 20 であると仮定すると、結果はどうなるでしょうか? rrreee🎜 シーケンス a の長さを完全に超えている 10 と 20 を参照してください。前のコードまたは以前の経験により、これは間違いなく IndexError を引き起こすと常に感じているので、ターミナルを開いてテストしてみましょう:🎜🎜 🎜🎜 rrreee🎜結果は実際には [] ですが、これはリストだけで実行できます。文字列はどうですか。タプルはどうですか?🎜🎜🎜🎜rrreee🎜 結果はリストの結果と似ており、それぞれがを返します。空の結果。🎜🎜IndexError が返されるのではなく、直接 null が返されるのを見て涙を流しました。これについては、構文は似ていますが、根底にあるものは異なるはずだと考えました。これが結果です🎜🎜🎜🎜原理分析🎜🎜🎜🎜🎜それを公開する前に、まず Python がこのスライスをどのように処理するかを理解する必要があります。これを支援するために dis モジュールを使用できます:🎜🎜🎜🎜rrreee🎜 ここで簡単に説明します。 dis モジュールでは、Python がスクリプトを解釈するときにコンパイルプロセスも行われることを、経験豊富なベテランは皆知っています。コンパイルの結果は、よく目にする pyc ファイルです。ここで codeobject object 🎜 はバイトコードで構成されており、dis はこれらのバイトコードをより印象的な方法で表示し、実行プロセスを確認できるようにするものです。以下は出力の説明です。 dis の列: 🎜

🎜 最初の列は、元のソースコードの行番号を示す番号です。 🎜

🎜 2 番目の列はバイトコードのオフセットです。LOAD_CONST は行 0 にあります。以下同様です。 🎜

🎜 3 番目の列は、人間が判読できるバイトコードの名前です。これらはプログラマ向けに用意されています🎜

🎜4番目の列は命令のパラメータを表します🎜

🎜5番目の列は計算された実際のパラメータです🎜🎜

ul> 🎜詳しくは説明しませんが、これは定数を読み取り、

変数を保存するプロセスです🎜。主な違いは、test.py のスライスはバイトコード SLICE+3 を使用して実装されているのに対し、test2.py の単一の添え字値は主にバイトコード BINARY_SUBSCR を使用して実装されているということです。推測したように、同様の構文は完全に異なるコードです。スライス (SLICE+3) については、BINARY_SUBSCR を展開しません。興味のある方は、関連するソースコードを確認して、特定の実装について学ぶことができます。次に、SLICE+ について説明します。 3🎜🎜🎜🎜rrreee🎜上記のコードは少し長いですが、重要な場所はコメントアウトされているので、その場所に注意するだけで済みます。上記のように、 m を実行する必要があることがわかります。最後 ->sq_slice(s, i1, i2) ですが、オブジェクトごとに対応する関数が異なるため、この sq_slice は少し特殊です。対応する関数は次のとおりです。関数の実装はほぼ同じなので、そのうちの 1 つだけを分析する必要があります。以下は、リストのスライス関数の分析です。

上記の sq_slice 関数に対応するスライス関数からわかるように、スライスを使用するときに左と右の添え字がシーケンスの長さよりも大きい場合、それらはシーケンスの長さに再割り当てされるため、最初のスライスは次のようになります。 print a[10:20] , 实际上运行的是: print a4:4 . この分析により、添え字がオブジェクトの長さよりも大きいスライスに遭遇しても混乱することはなくなります~

以上がPython のシーケンススライスの添字問題の詳細な例の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7428

CakePHP チュートリアル

1359

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

Related knowledge

C言語合計の機能は何ですか？ Apr 03, 2025 pm 02:21 PM

C言語に組み込みの合計機能はないため、自分で書く必要があります。合計は、配列を通過して要素を蓄積することで達成できます。ループバージョン：合計は、ループとアレイの長さを使用して計算されます。ポインターバージョン：ポインターを使用してアレイ要素を指し示し、効率的な合計が自己概要ポインターを通じて達成されます。アレイバージョンを動的に割り当てます：[アレイ]を動的に割り当ててメモリを自分で管理し、メモリの漏れを防ぐために割り当てられたメモリが解放されます。

誰がより多くのPythonまたはJavaScriptを支払われますか？ Apr 04, 2025 am 12:09 AM

スキルや業界のニーズに応じて、PythonおよびJavaScript開発者には絶対的な給与はありません。 1. Pythonは、データサイエンスと機械学習でさらに支払われる場合があります。 2。JavaScriptは、フロントエンドとフルスタックの開発に大きな需要があり、その給与もかなりです。 3。影響要因には、経験、地理的位置、会社の規模、特定のスキルが含まれます。

XMLをMP3に変換する方法 Apr 03, 2025 am 09:00 AM

XMLをMP3に変換する手順には、XMLからオーディオデータを抽出します：XMLファイルを解析し、オーディオデータを含むBase64エンコード文字列を見つけ、バイナリ形式にデコードします。オーディオデータをmp3にエンコードします：mp3エンコーダーをインストールし、エンコードパラメーターを設定し、バイナリオーディオデータをmp3形式にエンコードし、ファイルに保存します。

XMLの形式を変更する方法 Apr 03, 2025 am 08:42 AM

XML形式を変更する方法はいくつかあります。Atepadなどのテキストエディターを使用して手動で編集する。 XmlBeautifierなどのオンラインまたはデスクトップXMLフォーマットツールを使用して自動的にフォーマットします。 XSLTなどのXML変換ツールを使用して変換ルールを定義します。または、Pythonなどのプログラミング言語を使用して解析および操作します。元のファイルを変更してバックアップするときは注意してください。

独特の目標は関連していますか？ Apr 03, 2025 pm 10:30 PM

明確で明確なものは区別に関連していますが、それらは異なる方法で使用されます。明確な（形容詞）は、物事自体の独自性を説明し、物事の違いを強調するために使用されます。明確な（動詞）は、区別の動作または能力を表し、差別プロセスを説明するために使用されます。プログラミングでは、個別は、重複排除操作などのコレクション内の要素の独自性を表すためによく使用されます。明確なは、奇数や偶数の偶数を区別するなど、アルゴリズムまたは関数の設計に反映されます。最適化する場合、異なる操作は適切なアルゴリズムとデータ構造を選択する必要がありますが、異なる操作は、論理効率の区別を最適化し、明確で読み取り可能なコードの書き込みに注意を払う必要があります。

XMLを単語に変換する方法 Apr 03, 2025 am 08:15 AM

XMLを単語に変換するには、Microsoft Wordの使用、XMLコンバーターの使用、またはプログラミング言語の使用方法が3つあります。

Cで理解する方法！x？ Apr 03, 2025 pm 02:33 PM

！X理解！Xは、C言語の論理的な非操作者です。 Xの値をブーリングします。つまり、虚偽の真の変化、trueへの誤った変更です。ただし、Cの真実と虚偽はブール型ではなく数値で表されていることに注意してください。非ゼロは真であると見なされ、0のみが偽と見なされます。したがって、！xは正の数と同じ負の数を扱い、真実と見なされます。

C言語ユーザー識別子にはスペースが含まれていますか？ Apr 03, 2025 pm 01:51 PM

C言語識別子は、混乱や維持の困難を引き起こす可能性があるため、スペースを含めることができません。特定のルールは次のとおりです。それらは、文字またはアンダースコアから始めなければなりません。文字、番号、またはアンダースコアを含めることができます。違法な文字（特別なシンボルなど）を含めることはできません。

See all articles

Python のシーケンス スライスの添字問題の詳細な例

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック

Python のシーケンススライスの添字問題の詳細な例