データを読み取ることで作業が容易になります。Python でデータを読み取る一般的な方法はたくさんあります。では、Python はどのようにデータを読み取るのでしょうか?
パンダの read_csv モジュールを使用して、データを直接読み取ります。 (推奨される学習: Python ビデオ チュートリアル )
data = pd.read_csv('/home/nw/Desktop/dataset/iris.txt',header = None)
上記のコードでは、read_csv の最初の部分はデータ セットが保存されているパスです。次のヘッダーは非常に重要ですヘッダーが欠落しているとよく思いますが、欠落したデータ行が DataFrame の列インデックスになるため、総データ量が 1 減ります。
もっと伝統的な方法として、open で直接ファイルを開いて、ファイル内の情報を取り出してみるという方法もあります。抽出した変数を処理するだけです。
f= open('/home/nw/Desktop/dataset/iris.txt','rb') dataset = pickle.load(f) #这种方法适用于自己存取自己的数据,有时候在读取别人的数据的时候是不行的,因为别人存数据的方式不一定是用pickle.dump的方 ##式存数据的。 f = open('/home/nw/Desktop/dataset/iris.txt') ''' 注意这里的open后面最好不要加上其他的读取方式,不需要‘rb’之类的读取方式。因为在后续的数据处理中可能还需要将二进制的数 据转换成自己想要的个数。 ''' lines = f.readlines() ''' 现在lines中已经包含了所有的数据信息,我们想要得到的数据格式都可以基于lines做处理。如我读出的iris数据格式是一个列表的形 式,使用len(lines)得到列表中元素的个数是151,打印出lines,可以看到lines中每个元素都是一个字符串,并且每个字符串后面都 有'\n'的换行字符,最后一行是空行,所以最后一行是多余,并且要去掉每行中的'\n' ''' arr = [] for i in range(len(lines)): if lines[i] != '\n': arr.append(lines[i]) for i in range(len(arr)): arr[i] = arr[i].strip('\n')#将每行的'\n'脱去
Python 関連の技術記事の詳細については、Python チュートリアル 列にアクセスして学習してください。
以上がPythonでデータを読み取る方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。