(bwin官网) Python如何将文本每隔N行取一条放到一个新的文本文件中?
bwin官网
bwin官网
当前位置 : bwin官网 > bwin官网

(bwin官网) Python如何将文本每隔N行取一条放到一个新的文本文件中?

我现在有一个行数很多的数据集,需要用这些数据集做分类算法,数据实在太多需要采样
数据集部分如下:

比如说我想每取10行放到一个新的文件中,就是取这个数据集的第1行,第11行,第21行。。。直到文本最后,放到一个新的文件中,用Python如何实现呢?

希望的结果如下:

with openfile.txt as reader, opennewfile.txt, w as writer:
    for index, line in enumeratereader:
        if index % 10 == 0:
            writer.writeline        

一行行读,读一行行号加一。如果行号对n取余等于1。将这行写入新文件

# 先得知道文件有多少行,linux下 `wc -l filename`,或者
line_count = sum1 for i in openfilename
# 然后pandas
pd.read_csvfilename, skiprows=i for i in rangeline_count if i % 9 == 0

# 如果文件不大,可以一次性读入内存 
pd.read_csvfilename[::10]

栏目列表

广告位

bwin官网