当你把整个文件打开的时候说明文件已经被load到内存里了。所以请检查你的内存是否够大,或者虚拟内存太小。 按理来说T10I4D100K.dat是很小的一个文件,虽然有10W行,但宽度很小啊。 建议你把虚拟内存调大一点,关闭其他占用大量内存的程序,例如IE,等等。 再么就是看看你的程序是否设计合理。这点儿数据根本不能算做大数据集。 over!
去网上找数据集 http://archive.ics.uci.edu/ml/ 经典UCI