Python实现协同过滤推荐算法,用的大一些的数据集就报错MemoryError

2025-03-20 07:05:26
推荐回答(1个)
回答1:

1.
python虽然易用,但是内存占用比较多;所以如果你有C/C++/Java基础,考虑用这些语言来实现;
2.
CF算法需要计算大量的相似度,如果能把中间结果存起来,或者简化计算过程(如,你可能会重复计算一个item的均值)可以省下不少内存;(个人试过计算1w个用户Pearson是没问题的)
3.
如果内存实在不够用,那就用时间换空间,把中间计算结果分成小文件存到磁盘上,用的时候再读取。
供参考。