51问答网 > Python实现协同过滤推荐算法，用的大一些的数据集就报错MemoryError

Python实现协同过滤推荐算法，用的大一些的数据集就报错MemoryError

2025-03-20 07:05:26

推荐回答（1个）

回答1：

1.
python虽然易用，但是内存占用比较多；所以如果你有C/C++/Java基础，考虑用这些语言来实现；
2.
CF算法需要计算大量的相似度，如果能把中间结果存起来，或者简化计算过程（如，你可能会重复计算一个item的均值）可以省下不少内存；（个人试过计算1w个用户Pearson是没问题的）
3.
如果内存实在不够用，那就用时间换空间，把中间计算结果分成小文件存到磁盘上，用的时候再读取。
供参考。