问题关键是泰勒公式和泰勒级数的区别。在x0处使用泰勒公式是x0处附近近似替代,误差由泰勒展开余项来估计。在大范围完全替代其实是泰勒级数的收敛问题,用的是泰勒级数有收敛域,在收敛域上,函数可以被泰勒级数替代。