附录:预估部署成本#
关于成本预估的说明
作为一个非营利性的研究项目,Project Jupyter 不提供、不推荐也不销售 JupyterHub 的云部署服务。
本节信息是应用户要求提供的指导。我们提醒您,实际成本可能因所选供应商和您的使用场景而有很大差异。
云服务提供商的成本计算器#
以下是一些云服务提供商的成本估算器链接
影响成本的因素#
成本预估很大程度上取决于您的部署配置。以下是几个显著影响成本预估的因素
为用户提供的计算资源
用户数量
用户的使用模式
计算资源#
内存(RAM)是成本预估中占比最大的部分。更多的内存意味着您的用户可以更灵活地处理更大数据集,但这也可能很昂贵。
如果需要,为用户提供持久化存储是另一个会影响成本预估的因素。如果用户没有持久化存储,那么在用户结束会话后,磁盘数据将被清除。他们所做的任何更改都不会被保存。这样可以显著减少存储资源需求,并加快加载时间。
要了解成本如何随计算资源扩展,请参阅 Google Cloud 定价页面。
用户#
用户数量与成本预估有直接关系。由于一次部署可能需要支持不同类型的用户(例如研究人员、学生、教师),他们有不同的硬件和存储需求,因此需要同时考虑用户类型和每种类型的用户数量。
用户使用模式#
另一个重要因素是您的用户将会有什么样的使用模式。他们会同时使用 JupyterHub 吗,比如在大型课堂研讨会期间?还是用户会在一天中的不同时间使用 JupyterHub?
使用模式和系统峰值负载对您需要提供的资源有重要影响。未来 JupyterHub 将具备自动伸缩功能,但目前还没有。这意味着您需要为某一时刻预期的最大用户数量来配置资源。
示例#
以下是一些描述不同使用场景及特定 JupyterHub 实现所用资源量的示例。这些预估涉及多种因素,您应预料到在其他条件下实际成本可能会有很大差异。
Data 8#
加州大学伯克利分校的 Data 8 课程使用 JupyterHub 来协调所有课程材料,并提供一个平台供学生运行代码。这涉及到成百上千名学生,他们对 CPU 和内存使用的要求都非常低。Ryan Lovett 编写了一个简短的 Jupyter notebook 来预估根据学生需求所需的计算资源成本。