九天毕昇训练yoloV5,50小时免费的v100
前言
最近尝试了一下移动的免费云服务器,新用户可以免费用50个小时的v100,分享一下使用过程
具体的yolov5训练可以先看别的帖子
【Yolov5】1.认真总结6000字Yolov5保姆级教程(2022.06.28全新版本v6.1)
二、使用步骤
1.注册与登陆
进入网站直接注册就好了,网址如下:
(验证码发的可能有点慢。。。)
2.新建实例
进入控制台,在模型训练里新建实例
然后是上传代码和数据集,建议直接把自己本地的代码和数据集压缩然后上传。
点击新建数据然后找到电脑中的文件上传就好 (上传过程中最好保持在这个界面,否则会中断)
运行这个实例,服务器提供了两种编辑器,建议用jupyter,
打开jupyter后,可以使用terminal进行编辑
新建一个terminal,需要把刚刚上传的压缩包解压,压缩包在 data/user/ 文件夹下,该文件夹没有读写功能,但我们可以把压缩包解压到外面
(这里我的数据集名为zc,压缩包名为mydata,请对应修改)
cd data/user/zc #进入目录
unzip mydata.zip -d /root #解压到root文件夹下
cd #退出目录
到这里文件就已经配置好了,如下图,我上传的是yolov5的项目文件
除此之外,还可以通过上传按钮直接上传文件,这个过程也是消耗豆子的,上传大文件最好不要用
3.配置环境
进入yolov5的文件夹
cd yolov5-6.1
运行 pip install -r requirements.txt ,默认从aliyun下载,我下的时候非常慢,最后使用conda一个个安装的
其中pytorch最好使用官网的安装,因为不确定安装的是不是gpu版本。我安装的cuda10.2最新版本,可以跑通
conda install pytorch torchvision torchaudio cudatoolkit=10.2 -c pytorch
4.训练
环境配置好以后就可以训练了,首先,确保你的各个路径没有错,
!!!重点注意cfg、data和图片的路径,建议全都用相对路径
然后使用python运行train.py
python train.py
(启动比较慢,这个好像所有机器都一样),我的数据集有896张图片,自己的显卡1050训练一次要100s左右,用这个服务器5s一次
总结
凑合能用,邀请别人还能拿豆子加时长,毕竟免费的还要啥自行车啊
ps:今天上线的时候发现不让我用v100了,说是资源不够